14萬中國人大數(shù)據(jù)揭示基因南北差異:南方人免疫力強(qiáng)?
編輯:黃榮 信息來源: 西e網(wǎng)-新浪網(wǎng)發(fā)布時(shí)間:2018-10-26
在中國,南方人與北方人在飲食、生活習(xí)慣等方面都有很大的不同。例如,一個(gè)典型的差別是:北方人愛吃肉,而南方人偏愛蔬菜。究竟是什么機(jī)制導(dǎo)致了這樣的差異?一項(xiàng)涵蓋了14萬中國人的基因組學(xué)大數(shù)據(jù)研究發(fā)現(xiàn),這種不同飲食習(xí)慣背后有其特殊的基因規(guī)律:在一個(gè)影響動(dòng)物脂肪代謝的基因上,促脂肪代謝的等位基因在蔬菜缺乏的北方省份明顯富集。除此之外,這項(xiàng)研究還揭示了更多中國人群的基因特征。
這項(xiàng)研究成果近期發(fā)表在《細(xì)胞》(Cell)雜志上。除了上述飲食習(xí)慣的差異,研究還得出了大量有趣的結(jié)論。這支由中國科學(xué)家領(lǐng)導(dǎo)的合作團(tuán)隊(duì),在對超過14萬中國人的無創(chuàng)產(chǎn)前基因檢測數(shù)據(jù)進(jìn)行深入研究后,首次揭秘了中國人群獨(dú)特的基因遺傳特征、南北方人群的遺傳差異,甚至還發(fā)現(xiàn)了與生育雙胞胎顯著相關(guān)的基因位點(diǎn)。
自人類基因組計(jì)劃完成以來,越來越多的基因組計(jì)劃被提上日程,比如英國針對癌癥和罕見病患者的10萬人基因組計(jì)劃、英國50萬人生物樣本庫,這對于了解特定人群的基因遺傳特點(diǎn)、實(shí)現(xiàn)疾病的精準(zhǔn)診治都大有幫助。然而,在這項(xiàng)最新研究之前,公開數(shù)據(jù)庫中僅包含來自千人基因組計(jì)劃的301位中國人的基因組數(shù)據(jù),這遠(yuǎn)遠(yuǎn)不能代表14億中國人群的遺傳背景。
“最近,英國的國家基因組計(jì)劃又一次升級,宣布未來5年要做500萬人的基因組,”華大生命科學(xué)研究院母嬰研究所副所長、論文共同通訊作者金鑫說,“其其它國家的進(jìn)展很快,但中國還停留在300個(gè)人,我們希望快速追趕,在已有數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)突破。”
南北差異的遺傳因素
此次研究的基因數(shù)據(jù)來自141431名孕婦,涵蓋了31個(gè)省份、37個(gè)民族。
在數(shù)據(jù)分析中,研究人員發(fā)現(xiàn)6個(gè)在緯度上受到強(qiáng)烈自然選擇的基因,也就是說這6個(gè)基因在南北方人群中存在遺傳差異。其中三個(gè)與人體的免疫反應(yīng)有關(guān),一個(gè)與動(dòng)物脂肪代謝有關(guān)。
“在人類演化中,免疫方面的基因很容易受自然選擇影響。”金鑫說,如果免疫相關(guān)的功能不能提升或者不適應(yīng)當(dāng)?shù)氐沫h(huán)境,人就沒有辦法生存下去。從歷史上看,南方與北方的自然環(huán)境差別很大,所以在免疫層面上就會存在差異,并且反應(yīng)在與免疫有關(guān)的基因上。此前有媒體報(bào)道稱,這說明南方人的免疫力更強(qiáng),金鑫對此解釋說:“其實(shí)也不一定,應(yīng)該說南方人對于南方環(huán)境的適應(yīng)更佳,并在基因上留下了印記。”金鑫說:“‘船到郴州止,馬到郴州死,人到郴州打擺子’的古話,說的就是古時(shí)候北方人很難適應(yīng)南方的環(huán)境。”
針對某些特殊的疾病,南方人確實(shí)比北方人具有更強(qiáng)的免疫力,但是這卻可能增加患其它疾病的概率,以達(dá)到一種平衡。“瘧疾曾經(jīng)在中國南方肆虐,南方人群為了適應(yīng)環(huán)境在基因?qū)用姘l(fā)生了一些變化,使得南方人群更能夠抵抗瘧疾,”金鑫舉例說,“但是反過來它也帶來了一個(gè)副作用,突變的基因會導(dǎo)致地中海貧血或其他血紅蛋白病,比如導(dǎo)致‘蠶豆病’的突變基因G6PD在南方人群中頻率明顯高于北方。所以我們可以看到在中國南方人群中,血紅蛋白病發(fā)生的比較多。”也就是說,中國南方人群在提高抵抗瘧疾能力的同時(shí)也付出了代價(jià)。
在動(dòng)物脂肪代謝方面,研究者發(fā)現(xiàn)C型促脂肪代謝等位基因在北方明顯富集,尤其在蔬菜供應(yīng)比較缺乏的省份。這一等位基因可以更好地促進(jìn)動(dòng)物脂肪的代謝,此前這一等位基因已經(jīng)被確認(rèn)在南亞、歐洲、非洲人群中比較多,“這個(gè)基因在其它人群中已經(jīng)有過報(bào)道,”金鑫說,“但這次是第一次在中國人群中發(fā)現(xiàn)南北差異。”這與南北方的飲食習(xí)慣和當(dāng)?shù)啬軌颢@取的食物有關(guān)系。北方人愛吃肉,也有能力消化肉食不是沒有原因的。
從基因分析中,還可以看到人口的遷移規(guī)律在基因上留下的痕跡。比如,研究人員發(fā)現(xiàn)與北京的漢族人親緣關(guān)系最近的不是北京人,而是更接近沿海省份的人口:山東、浙江、江蘇、福建以及江西,這可能反映了人口向北京遷移的過程。
所有南方省份與南部沿海省份的親緣關(guān)系更接近,而北部省份則與北部沿海省份關(guān)系密切。研究者認(rèn)為這一觀察結(jié)果可能反映了自1949年以來政府組織的內(nèi)部移民事件以及自1979年以來中國從內(nèi)陸到沿海地區(qū)的勞動(dòng)力轉(zhuǎn)移。
“所以我們今天看到的基因分析結(jié)果都跟中國人祖先的遷徙和演化有關(guān)系,從數(shù)據(jù)中看到的其實(shí)是歷史上我們先輩遷徙和與自然抗?fàn)幍幕蛴涗洝?rdquo;金鑫說。
雙胞胎基因
由于此次研究的樣本全部來源于孕婦,因此不僅可以研究中國一般人群的基因情況,也是研究與孕產(chǎn)相關(guān)基因的好機(jī)會。
研究人員對兩個(gè)與孕產(chǎn)有關(guān)的表型進(jìn)行了研究,分別為懷孕年齡和多胎懷孕。他們發(fā)現(xiàn)了兩個(gè)與懷孕年齡顯著相關(guān)的基因位點(diǎn),這兩個(gè)位點(diǎn)的突變與生育力等因素密切相關(guān)。
另外,研究人員還發(fā)現(xiàn)了一個(gè)與懷雙胞胎顯著相關(guān)的基因突變位點(diǎn),這一突變在懷有雙胞胎的母親中比較常見。也就是說攜帶NRG1基因的突變,有高更的幾率懷上雙胞胎。“此前人們在小鼠模型中研究過這個(gè)基因,發(fā)現(xiàn)其突變與小鼠產(chǎn)仔數(shù)量有關(guān)系。”金鑫說。敲除這一基因會導(dǎo)致小鼠的產(chǎn)仔數(shù)減少。當(dāng)然,攜帶這一基因會增加懷雙胞胎的幾率,但并不意味著一定會生下雙胞胎。
中國人的百萬基因組計(jì)劃
全世界已經(jīng)有超過1000萬人進(jìn)行過無創(chuàng)產(chǎn)前基因檢測,其中中國就有700~800萬。無創(chuàng)產(chǎn)前基因檢測采集孕婦的靜脈血,對母體外周血漿中的游離基因片段進(jìn)行測序,對胎兒染色體非正倍體進(jìn)行篩查。人們比較熟知的是,這種方法可以比較準(zhǔn)確地檢測唐氏綜合征。
通過這一檢測積累的大量中國人基因數(shù)據(jù),是一個(gè)巨大的基因?qū)殠臁?ldquo;我們認(rèn)為,未來科研領(lǐng)域的大數(shù)據(jù),一定不只是來源于假說驅(qū)動(dòng)的有限的科研項(xiàng)目。大量的數(shù)據(jù)一定是來源于數(shù)據(jù)驅(qū)動(dòng)的真實(shí)的應(yīng)用場景,”金鑫說,“在臨床的場景或者健康的場景下,產(chǎn)生的數(shù)據(jù),如何在保障個(gè)人隱私和數(shù)據(jù)安全的基礎(chǔ)上,合理合規(guī)有效率地用于科學(xué)研究,這對全人類來說都是非常重要的事情。”
所以,當(dāng)研究人員看到全球人群基因組飛速發(fā)展,尤其英國已經(jīng)完成了10萬、50萬,正在邁向500萬人,而中國還停留在300人時(shí),他們想到的追趕方式,就是利用已經(jīng)在臨床場景中產(chǎn)生的大量數(shù)據(jù)。此次使用的樣本量是14萬人,幾乎相當(dāng)于中國人口的萬分之一,是一個(gè)頗具代表性的大樣本量。
然而,由于這些數(shù)據(jù)原本只是滿足臨床所需,單個(gè)樣本檢測的基因組數(shù)據(jù)量比較少。據(jù)金鑫介紹,產(chǎn)前基因檢測獲得的個(gè)體基因組數(shù)據(jù),還不到整個(gè)基因組的10%。“一般進(jìn)行全基因組檢測,會產(chǎn)生100G以上的數(shù)據(jù)量,但我們的數(shù)據(jù)只有幾百兆。”這意味著,對于個(gè)人而言,全基因組測序數(shù)據(jù)量是無創(chuàng)產(chǎn)前基因檢測數(shù)據(jù)量的上千倍。“所以,這個(gè)歷時(shí)兩年的研究項(xiàng)目,大部分的攻關(guān)都花在如何在少量的數(shù)據(jù)下,也能夠體現(xiàn)整個(gè)人群的特征,”金鑫說,“我覺得這可能也是大數(shù)據(jù)的魅力,就是當(dāng)所有樣本放在一起分析的時(shí)候,缺失的部分可以互相彌補(bǔ)。”
未來,金鑫與他的團(tuán)隊(duì)還有更大的計(jì)劃,他們預(yù)計(jì)在未來3年內(nèi),將中國人群樣本量擴(kuò)大到100萬人。這又將是一個(gè)艱辛的過程,他們還將面對大量需要細(xì)致耐心的數(shù)據(jù)整理工作,以及呈指數(shù)級增長的計(jì)算量。
熱門資訊