現(xiàn)代人類(lèi)起源于非洲,相比于其他大陸,現(xiàn)代人類(lèi)在非洲居住時(shí)間最長(zhǎng),并且在遷徙,融合和對(duì)環(huán)境適應(yīng)性進(jìn)化過(guò)程中形成了超過(guò)3000個(gè)民族和2100種語(yǔ)言。目前非洲人群不僅具有世界上最豐富的遺傳多樣性和表型多樣性,且現(xiàn)代人類(lèi)近1/3的語(yǔ)言都在非洲。
然而,目前的遺傳學(xué)和基因組學(xué)研究中,只有不到3%的樣本來(lái)自非洲。研究非洲人群遺傳多樣性,不僅能加深我們對(duì)現(xiàn)代人類(lèi)起源、早期遺傳結(jié)構(gòu)及適應(yīng)性進(jìn)化的理解,也為健康和診斷研究提供豐富的新遺傳信息。
復(fù)旦大學(xué)與賓夕法尼亞大學(xué)一支國(guó)際科學(xué)團(tuán)隊(duì)歷時(shí)7年,對(duì)極具代表性的12個(gè)非洲群體進(jìn)行全基因組測(cè)序分析,揭示了非洲人群的復(fù)雜演化歷程與對(duì)環(huán)境的適應(yīng)性進(jìn)化。3月3日,相關(guān)研究以封面文章形式在線(xiàn)發(fā)表于《細(xì)胞》,文章題目為Whole-genome sequencing reveals a complex African population demographic history and signatures of local adaptation。
基于人類(lèi)參考基因組,研究人員發(fā)現(xiàn)3200萬(wàn)個(gè)單核苷酸多態(tài)性位點(diǎn)(SNP),其中約530萬(wàn)個(gè)位點(diǎn)是在之前沒(méi)有發(fā)現(xiàn)的。這些新發(fā)現(xiàn)的突變廣泛的存在于增強(qiáng)子、啟動(dòng)子以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)等基因組功能區(qū)域。
研究發(fā)現(xiàn),12個(gè)非洲民族(這些民族地理分布廣泛,以種植農(nóng)業(yè)、打獵收集和游牧等不同方式為生,且涵蓋非洲四個(gè)主要的語(yǔ)系)的平均SNP個(gè)數(shù)和遺傳多態(tài)性(遺傳多樣性)均具有顯著的差異。以打獵和收集為生的桑人和熱帶雨林小矮人的SNP數(shù)量和遺傳多態(tài)性最高,而另一些等民族的遺傳多態(tài)性則最低。
“大量非洲外人群的基因滲入,以及嚴(yán)重的群體瓶頸是造成部分非洲人群體遺傳多態(tài)性低的主要原因?!痹撜撐牡谝蛔髡?、復(fù)旦大學(xué)生命科學(xué)學(xué)院和人類(lèi)表型組研究院研究員樊少華說(shuō),“例如,生活在坦桑尼亞的Hadza和埃塞俄比亞的Chabu群體,人口數(shù)量已經(jīng)少于1000人?!?/span>
研究中,科學(xué)家利用鄰近距離法對(duì)本研究中的12個(gè)民族,和來(lái)自“千人基因組計(jì)劃”的歐洲人群(CEU)、北方漢族人群(CHB)、托斯卡納人群(TSI)以及來(lái)自“西蒙斯基因組多態(tài)性研究計(jì)劃”中的巴布亞人群(Papuan)進(jìn)行了系統(tǒng)計(jì)劃分析,結(jié)果顯示現(xiàn)代桑人的遺傳學(xué)祖先是現(xiàn)代人類(lèi)最早發(fā)生分歧的一支,隨后發(fā)生分歧的是熱帶雨林小矮人的祖先?,F(xiàn)代桑人和小矮人祖先的早期分歧的現(xiàn)象也被主成分分析(PCA)和ADMIXTURE(種群結(jié)構(gòu)分析)所支持。
研究發(fā)現(xiàn),不同民族在系統(tǒng)進(jìn)化樹(shù)的聚類(lèi)模式與他們目前所處的地理環(huán)境顯著相關(guān),這說(shuō)明地理環(huán)境是制約不同民族間基因交流的重要因素。
當(dāng)然,由于存在基因交流和遺傳重組等因素的影響,上述鄰近距離法、主成分分析和ADMIXTURE無(wú)法用來(lái)構(gòu)建現(xiàn)代人類(lèi)早期遺傳結(jié)構(gòu)。而當(dāng)科學(xué)家將這些因素全部納入到復(fù)雜模型中進(jìn)行計(jì)算分析時(shí)卻進(jìn)一步發(fā)現(xiàn):現(xiàn)代桑人和小矮人的共同祖先,而不是現(xiàn)代桑人的祖先,是現(xiàn)代人類(lèi)最早分歧的一支。且由此可以推斷,現(xiàn)代人類(lèi)的分歧發(fā)生在28萬(wàn)年前,這與之前的考古和基于古DNA檢測(cè)推斷的時(shí)間一致。
同時(shí),科學(xué)家們利用PCA和ADMIXTURE分析,在坦桑尼亞目前使用Kheosan語(yǔ)的兩個(gè)族群基因組中,發(fā)現(xiàn)了桑人相關(guān)的祖源成分。雖然僅有南部非洲的桑人以及東非坦桑尼亞的族群說(shuō)這種語(yǔ)言,但本項(xiàng)研究利用PCA分析,將全球之前已發(fā)表的來(lái)自不同地區(qū)的55個(gè)古非洲人樣本投射到現(xiàn)代非洲人樣本中后發(fā)現(xiàn),大量的來(lái)自不同地區(qū)的古非洲人樣本投射位于桑人和東非的這兩個(gè)人群之間。
該結(jié)果提示,Khoesan語(yǔ)系在非洲的地域分布曾經(jīng)很廣,遍及整個(gè)非洲, 但可能受到班圖大遷徙的影響,目前說(shuō)Koesan語(yǔ)的古非洲人群大都滅絕了。
研究中,科學(xué)家結(jié)合正選擇分析算法、功能基因組學(xué)手段及大規(guī)模全基因組關(guān)聯(lián)分析,對(duì)12個(gè)非洲民族特異的適應(yīng)性進(jìn)化進(jìn)行研究,全面繪制了非洲人群適應(yīng)性進(jìn)化圖譜。
膚色多樣性是現(xiàn)代人類(lèi)對(duì)于不同維度地區(qū)適應(yīng)性進(jìn)化的一個(gè)重要標(biāo)志。桑人是非洲人群中膚色最淺的民族,但是研究對(duì)于桑人淺膚色的遺傳學(xué)基礎(chǔ)仍然缺乏了解。
利用功能基因組學(xué)等方法,本研究發(fā)現(xiàn)一個(gè)基因內(nèi)部增強(qiáng)子的突變(rs77665059-C)是影響桑人淺膚色的決定性因素。該增強(qiáng)子僅在黑色素細(xì)胞中特異活躍,如果沉默該增強(qiáng)子會(huì)降低該基因表達(dá)量和黑色素和合成。進(jìn)一步研究發(fā)現(xiàn),rs77665059-C在桑人部分人群中頻率超過(guò)了80%;但是在其它非洲(平均頻率14%)和非洲外民族中(平均頻率3%)頻率卻非常低。研究人員發(fā)現(xiàn),rs77665059-C突變導(dǎo)致該基因增強(qiáng)子在黑色素瘤細(xì)胞系中活性降低,由此與桑人的淺膚色表型顯著相關(guān),這為桑人淺膚色進(jìn)化研究提出了新的遺傳學(xué)解釋。