撰文丨王聰
編輯丨王多魚
排版丨水成文
泛基因組(Pangenome)正在徹底改變我們解析具有復(fù)雜變異的基因組區(qū)域的能力。然而,現(xiàn)有的人類泛基因組由于樣本量小,對于醫(yī)學(xué)和群體遺傳學(xué)應(yīng)用的效用有限。
2026 年 4 月 1 日,西湖大學(xué)楊劍教授團(tuán)隊(duì)(博士研究生王逸飛、助理研究員段忠取博士為論文共同第一作者)聯(lián)合溫州醫(yī)科大學(xué)沈賢教授,在國際頂尖學(xué)術(shù)期刊Nature上發(fā)表了題為:The 1000 Chinese Pangenome empowers medical and population genetics 的研究論文。
研究團(tuán)隊(duì)創(chuàng)新性地開發(fā)了基于泛基因組的聯(lián)合組裝(PIGA)方法,成功構(gòu)建了千人泛基因組(1000 Chinese Pangenome,1KCP),極大突破了既往泛基因組樣本量的上限,這也是迄今為止規(guī)模最大、最全面的人類泛基因組資源庫,從中發(fā)現(xiàn)了4.053 億個堿基對的全新序列,這些占據(jù)人類基因組13%的序列是以前從未被記錄過的“基因新大陸”,且其中2620 萬個堿基對具有明確的功能,涉及基因編碼區(qū)和調(diào)控元件。
這項(xiàng)研究提升了我們對復(fù)雜遺傳變異及其功能的認(rèn)知,為人類健康研究和疾病精準(zhǔn)診斷提供了堅(jiān)實(shí)的基礎(chǔ)。
![]()
什么是“泛基因組”?
如果把每個人的基因組比作一本由 30 億個字母(堿基對)寫成的生命之書,那么傳統(tǒng)的人類參考基因組就像是這本書的“標(biāo)準(zhǔn)版”。但問題是,這個“標(biāo)準(zhǔn)版”主要基于歐洲白人的基因組數(shù)據(jù)構(gòu)建,無法完全代表全球不同人群的遺傳多樣性。
泛基因組(Pangenome)則不同——它不是單一版本,而是一個群體中所有基因組序列的集合,包含了該群體中存在的所有遺傳變異,泛基因組能夠更全面地反映人類基因組的真實(shí)面貌。
為什么需要中國人群的泛基因組?
長期以來,人類基因組研究嚴(yán)重依賴基于歐洲人群的參考基因組。即便是最新的“人類泛基因組參考聯(lián)盟(HPRC)”項(xiàng)目,在其收集的全球 46 個樣本中也僅包含 3 個中國人樣本,無法代表 14 億中國人的遺傳多樣性。
這種依賴導(dǎo)致了一個嚴(yán)重問題:東亞人群特有的罕見遺傳變異往往被遺漏或誤判,直接影響疾病診斷的準(zhǔn)確性和藥物研發(fā)的針對性。
中國擁有世界上最豐富的人群遺傳多樣性——從西南高原的藏緬語系族群,到西北絲綢之路的多元交融,從云貴地區(qū)的苗瑤語族,到北方草原的蒙古語族……這種多樣性是理解人類演化、疾病易感性和藥物反應(yīng)差異的寶貴資源。
這項(xiàng)研究的新發(fā)現(xiàn)
1、規(guī)模空前:1116 個高質(zhì)量基因組
研究團(tuán)隊(duì)構(gòu)建了1116個中國人群的二倍體基因組組裝,其中包括 55 個從頭組裝和 1061 個基于泛基因組指導(dǎo)的組裝。這是目前全球最大規(guī)模的中國人群基因組資源庫。
2、發(fā)現(xiàn)“新大陸”:4 億個新序列
相比現(xiàn)有的國際參考基因組(GRCh38 和 CHM13),1KCP 泛基因組中發(fā)現(xiàn)了4.053 億個堿基對的全新序列,這些占據(jù)人類基因組13%的序列是以前從未被記錄過的“基因新大陸”。更令人振奮的是,其中 2620 萬個堿基對具有明確的功能,涉及基因編碼區(qū)和調(diào)控元件。這意味著我們發(fā)現(xiàn)了大量可能影響中國人健康和疾病的新遺傳元件。
3、全面解析遺傳變異“全家福”
該研究系統(tǒng)鑒定了 3540 萬個小變異、11 萬多個結(jié)構(gòu)變異、48.5 萬個串聯(lián)重復(fù)序列,以及 86 萬個“嵌套變異”(隱藏在復(fù)雜結(jié)構(gòu)變異中的次級變異)。特別值得關(guān)注的是,33.3% 的結(jié)構(gòu)變異是首次被發(fā)現(xiàn),其中 83.5% 屬于罕見變異(在人群中頻率 ≤1%)。這些罕見變異往往與遺傳性疾病密切相關(guān),但在小樣本研究中極易被遺漏。
4、醫(yī)學(xué)應(yīng)用的直接證據(jù)
研究團(tuán)隊(duì)深入分析了這些變異與疾病的關(guān)系:
基因結(jié)構(gòu)變異:發(fā)現(xiàn)了 5239 個直接影響蛋白質(zhì)編碼基因外顯子的結(jié)構(gòu)變異,平均每個中國人攜帶 450 個這樣的變異,其中 9 個是罕見變異。
串聯(lián)重復(fù)擴(kuò)增:鑒定出 2427 個串聯(lián)重復(fù)擴(kuò)增事件,這些與多種神經(jīng)退行性疾病(例如亨廷頓病、小腦性共濟(jì)失調(diào)等)密切相關(guān)。
基因簇多樣性:發(fā)現(xiàn)了 735 個存在結(jié)構(gòu)變異的基因簇,這些基因簇在血液和免疫相關(guān)功能中顯著富集,反映了人類適應(yīng)不同病原體的進(jìn)化歷程。
![]()
基于泛基因組的聯(lián)合組裝流程
從“跟跑”到“領(lǐng)跑”的歷史性跨越
20 年前,中國在人類基因組計(jì)劃中只承擔(dān)了 1% 的測序任務(wù)。今天,中國科學(xué)家 100% 獨(dú)立完成了這項(xiàng)里程碑研究。
這項(xiàng)成果不僅打破了 20 年來人類泛基因組領(lǐng)域國外的“壟斷”地位,更實(shí)現(xiàn)了我國在該領(lǐng)域從“跟跑”到“并跑”,甚至“領(lǐng)跑”的轉(zhuǎn)變。
1KCP 項(xiàng)目的意義遠(yuǎn)不止于發(fā)表學(xué)術(shù)論文:
1、填補(bǔ)精準(zhǔn)醫(yī)學(xué)空白:為中國人群的疾病風(fēng)險預(yù)測、藥物基因組學(xué)和個性化治療提供了專屬的遺傳參考框架。
2、提升診斷準(zhǔn)確性:罕見遺傳病的診斷將更加精準(zhǔn),避免因參考基因組不匹配導(dǎo)致的誤診漏診。
3、加速新藥研發(fā):基于中國人群特異的遺傳變異,可以開發(fā)更適合中國人的靶向藥物。
4、開放數(shù)據(jù)平臺:研究團(tuán)隊(duì)建立了 1KCP 數(shù)據(jù)門戶,推動相關(guān)研究的發(fā)展。
論文鏈接:
https://www.nature.com/articles/s41586-026-10315-y
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.