无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

【前沿&進展】Nucleic Acids Research|從基因組序列中快速準確識別病毒重配事件:VReassort

0
分享至

近日,香港城市大學孫燕妮團隊開發了一款基于深度學習的新工具VReassort。該工具能夠直接從分段病毒基因組(比如流感病毒)序列中高效、準確地識別新出現的重配(reassortment)事件。相關研究以題為“Fast and Accurate Identification of Emerging Viral Reassortment from Genome Sequences”, 發表于Nucleic Acids Research雜志。


簡介

流感病毒、輪狀病毒等分節段病毒的基因組由多個片段組成。這種結構使它們能夠通過重配(reassortment)產生新的毒株:當不同毒株同時感染同一個宿主細胞時,來自不同親本的基因片段可能被重新包裝進同一個病毒顆粒中,從而形成具有全新基因組合的后代病毒。

這種重配機制會顯著提高病毒的遺傳多樣性,并可能賦予病毒新的生物學特性,例如更強的傳播能力、更高的毒力,甚至跨物種傳播能力。歷史上多次流感大流行都與重配病毒的出現有關。例如,2009 年甲型 H1N1 流感大流行,就是多來源流感病毒基因片段重配的結果。因此,及時識別新出現的重配毒株,對于傳染病監測、風險預警和疫情防控具有重要意義。

隨著 NCBI、GISAID 等數據庫中病毒全基因組數據的大量積累,利用測序數據自動識別重配事件成為可能。然而,已有方法通常存在兩個核心問題:一是計算成本高,難以擴展到大規模數據;二是在系統發育樹存在噪聲時,難以準確區分真正的重配信號與背景擾動。針對這些問題,孫燕妮團隊提出了一個新的工具 VReassort。該方法結合系統發育樹特征提取與深度學習模型,能夠從基因組序列中快速、準確地識別新重配的毒株。論文結果表明,VReassort 在模擬數據和真實數據上都表現出較強的準確性與魯棒性,并且實現了在大規模數據快速分析,例如在大約2分鐘內完成將近1000株流感病毒基因組片段重配分析。

方法

VReassort 的核心思路是:通過比較同一毒株在不同基因片段系統發育樹中的位置是否一致,判斷其是否發生了重配。之所以能夠這樣判斷,是因為重配病毒的不同基因片段往往來自不同親本,因此同一毒株在不同片段樹上的進化位置可能并不一致。如果這種差異足夠明顯,就提示該毒株可能經歷了重配。

傳統方法通常直接比較不同片段系統發育樹之間的整體差異,但這種做法容易受到建樹噪聲、數據質量和序列長度等因素影響,而且在大規模數據中計算成本較高。相比之下,VReassort 更關注的是:某一個毒株在兩棵樹中的相對位置關系是否發生異常變化。這一思路更貼近重配識別的實際需求,但也帶來新的挑戰——因為類似的位置變化并不一定都由重配引起,也可能來自系統發育噪聲或建樹誤差。因此,如何自動區分真正的重配信號與背景擾動,是這一問題的關鍵。

VReassort的核心流程分為三步:先分別構建兩個基因片段的系統發育樹;再提取每個毒株在兩棵樹中的遺傳距離和拓撲特征;最后輸入深度學習模型進行打分。得分越高,說明毒株在兩棵樹中的位置差異越大,也就越可能發生過重配。

為了訓練模型,作者還構建了模擬數據。由于真實數據庫中通常缺少明確的重配標簽,難以直接用于監督學習,研究者通過在系統發育樹上移動部分分支來模擬重配造成的拓撲變化,并據此生成訓練樣本。這樣既保留了真實分析中的復雜性,也為模型提供了較可靠的訓練標簽。


圖中展示了重配模擬數據的生成和系統發育樹的特征提取。

結果

論文從模擬數據和真實數據兩個層面系統驗證了 VReassort 的性能,并重點考察了其在多種復雜場景下的表現,包括:不同親本相似度條件下的識別能力、多重重配事件并存時的穩定性、數據規模擴大時的可擴展性,以及對大規模重配分支的檢測能力。

總體來看,VReassort 在上述實驗中均表現出較好的性能:不僅能夠較準確地識別重配事件,還能在復雜數據條件下保持較好的穩定性和適應性,整體效果優于對比方法。在多種模擬與真實數據集上,其 F1-score 平均達到 0.8 以上,如下圖所示。


圖中給出了模擬數據中4,553 株重配毒株260,747 株非重配毒株(約1:57)在不同評分閾值設置下VReassort的平均檢測性能。


圖中比較了多個工具在不同重配距離和不同重配數量條件下模擬數據上的重配識別表現。

除了方法驗證,論文還將 VReassort 應用于更大規模的真實病毒監測分析,展示了其在病毒進化研究和公共衛生監測中的實際價值。

甲型流感病毒中的應用:作者下載了 2010—2023 年 NCBI 中的甲型流感病毒完整基因組數據,過濾后保留 8,829 個基因組。隨后利用滑動三年時間窗口進行分析,最終對 2012—2022 年間的 7,304 株病毒進行了重配識別,發現其中 2,336 株可歸類為重配株。從宿主分布來看,不同宿主來源的甲型流感病毒重配比例差異明顯:豬源病毒最高,達到61.7%;人源病毒約為30.9%;禽源病毒約為14.3%。這一結果與“豬是流感病毒混合容器”的經典認識高度一致,提示豬源病毒在產生新型重配毒株方面具有更高風險。

進一步從亞型層面分析發現,不同亞型的重配傾向同樣存在顯著差異,其中H1N2的重配比例最高,約為63%,H5N6也較高,約為61%;相比之下,H3N8H4N6的重配比例明顯較低,僅約5%。此外,H9N2、H5N1、H5N2、H7N9等與人類健康密切相關的禽流感亞型,也表現出中等偏高的重配比例。這些結果提示我們,不同亞型、不同宿主背景下的重配風險并不均一,因此有必要圍繞重點宿主和重點亞型開展持續監測。

除了對流感病毒的宿主分布和亞型特征進行分析外,作者還進一步考察了重配流感病毒的片段交換規律。結果發現,HANA片段更容易與其他內部片段發生異源組合,但HA 與 NA 彼此之間反而更傾向于保持同一來源;與此同時,PB2、PB1 和 PA這三個聚合酶片段之間也更傾向于共同保留同源關系。這樣的結果與已有生物學研究高度一致:一方面,HA 與 NA 之間需要維持功能平衡;另一方面,聚合酶復合體內部也存在較強的協同適配需求。這也說明,VReassort不僅能夠用于識別重配事件,還可以進一步支持對重配規律及其潛在機制的深入解析。


圖中展示了VReassort 鑒定的 2012—2022 年重配甲型流感病毒(IAV)宿主和亞型分布情況。a 為 7,304 株 IAV毒株的宿主來源分布,中間餅圖顯示總體構成,周圍餅圖顯示三類宿主中重配毒株(深色,2,336 株)與非重配毒株的比例;b 為不同宿主中重配毒株在各年份的占比變化,其中 2020 年人源毒株占比為 0,可能與當年納入的人源序列僅有 11 條有關;c 為最常見 10 種亞型的毒株數量,不同顏色表示宿主來源;d 為不同亞型中重配毒株與非重配毒株的數量分布;e 為各亞型中重配毒株的占比及其宿主來源分布。


圖中展示了 2,336 株已鑒定重配毒株的分析結果,其中 a 為最常見的 20 種片段組合模式,不同顏色表示不同來源的基因片段,右側數字表示對應的毒株數量;b 為不同異源片段對在這 2,336 株重配毒株中的占比。紅框標出了占比較低的片段對,主要出現在 PB2、PB1、PA 之間以及 HA 和 NA 之間。

輪狀病毒:為了驗證方法的可遷移性,作者還將VReassort應用于人 A 類輪狀病毒,分析其VP4VP7兩個基因片段。在160 株輪狀病毒數據中,VReassort 結合重復實驗與穩定性篩選,最終高置信度識別出15 株重配株,歸屬于6 個獨立重配事件。這些毒株在兩棵系統發育樹中的位置差異較為明顯,進一步支持其為潛在重配事件。作者還基于輪狀病毒數據進行了模擬驗證。盡管模型訓練完全基于甲型流感病毒數據,VReassort 依然表現出較好的遷移能力,取得了F1-score>0.8的結果。這表明,VReassort 不僅適用于甲型流感病毒,也具備向其他分節段病毒擴展應用的潛力。

主要作者

蔡德涵:香港城市大學博士后研究員。于2025年6月在香港城市大學電機工程系獲得博士學位。主要研究方向為利用深度學習與統計方法開展計算生物學研究,重點開發面向微生物與病毒基因組學分析的高效算法與軟件工具。

孫燕妮:香港城市大學電機工程系(Electrical Engineering)副教授,博士生導師。在美國圣路易斯的華盛頓大學(Washington University in Saint Louis)取得計算機系博士學位后在密西根州立大學計算機系擔任助理教授和副教授(with tenure)。2018年加入香港城市大學。主要研究方向是生物信息學,序列分析,宏基因組學,和病毒基因組學。具體的研究課題,發表的論文,以及實驗室的位置請參加作者個人主頁:https://yannisun.github.io/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
騰訊張軍:微信“訪客功能”已焊死,不會開發,不會提供

騰訊張軍:微信“訪客功能”已焊死,不會開發,不會提供

界面新聞
2026-05-12 10:29:50
笑了!特朗普訪華,與天壇全園關閉恰巧吻合,網友開啟腦洞模式

笑了!特朗普訪華,與天壇全園關閉恰巧吻合,網友開啟腦洞模式

消失的電波
2026-05-12 17:37:49
武大開了一個壞頭

武大開了一個壞頭

燕梳樓頻道
2026-05-12 12:31:28
上海地鐵打人爆火!兩老人施暴女孩,官方怒批倚老賣老,追責難逃

上海地鐵打人爆火!兩老人施暴女孩,官方怒批倚老賣老,追責難逃

奇思妙想草葉君
2026-05-12 02:14:56
姚來英已任中國煙草總公司總經理

姚來英已任中國煙草總公司總經理

界面新聞
2026-05-12 11:12:28
懵了!東契奇突然退出球隊!

懵了!東契奇突然退出球隊!

柚子說球
2026-05-12 20:50:09
房產圈最近最大的瓜,當屬貝殼2025年財報的發布——沒有驚喜,全是驚嚇

房產圈最近最大的瓜,當屬貝殼2025年財報的發布——沒有驚喜,全是驚嚇

每日質量報道網
2026-05-11 12:04:19
太猖狂!四川凌晨追打事件后續:6人一鍋端,被查女子蠻橫襲警

太猖狂!四川凌晨追打事件后續:6人一鍋端,被查女子蠻橫襲警

奇思妙想草葉君
2026-05-12 16:24:04
“形勢相當嚴峻”:烏克蘭正奪取戰場主動權,俄羅斯擴軍計劃受挫

“形勢相當嚴峻”:烏克蘭正奪取戰場主動權,俄羅斯擴軍計劃受挫

鷹眼Defence
2026-05-12 15:34:33
以前叫人家強哥,現在請叫植物

以前叫人家強哥,現在請叫植物

阿亮評論
2026-05-12 12:18:33
23歲男子自帶挖掘機為社區修路墜崖身亡 家屬與社區就“工亡”認定未達一致 律師解讀分歧

23歲男子自帶挖掘機為社區修路墜崖身亡 家屬與社區就“工亡”認定未達一致 律師解讀分歧

封面新聞
2026-05-12 20:32:02
0分,全部0分!兩大核心啊!廣東隊正式淘汰出局

0分,全部0分!兩大核心啊!廣東隊正式淘汰出局

籃球實戰寶典
2026-05-12 21:48:38
黃仁勛真是被白宮徹底封殺了

黃仁勛真是被白宮徹底封殺了

大貓財經Pro
2026-05-12 14:04:28
問界M9尾燈能"畫"長城黃河,49.98萬起預售

問界M9尾燈能"畫"長城黃河,49.98萬起預售

硅嶼手記
2026-05-12 07:50:33
出乎眾人預料,中方提前48小時官宣特朗普訪華,高市早苗心愿落空

出乎眾人預料,中方提前48小時官宣特朗普訪華,高市早苗心愿落空

策前論
2026-05-11 18:13:56
15萬  !比亞迪又一款新車正式上市!

15萬 !比亞迪又一款新車正式上市!

科技堡壘
2026-05-12 13:03:17
5月12日俄烏最新:盧比奧指責澤連斯基撒謊

5月12日俄烏最新:盧比奧指責澤連斯基撒謊

西樓飲月
2026-05-12 18:44:18
復旦解剖326名糖尿病逝者,意外發現:得糖尿病的人,大多有5共性

復旦解剖326名糖尿病逝者,意外發現:得糖尿病的人,大多有5共性

芹姐說生活
2026-05-12 15:38:02
追覓CEO俞浩:聽說某知名科技新貴喜歡看美女,來,滿足你

追覓CEO俞浩:聽說某知名科技新貴喜歡看美女,來,滿足你

財聞
2026-05-12 14:53:07
鳳凰男不爽:憑什么你父母退休后四處旅游,我爸媽卻每天干農活

鳳凰男不爽:憑什么你父母退休后四處旅游,我爸媽卻每天干農活

多久情感
2026-05-11 21:29:05
2026-05-12 23:00:50
中國病毒學論壇 incentive-icons
中國病毒學論壇
中國病毒學論壇負責運營管理
5109文章數 17523關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

體育要聞

總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

黃仁勛真是被白宮徹底封殺了

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

藝術
手機
本地
數碼
公開課

藝術要聞

這位畫家的油畫美人讓人驚嘆不已!

手機要聞

iOS 26.5正式版發布,端對端加密RCS信息支持

本地新聞

用蘇繡的方式,打開江西婺源

數碼要聞

華為全家桶來了!手機+平板+手表

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版