![]()
來源:自然系列
原文作者:Ewen Callaway
Evo2基因組語言模型能生成較短基因組序列,但科學家表示,還要有更多進展,才能編寫出能在活細胞內發揮功能的基因組。
![]()
Evo2是一款旨在讀取、解釋并生成DNA、RNA和蛋白質序列的人工智能模型。來源:Jean-Claude Revy/SPL
2008年,研究人員報告了有史以來首個人工合成的活生物的基因組,該基因組是通過化學合成生殖支原體細菌(Mycoplasma genitalium)58萬個核苷酸的基因組而產生的[1]。后續研究在細胞中“重啟”了此類基因組,創造了科學家所稱的第一個合成生命實例[2]。
如今,研究人員已利用人工智能設計出完整的基因組序列,其中包括一個受M. genitalium基因組啟發的設計。該AI模型以生命之樹上各類生物的數萬億個DNA字母為訓練數據。
這些基因組設計——包括3月4日發表的一篇《自然》論文,介紹了用于生成這些設計的Evo2 DNA語言模型[3]——盡管令人印象深刻,但其他研究人員認為,這只是通向AI生成微生物生命的一步。
“這很酷,但還沒到那一步。”荷蘭瓦赫寧根大學的合成生物學家Nico Claassens說完。一個主要障礙是需要大規模合成并測試AI生成的基因組。另一個障礙是能指導哪怕極為簡單生命形式全部基本功能的基因組仍難以設計,更不用說更復雜細胞的功能了。
然而,那些十多年來一直致力于從零開始設計基因組的科學家表示,這個曾經顯得膽大包天的目標,如今似乎已經可以觸及。英國曼徹斯特大學的基因組工程師Patrick Yizhi Cai表示:“這些AI模型是合成基因組學的‘ChatGPT時刻’。現在,我們可以開始編寫自然界從未存在過的東西了。”
能工作的基因組
Cai說,以往進行的基因組編寫工作大多只是修修補補,就好像對一本現成書籍的某一章節進行編輯,或刪除所有逗號。Cai參與了一個即將完成的項目,目標是重寫釀酒酵母(Saccharomyces cerevisiae)的基因組[4]。另一項工作則在大腸桿菌(Escherichia coli)基因組的近2萬個位點上進行了重編碼,棄用了64個用于指定蛋白質指令的“密碼子”中的3個[5]。
Evo2這樣的DNA語言模型,使人們有可能創造與現有生命差異更大的合成生命形式。2025年,加利福尼亞州Arc研究所的計算生物學家Brian Hie及同事使用Evo模型,編寫了一類感染細菌的病毒(噬菌體)的基因組[6]。當研究人員把這些指令插入大腸桿菌細胞中時,285個設計中有16個生成了能殺死細菌的功能性病毒。
但這些噬菌體基因組只有數千個DNA字母長度,編碼的基因也只有少數幾個。即便與較小的細菌基因組相比,它們也要小得多、簡單得多;而且多數科學家把病毒視為遺傳寄生物,認為它們缺乏許多生命的標志性特征。
在新的Evo2論文中,由Hie和Arc研究所生物工程師Patrick Hsu領導的團隊,利用該模型創建了受生殖支原體(M. genitalium)啟發的基因組,以及人類線粒體基因組和一個酵母染色體的設計。
計算機預測顯示,在這些受生殖支原體啟發的序列中,近70%的基因看起來是合理的。但Claassens表示,如果哪怕只有一個必需基因缺失或某個基因建模不當,這個基因組就無法在細胞內正常工作。“你不能把生命設計到70%。你可以在計算機上這樣做,但它不具備功能。”
英國劍橋大學機器學習科學家Maciej Wiatrak表示,即使包含了所有關鍵基因,這些基因的排列順序也可能決定一個設計的成敗。Wiatrak開發了另一種AI工具Bacformer,能夠生成細菌基因組[7]。“評估你的基因組看起來對不對與它能不能正常運作是兩碼事。”
此外,在發布于bioRxiv預印本平臺的一篇論文中,得克薩斯大學奧斯汀分校的研究人員發現,Evo2的基因組設計與天然基因組的組織方式不同,并且缺少一些關鍵特征[8]。研究人員表示,這并不意味著AI設計的基因組不具備功能,但它們對于理解基因組演化的啟示可能有限——而這正是合成基因組研究的一個初衷。
值得投入嗎?
Wiatrak也懷疑,從零開始設計一個微生物基因組是否值得投入如此多的精力和成本。他和同事們更感興趣的是,利用Bacformer和Evo2這樣的模型來設計一組能夠協同工作的細菌基因,即所謂“操縱子(operons)”,它們可以執行有用的任務,例如生產生物燃料。
Hie相信他的團隊設計基因組序列的能力將會提升。但要測試足夠多的基因組設計(這需要合成相當于一個完整基因組長度的DNA,并按正確順序進行組裝),以找出那些能夠工作的版本,在現有技術條件下將是一項挑戰。他說,“實驗正在迅速成為瓶頸。在這個尺度上,我們會撞上DNA合成和DNA構建成本的限制。”
Hsu表示,一種愿景是使用自主實驗室,將AI與機器人技術結合,迭代式地設計、測試并優化小段基因組,之后再組合成一個完整可運行的基因組。Hie則表示,這種分步推進的方法,可能成為一條路徑,用來編寫比微生物基因組更龐大、更復雜的基因組,例如人類和其他哺乳動物的基因組。
Claassens表示,Evo2這樣的AI工具能否終有一天設計出可運行的細胞基因組,這仍是個懸而未決的問題。他認為,要結合AI與其他方法,包括人類洞察力,才最有可能取得成功。
參考文獻:
Gibson, D. G. et al. Science319, 1215–1220 (2008).
Gibson, D.G. et al. Science329, 52–56 (2010).
Brixi, G. et al. Nature https://doi.org/10.1038/s41586-026-10176-5 (2026).
Goold, H. D. et al. Nature Commun.16, 841 (2025).
Fredens, J. et al. Nature569, 514–518 (2019).
King, S. H. et al. Preprint at bioRxiv https://doi.org/10.1101/2025.09.12.675911 (2025).
Wiatrak, M. et al. Preprint at bioRxiv https://doi.org/10.1101/2025.07.20.665723 (2025).
Tzanakakis, A., Mouratidis, I. & Georgakopoulos-Soares, I. Preprint at bioRxiv https://doi.org/10.64898/2026.01.17.700093 (2026).
原文以AI can write genomes — how long until it creates synthetic life?標題發表在2026年3月4日《自然》的新聞版塊上
?nature
Doi:10.1038/d41586-026-00681-y
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.