![]()
編輯丨ScienceAI
基因組如同一本細胞運行的「操作指南」,詳盡記錄著生物體從組裝到運作的全部指令,掌控著生命活動的每個環節。
然而,這是一本由 DNA 編碼的「天書」,并且字母排版錯誤 —— 基因變異就可能導致生物體產生重要改變。解讀基因組序列變異的影響是生物學領域的關鍵挑戰。
基于此,谷歌 DeepMind 的研究人員提出了 AlphaGenome,它以 1 兆堿基的 DNA 序列作為輸入,能夠預測數千個功能基因組軌跡,最高可達單堿基對分辨率,涵蓋多種模態,包括基因表達、轉錄起始、染色質可及性、組蛋白修飾、轉錄因子結合、染色質接觸圖譜、剪接位點使用情況以及剪接連接點的坐標和強度。今天,研究論文登上了最新一期《Nature》雜志封面。
![]()
論文地址:https://www.nature.com/articles/s41586-025-10014-0
目前,AlphaGenome 已開放非商業使用,可以通過 AlphaGenome API 獲取。
![]()
開源地址:https://github.com/google-deepmind/alphagenome
AlphaGenome
目前,科學家所觀察到的人類遺傳變異中,超過 98% 是非編碼變異。而我們已有的工具往往僅專注于另外 2% 的基因組序列。非編碼變異位于蛋白質編碼區之外,由于其可能引發多種維度的分子結果,因此解讀起來尤其困難。
為了更準確、更快速且多模態、多維度地解碼基因組,DeepMind 的研究人員開發了 AlphaGenome,它將多模態預測、長序列上下文和堿基對分辨率整合到一個框架中。
AlphaGenome 模型以長達 100 萬個堿基對的長 DNA 序列作為輸入,并預測數千種表征其調控活性的分子特性。它還可以通過比較突變序列與未突變序列的預測值來評估基因變異或突變的影響。
![]()
預測的特性包括基因在不同細胞類型和組織中的起始和終止位置、基因剪接的位置、產生的 RNA 數量,以及哪些 DNA 堿基可接近、彼此靠近或與某些蛋白質結合。
訓練數據來自大型公共聯盟,包括 ENCODE、GTEx、4D Nucleome 和 FANTOM5,這些聯盟通過實驗測量了這些特性,涵蓋了數百種人類和小鼠細胞類型和組織中重要的基因調控模式。
AlphaGenome 架構使用卷積層初步檢測基因組序列中的短模式,使用 Transformer 在序列的所有位置傳遞信息,最后使用一系列層將檢測到的模式轉化為不同模態的預測。在訓練期間,此計算分布在多個互連的張量處理單元 (TPU) 上,用于處理單個序列。
![]()
該模型基于 DeepMind 之前的基因組學模型 Enformer,并與 AlphaMissense 相輔相成,后者專門對蛋白質編碼區內變異的影響進行分類。
實驗性能
AlphaGenome 可以預測單個 DNA 字母的改變會如何影響基因表達,并改變其 RNA 和蛋白質產物。其他人工智能系統可以對蛋白質編碼基因中約 2% 的基因組進行部分分析,而 AlphaGenome 是第一個對整個基因組進行同樣分析的系統。
在人類和小鼠基因組上進行訓練后,在 26 項變異效應預測評估中,AlphaGenome 有 24 項達到或超越了各自領域的最強外部模型水平;在 24 個基因組軌跡預測任務中,有 22 個取得了 SOTA 性能。
![]()
AlphaGenome 能夠同時評估所有模態下的變異效應,從而準確地重現了 TAL1 致癌基因附近臨床相關變異的機制。
![]()
研究人員表示 AlphaGenome 將在以下三個方面帶來影響:
1. 疾病理解:通過更準確地預測基因破壞,AlphaGenome 可以幫助研究人員更精準地查明疾病的潛在病因,并更好地解釋與某些性狀相關的變異的功能影響,從而可能發現新的治療靶點。該模型尤其適用于研究可能產生巨大影響的罕見變異,例如導致罕見孟德爾遺傳病的變異。
2. 合成生物學:它的預測結果可用于指導具有特定調控功能的合成 DNA 的設計 —— 例如,僅激活神經細胞中的基因,而不激活肌肉細胞中的基因。
3. 基礎研究:它可以通過協助繪制基因組的關鍵功能元件圖譜并明確其作用,識別調控特定細胞類型功能的最重要 DNA 指令,從而加速生物學家對基因組的理解。
盡管如此,AlphaGenome 仍然存在局限性。
與其他基于序列的模型一樣,準確捕捉非常遠的調控元件(例如距離超過 10 萬個 DNA 堿基的調控元件)的影響仍然是一個持續的挑戰。研究人員表示,未來研究的一個重點是進一步提升該模型捕捉細胞和組織特異性模式的能力。
參考內容:
https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/
https://www.science.org/content/article/deepmind-s-latest-ai-tool-makes-sense-changes-human-genome
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.