无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI對于生物學,早就不只是AlphaFold了……

0
分享至

“21世紀是生命科學的世紀”,不知道曾經是誰提出了這個概念。

從這幾年的勢頭看起來,21世紀,應該也是人工智能(AI)的世紀。前腳是2016年會下圍棋的AlphaGO,后腳是2021年震驚結構生物學的AlphaFold2,再到如今可能影響數十億人工作和生活的ChatGPT

AI,已經開始創造各種新的歷史了。

這幾年最火的幾個AI(左圖為AlphaGO紀錄片海報,右上圖為AlphaFold預測完全部序列蛋白質結構的數據庫,右下圖是OpenAI官網對ChatGPT的介紹)

而這其中,對生命科學震撼最大的要屬當然是前兩年的AlphaFold2:超高準確度的蛋白質結構預測能力,幾乎完全改寫了結構生物學的研究方式,也讓相關的生物學研究更加便利。

但是,你要是以為生命科學里的AI只有AlphaFold,那你就大錯特錯了。

從預測到創造,AI要顛覆蛋白質世界!

不過要展開聊生命科學里的AI,蛋白質結構預測還是繞不過去的話題。

自從2021年DeepMind公司推出了AlphaFold2,和華盛頓大學開發出的RoseTTAFold這兩項充滿代表性的蛋白質預測工具之后,這個領域就變得一發不可收拾了。

首先是持續發力的AlphaFold2。

正式發布后只過了半年多,2022年7月,DeepMind公司的CEO,杰米斯·哈薩比斯 (Demis Hassabis)就在新聞發布會宣布:我們已經掌握了“整個蛋白質世界”(The entire protein universe)——AlphaFold馬不停蹄地運轉,成功完成了現有蛋白質數據庫中全部2.14億種蛋白質的結構預測。

DeepMind公司CEO,杰米斯·哈薩比斯 (Demis Hassabis) | 圖源:Jung Yeon-Je/AFP/Getty

2.14億種蛋白質中,有35%被評估為高度準確,雖然這個數字看起來不高,但是按照目前實驗檢測的水平,全部做完也就差不多這個水平——更何況,截至目前實驗檢測花了幾十年也只測出了14萬種。

這些蛋白質結構,也已經發布在AlphaFold和歐洲生物信息學研究所 (EMBL-EBI)建立的數據庫中,供科研工作者們使用(https://alphafold.ebi.ac.uk/,前文圖)。

但這也只是AI在蛋白質領域發力的開始。

我們知道,蛋白質是由DNA轉錄、翻譯形成的,而DNA測序也遠比蛋白質測序更加快速、價格更低。因此,DNA數據庫的數據量遠比蛋白質數據庫多。這多出來的,很關鍵的一部分,叫做宏基因組(Metagenome)。

在過去幾年,科學家們從野外等特殊環境,比如土壤、海洋、腸道等等,直接通過測序得到了成千上萬種未知,且無法培養的微生物DNA信息,也就是所謂的宏基因組。

宏基因組產生的過程 | 圖源:Wooley JC, 2010.

僅在DeepMind公司宣布完成了“整個蛋白質世界”三個月后,2022年10月,Meta公司(原名Facebook)就拓寬了這個“蛋白質世界”的邊界(‘dark matter’ of the protein universe)——他們利用自己開發的大型語言模型算法ESMFold,預測了6.17億種來自宏基因組信息的微生物蛋白質結構

ESMFold算法的準確度雖然略遜于AlphaFold,但它的優勢在于能以60倍于AlphaFold的速度去預測短序列蛋白質的結構,這就使得它在預測結構相對簡單的微生物蛋白質上有了很大的優勢。

6.17億種蛋白質結構的全覽

| 圖源:ESM Metagenomic Atlas

這讓人不禁好奇,差不多全預測完之后,AI下一步會在蛋白質結構上做些什么?沒過幾天,AI又開始顛覆生物學家的認知了——創造蛋白質

這其實是一個和蛋白質結構預測剛好相反的問題:蛋白質結構預測是從序列到結構,而創造蛋白質是要求從我們希望得到的結構,反推出合適的蛋白質序列。過去這是個計算量巨大的工作,現在AI也能完成了。

四種目前常用的設計蛋白質策略 | 圖片翻譯自:Nature

相比于大批量預測蛋白質結構,創造蛋白質的目的就更加明確——我們希望能創造出自然界不存在,但是對人類非常有用的蛋白質

實際上,目前大部分嘗試設計都很精彩,但是實驗驗證階段就不那么順利了——AI設計出來的蛋白質結構,往往不能像預期的那樣被正確表達、合成出來。

不過設計蛋白質的嘗試還在不斷進步和迭代,可能在不遠的將來就能夠出現在我們的日常生活里。例如最新的研究中,利用ProteinMPNNRoseTTAFold方法設計出來的蛋白質,不僅在自然界完全不存在,并且大大提高了這些蛋白質結構的穩定性,預計在未來會被用作疾病治療的抗原抗體,或者生物化學反應所需的生物酶。

蛋白質設計的過程,通過不斷改變序列讓蛋白質結構趨于穩定(結構的穩定基于AlphaFold預測,越紅代表越不穩定,越藍代表越穩定) | 圖源:Nature

AI會取代我們的大腦嗎?

在生命科學研究中,還有一個難以攻克的問題:如何解讀意識?我們的大腦有數十億個神經元,它們組成的網絡連接錯綜復雜,現有的神經科學研究雖然成果累累,但是仍然不知道人類是怎么思考的。

那,AI可以做到嗎?

也許馬上就可以了。

功能核磁共振技術(fMRI)可以檢測到當我們在做某件事情時大腦血流的變化,來尋找被激活的大腦區域,在過去十幾年也被用于研究大腦各個腦區的具體功能。

這是fMRI的圖像,通過和靜息狀態的對比,研究者可以找到被激活的腦區(紅色標記) | 圖源網絡

隨著AI的發展,研究者近幾年開始了“逆向”推導:既然我們可以檢測到大腦的激活狀態,那么,是不是就可以通過激活狀態,來反向推出人在想什么呢?比如,可以復原出人類看到的東西?

于是研究者首先給志愿者看了成千上萬張不同的圖片,并測量、記錄他們腦區的激活狀態,作為AI的訓練集。之后再利用訓練出來的模型,來檢測AI推測人看到的、或者想象的圖片的能力。

實驗設計的流程,上圖為利用大量圖片構建訓練集,構建深度神經網絡模型;下圖則是基于模型,解析大腦信號產生的意識圖像 | 圖源:Koide-Majima N, 2023.

結果其實不算特別理想。因為fMRI數據比較少,無法構建足夠大的訓練集,雖然AI能形成一定的輪廓,但是也僅限于給出大概的形狀。

但是,如果給AI一點小小的文字提示輔助,它就能快速形成和真實圖像高度相似的結果!

第一列是志愿者看到的圖片,第二列(z)是單純基于大腦活動檢測AI生成的圖片,第三列(c)是單純基于文字信息AI做的圖片,第四列則是基于二三列的信息共同生成的結果,已經依稀可以分辨出原來圖片的樣子 | 圖源:Takagi Y, 2023.

第一行為真實照片,第二行則為AI基于大腦活動和文字提示形成的圖像 | 圖源:Takagi Y, 2023.

當然,這些研究的目的不是為了讓AI理解人類,而是希望通過AI分析的過程,更好地理解大腦運作的方式——比如研究者們計劃利用這套模型,在未來檢測動物的大腦活動,來看看動物們眼中的世界會是什么樣子的。

除此以外,研究者還嘗試讓志愿者想象一個畫面,再讓AI基于大腦活動來生成圖像。雖然得到的圖像更加抽象了,但是研究者認為這對于未來的心理學研究有很重要的意義。

三組圖像基于想象的腦活動預測的結果,第一行為2019年的研究,第二行為2023年的研究,可以看到算法的提升 | 圖源:Koide-Majima N, 2023.

AI早已深入生物醫學的方方面面

當我們走向更廣闊的生物醫學領域,你會發現,AI早就是個“老玩家”了

比如在基因組學研究中,雖然科學家已經產生了海量的數據,包括基因組、轉錄組、表觀組等等,但這些分子層面的變化如何一步步影響到生物最終的表型?在過去,這個問題往往需要大量的實驗驗證。

而現如今,利用神經網絡的方法,研究者們已經開始嘗試基于DNA或RNA序列,預測其背后可能發生的各種各樣復雜的調控過程,甚至到表型最終形成的狀態。

基因調控是個復雜的問題,而研究者正在針對不同的調控過程利用AI進行預測,圖中是轉錄因子調控基因表達的過程 | 圖源:Novakovsky G, 2023.

另外,隨著人口的高度聚集,傳染病會以更高的頻率爆發,就好像最近三年肆虐全球的新冠病毒。

研究者正在考慮將AI引入到傳染病的監測過程當中——基于早期個別病例的檢測和發病情況,就可以快速預測、探知傳染病出現的可能性與位置,進而“扼殺”這些有害的細菌、病毒、真菌、寄生蟲等傳染病疫情暴發的苗頭

AI在未來的傳染病檢測中可能有著核心且重要的地位 | 圖源:Agrebi S, 2020.

再者,近幾十年生物學研究與數據呈現出指數型增長的狀態——越來越多的生物學研究與知識不斷產出,但是很多研究者卻難以及時消化。而像ChatGPT這樣的語言模型,就能有效地挖掘這些海量生物學研究結果,甚至可以基于現有的各種結果提煉出新的結論(這其實是很多薈萃分析正在做的事情)。

事實上,以上提到的這些只不過是生物學研究中AI應用的冰山一角。

在《生命3.0》一書中,物理學家馬克斯·泰格馬克提出了一個很有意思的比喻:假設人類的各種能力分布在一副地形圖里,“算術”,“死記硬背”的能力在洼地里,而“下棋”在山麓上,“科學”和“藝術”在山頂,而人工智能就好像不斷漫上來的水面,會先把簡單的能力填充,并一步步努力向上。

那么現在,人工智能的浪潮已經漫過山麓,正在沖擊山頂了。

人類能力景觀圖 | 圖源:《生命3.0》

正如我們文章里展示的各個例子,站在山頂之一的生命科學,其實正在不斷被AI“挑戰”著。但目前來看,AI對于生命科學更多的不是取代,而是互相配合

比如在AI最熱門的結構生物學領域,雖然AlphaFold和ESMFold已經預測完了世界上幾乎全部已知的蛋白質結構,但是只有大約三分之一是高度準確的。而那些不準確的其實就是結構生物學家們正在努力攻克的難題。

利用低溫冷凍電子顯微鏡和AlphaFold相互配合,預測出復雜的核孔蛋白結構 | 圖源:Fontana P, 2022.

綜合來看,至少在未來10-20年內,生命科學與AI更多的不是“挑戰者”與“被挑戰者”的關系,而是一種互相“合作”的配合關系——AI會是一項有效的工具,服務于科學研究與疾病治療

你說更遠的未來?那可能是誰都不知道的世界了。

參考資料

  • Callaway E. 'The entire protein universe': AI predicts shape of nearly every known protein[J]. Nature, 2022, 608(7921): 15-16.

  • Lin Z, Akin H, Rao R, et al. Evolutionary-scale prediction of atomic-level protein structure with a language model[J]. Science, 2023, 379(6637): 1123-1130.

  • Callaway E. Scientists are using AI to dream up revolutionary new proteins[J]. Nature, 2022.

  • Ferruz N, Heinzinger M, Akdel M, et al. From sequence to function through structure: deep learning for protein design[J]. Computational and Structural Biotechnology Journal, 2022.

  • Wicky B I M, Milles L F, Courbet A, et al. Hallucinating symmetric protein assemblies[J]. Science, 2022, 378(6615): 56-61.

  • Wang J, Lisanza S, Juergens D, et al. Scaffolding protein functional sites using deep learning[J]. Science, 2022, 377(6604): 387-394.

  • Koide-Majima N, Nishimoto S, Majima K. Mental image reconstruction from human brain activity[J]. bioRxiv, 2023: 2023.01. 22.525062.

  • Takagi Y, Nishimoto S. High-resolution image reconstruction with latent diffusion models from human brain activity[J]. bioRxiv, 2022: 2022.11. 18.517004.

  • Novakovsky G, Dexter N, Libbrecht M W, et al. Obtaining genetics insights from deep learning via explainable artificial intelligence[J]. Nature Reviews Genetics, 2023, 24(2): 125-137.

  • Agrebi S, Larbi A. Use of artificial intelligence in infectious diseases[M]//Artificial intelligence in precision health. Academic Press, 2020: 415-438.

  • Fontana P, Dong Y, Pi X, et al. Structure of cytoplasmic ring of nuclear pore complex by integrative cryo-EM and AlphaFold[J]. Science, 2022, 376(6598): eabm9326.


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
益陽市安化縣水利局黨組書記、局長謝智興被查

益陽市安化縣水利局黨組書記、局長謝智興被查

三湘都市報
2026-06-22 16:25:38
阿根廷VS奧地利:阿根廷本場不必死磕對手,奧地利有望拿到1分

阿根廷VS奧地利:阿根廷本場不必死磕對手,奧地利有望拿到1分

體育吐槽
2026-06-22 16:04:02
18歲森碟海邊度假照走紅,放棄娛樂圈專注網球成榜樣

18歲森碟海邊度假照走紅,放棄娛樂圈專注網球成榜樣

調侃國際觀點
2026-06-22 14:08:53
中紀委怒批:公務員也是人,正常生活不應問責處理!

中紀委怒批:公務員也是人,正常生活不應問責處理!

職場資深秘書
2026-06-21 13:59:22
當年買了泰坦尼克號票的8位頂級富豪,為何開船前,卻都沒上船?

當年買了泰坦尼克號票的8位頂級富豪,為何開船前,卻都沒上船?

云霄紀史觀
2026-06-21 23:44:07
湖北省武漢市東西湖區委原書記彭濤被“雙開”

湖北省武漢市東西湖區委原書記彭濤被“雙開”

界面新聞
2026-06-22 15:00:27
澳門警察街頭執行任務時突然被搶劫,九名男子一擁而上將其圍堵,勒住脖子扇巴掌搶走手機,最新通報:涉案7人已被抓

澳門警察街頭執行任務時突然被搶劫,九名男子一擁而上將其圍堵,勒住脖子扇巴掌搶走手機,最新通報:涉案7人已被抓

極目新聞
2026-06-22 16:32:57
兩性關系:不管你信不信,女性過了45歲后,基本都有這7個現狀

兩性關系:不管你信不信,女性過了45歲后,基本都有這7個現狀

荔子言
2026-06-11 13:28:05
醫生:希望你的血脂報告里,永遠不要出現這3項異常

醫生:希望你的血脂報告里,永遠不要出現這3項異常

垚垚分享健康
2026-06-22 17:05:21
烏克蘭猛烈襲擊克里米亞

烏克蘭猛烈襲擊克里米亞

名人茍或
2026-06-22 15:09:44
“沒義務給C羅傳球” 孔塞桑社媒被沖:你算哪根蔥 學學阿根廷球員

“沒義務給C羅傳球” 孔塞桑社媒被沖:你算哪根蔥 學學阿根廷球員

風過鄉
2026-06-22 13:19:35
學醫后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現5癥狀

學醫后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現5癥狀

敘說醫療健康
2026-06-18 08:00:23
小米股價創年內新低 425億港元配售參與機構浮虧55%

小米股價創年內新低 425億港元配售參與機構浮虧55%

YOUNG財經
2026-06-22 20:46:23
豐田第六代THS混合動力亮相,綜合續航一千四百公里,沖擊國產混動市場

豐田第六代THS混合動力亮相,綜合續航一千四百公里,沖擊國產混動市場

華庭講美食
2026-06-22 18:12:41
2026年,結婚人數又破紀錄了!

2026年,結婚人數又破紀錄了!

巢客HOME
2026-06-21 07:20:07
有退休金的人發現一個奇怪的現象:手里有20、30萬存款的老人,最后過得好的,幾乎都做了同兩個讓子女意外的決定

有退休金的人發現一個奇怪的現象:手里有20、30萬存款的老人,最后過得好的,幾乎都做了同兩個讓子女意外的決定

心理觀察局
2026-06-07 06:37:04
沈陽戶外大咖冰峰去世,年僅55歲

沈陽戶外大咖冰峰去世,年僅55歲

極目新聞
2026-06-22 16:04:00
張亮與19歲兒子天天合體拍攝,“張亮天天共用一張臉”登上熱搜

張亮與19歲兒子天天合體拍攝,“張亮天天共用一張臉”登上熱搜

韓小娛
2026-06-22 11:52:50
“牛市旗手”大漲!300085,午后封住“20CM”漲停

“牛市旗手”大漲!300085,午后封住“20CM”漲停

大眾證券報
2026-06-22 16:03:48
工行、農行、中行、建行、交行,集體宣布!

工行、農行、中行、建行、交行,集體宣布!

新浪財經
2026-06-22 14:46:31
2026-06-23 01:32:49
biokiwi incentive-icons
biokiwi
用生命科學的角度看世界!
160文章數 566關注度
往期回顧 全部

科技要聞

馬云與阿里巴巴眾高管下田插秧

頭條要聞

媒體:中國"兩箭齊發"反制美國 不賣了也不買了

頭條要聞

媒體:中國"兩箭齊發"反制美國 不賣了也不買了

體育要聞

法國球星祝中國隊下屆世界杯取得好成績

娛樂要聞

陪睡陪玩是皮毛,向佐揭內娛暗規則

財經要聞

前美聯儲主席格林斯潘去世 享年100歲

汽車要聞

華為智駕ADS限時優惠月底結束 7月1日前下訂立省3000元

態度原創

時尚
健康
旅游
親子
軍事航空

蘋果型顯瘦的夏季穿搭,挺好看!

粽子還沒吃完?專家教你“清庫存”

旅游要聞

“茶和天下”端午游園會在悉尼舉行

親子要聞

大牌紙尿褲查出致癌物!記者穿一整夜,血液濃度直接猛漲近一倍

軍事要聞

東風-17發射狀態首次公開 多車齊射場面硬核

無障礙瀏覽 進入關懷版