无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

幾張GPU干翻超算!耶魯AI顛覆化學合成,實驗成功率71%

0
分享至



近日,美國耶魯大學博士畢業生李昊特和合作者開發了一套叫 MOSAIC 的 AI 系統,把化學合成知識分成了 2,498 個專業領域,每個領域訓練一個專家模型。

這套系統在測試中對超過 35 種全新化合物的合成成功率達到了 71%,甚至幫研究人員完成了之前文獻報道失敗的化學反應和前所未見的新反應。

使用時給定 AI 一個化學結反應式,它不光告訴你這物質形態,還直接給你一份可以進實驗室操作的詳細步驟,包括用什么試劑、加多少量、加熱多久、怎么提純,甚至連每一步的注意事項都寫好了。日前,相關論文發表于《自然》。


圖 | 李昊特(來源:https://scholar.google.com/citations?use)

這項研究的出發點,來自于研究人員對化學學科現狀的觀察。化學是一門以實驗為基礎、經驗性極強的學科。人們學到的知識和技巧大多來自前人的積累,這本來是好事,但問題在于,今天每年有上百萬篇化學論文發表,沒有任何一個化學家能讀完所有文獻,更不用說記住其中的細節了。

化學滲透在生活的方方面面,從制藥、材料、催化到農業和消費品,新藥物的開發、新材料的合成都需要大量的試錯。

一個有機化學反應的優化往往涉及多個參數:溶劑、濃度、反應順序、時間、溫度曲線,而且這些參數還會相互影響。探索一個新反應,通常需要大量的時間投入和試錯成本。

在這樣的背景下,研究人員想做一個系統:輸入一個目標分子,系統不僅告訴你能不能合成,還能給出可以直接進實驗室操作的詳細步驟。

然而,通用大模型雖然能聊天,但你要讓它給出一個具體化學反應的實驗步驟,它經常說得驢唇不對馬嘴。它會用看起來很專業的術語編造一套方案,溫度不對、試劑不對、順序也不對,按照它說的去做很可能什么都得不到,甚至炸掉反應瓶。


(來源:《自然》)

MOSAIC 的做法則是把整個化學合成知識空間分割成 2,498 個小區域,每個區域選一個專家。比如某個專家專門負責一種叫 Buchwald-Hartwig 的偶聯反應,尤其是氯代芳香環的那種。

當你輸入一個新的化學反應時,系統先在知識空間里找到離它最近的專家,然后讓這個專家來回答。

為了判斷哪個專家離得近,研究人員先訓練了一個叫 KMN 的神經網絡。這個網絡能把化學反應轉化成 128 維的數字向量,專業上叫反應特異性指紋。向量之間的距離越近,說明兩個反應越相似。

有了這個空間,他們用了一個叫 FAISS 的高效檢索工具,把知識庫聚類成 2,498 個沃羅諾伊單元,每個單元就是一個專家的地盤。

訓練的時候,先讓一個基礎模型把所有數據都學一遍,再針對每個專家所在的子集做二次微調。對一個新反應做預測時,系統先算出它的向量,找到最近的幾個沃羅諾伊單元,激活對應的專家,然后讓專家輸出完整的實驗方案。

研究人員最初嘗試了訓練一個完整的大模型,但很快意識到需要的計算資源太大了,幾百上千張 GPU 卡,大多數實驗室無法長期測試。

后來他們轉換思路,從最基礎的做起,只把模型在單個類型反應上微調。結果發現,簡單的辦法反而取得了好的效果。

傳統方法需要幾百上千張 GPU 卡,MOSAIC 只需要幾張卡就能跑,而且是可持續生長的。新數據來了不需要重新訓練整個系統,只需要在知識空間里加新的沃羅諾伊單元,訓練新的專家,已經存在的專家不受影響。

搜索的時候系統會同時從已有和新索引里找結果,合并排序后輸出。這種去中心化的設計對資源有限的學術實驗室非常友好。對大多數研究者來說,用單個或幾個 A100 GPU 就能讓這個架構持續進步。

研究人員用 MOSAIC 預測了 37 種新化合物的合成路線,其中有 35 種在第一次嘗試時就成功了。更讓人意外的是一個 5-氮雜吲哚衍生物的合成,這類化合物在之前文獻報道中被標注為是難以用現有方法制備的。

而 MOSAIC 給出的預測距離最近的專家中心距離是 320,遠高于通常的置信閾值 150,這意味著這個反應在知識庫里幾乎找不到相近的先例。

但是,研究人員完全按照預測做了實驗并成功實現了產物,同時 MOSAIC 找到了一個之前未被報道過的環化方法。這說明這套系統不只是照搬已有知識,它有一定的泛化能力,能在已有知識的邊緣組合出新的方法。

研究人員強調,最重要的實驗結果就來自于這種全新機理的反應預測。僅僅完全參照模型給出的預測,他們就取得了實驗上的成功,而且讓之前已報道過的相同底物上失敗案例得以實現。論文審稿人對這一點也贊賞有加,認為全新反應的創新是本次論文的一大亮點。

他們還發現了一個很有意思的規律,他們把所有合成嘗試的結果和預測的置信度做了對比。當預測距離小于 100 時,實驗成功率超過 75%。當距離大于 200 時,成功率降到 50% 左右。

這個置信度指標成了實驗優先級排序的有效工具,高置信度的反應可以大膽嘗試,低置信度的反應值得探索但也需要留更多容錯空間。

論文審稿人特別認可這個可信度指標,認為它彌補了一個長期存在的瓶頸,過去只有專家才能評估大模型預測的好壞,現在有了一個可量化的指標。

在預測試劑和溶劑時,單次預測的精確匹配率只有 22.4% 和 29.8%,但如果讓三個專家一起投票,精確匹配率幾乎翻倍到 43% 和 32.8%,部分匹配的成功率更是達到了 94.8%,這說明聯合多個專家的意見能大幅提升預測可靠性。


(來源:《自然》)

李昊特告訴 DeepTech,這項研究剛開始的時候,有共同作者一度懷疑它的價值,理由是已經有像 Chemcrow 這樣的架構,直接通過給 GPT-4 語言指令的方式完成一系列化學操作,看起來已經涵蓋了研究目標。

但團隊里有人從不同視角觀察,發現商業模型本身存在隱藏的缺點,對化學的理解還有非常大的提升空間。研究人員通過實驗數據證明了這一點,這個插曲讓團隊深刻體會到獨立思考的重要性,不能因為存在可行方案,就停止尋找更好的方法。

雖然 MOSAIC 可以以較高概率解決實際化學問題,但模型目前還不能解釋自己的預測。可解釋性是當前研究的重點,研究人員希望下一步的模型不僅能給出高成功率的方案,還能說清楚為什么選擇這個條件、為什么這個反應能成功,而這也是真正讓 AI 理解化學的關鍵一步。

研究人員認為這項技術在藥物合成、材料發現等方向有著優秀的轉化前景。MOSAIC 最直接的應用就是全自動機器合成平臺,它可以生成高成功率的實驗方案,然后直接交給機器人平臺去執行,用來探索新藥物、新材料。

另外,MOSAIC 可以和現有的大型化學搜索平臺,比如 Reaxys 和 SciFinder 結合起來。過去在這些平臺上搜索一個反應,可能會返回成千上萬條相似的文獻,讓人無從下手,MOSAIC 可以把這些結果整理成最少、最直接可用的方案。

在實驗室里時間是最貴的成本,MOSAIC 旨在幫助化學領域的研究人員快速篩選有希望的實驗方向,把搜索成千上萬篇文獻的時間縮到幾分鐘。

目前,研究人員已經將 MOSAIC 開源,所以感興趣的人士均可使用。

參考資料:

相關論文 https://doi.org/10.1038/s41586-026-10131-4

運營/排版:何晨龍

注:封面/首圖由 AI 輔助生成

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
56歲男子因苯磺酸氨氯地平入院走了,醫生勸告:6用藥細節別忽視

56歲男子因苯磺酸氨氯地平入院走了,醫生勸告:6用藥細節別忽視

荊醫生科普
2026-05-18 17:37:39
恩德里克:感謝上帝,讓我們一起為巴西全力以赴

恩德里克:感謝上帝,讓我們一起為巴西全力以赴

懂球帝
2026-05-19 06:32:13
蔣介石盯毛澤東照片半天,突然問:他衣服故意做舊?身邊人不敢答

蔣介石盯毛澤東照片半天,突然問:他衣服故意做舊?身邊人不敢答

鑒史錄
2026-05-18 11:03:17
內維爾:這個時候傳出瓜迪奧拉離任我很震驚,曼城全隊會很失望

內維爾:這個時候傳出瓜迪奧拉離任我很震驚,曼城全隊會很失望

懂球帝
2026-05-19 10:14:26
“你的5000美元,已長成浩瀚綠洲!”

“你的5000美元,已長成浩瀚綠洲!”

新浪財經
2026-05-19 06:51:47
兩架美國電子戰飛機碰撞墜落,損失有多大?為何在空中互相卡住?

兩架美國電子戰飛機碰撞墜落,損失有多大?為何在空中互相卡住?

上觀新聞
2026-05-19 10:02:14
越來越多的縣城,只剩下體制內經濟了!

越來越多的縣城,只剩下體制內經濟了!

黯泉
2026-05-13 11:15:55
美軍正式確認:至少200架B-21轟炸機,才能對付中國

美軍正式確認:至少200架B-21轟炸機,才能對付中國

混沌錄
2026-05-18 23:16:50
為什么歐美人不炒菜,只有中國有?美國教授:中國活在原始時代

為什么歐美人不炒菜,只有中國有?美國教授:中國活在原始時代

抽象派大師
2026-05-17 02:08:19
消失的“幽靈魚”回歸長江!禁漁五年見真章,母親河上演魚躍龍門

消失的“幽靈魚”回歸長江!禁漁五年見真章,母親河上演魚躍龍門

向航說
2026-05-19 00:50:03
“殺他全家也不解恨”,討薪1560元20次遭拒,農民工怒殺老板全家

“殺他全家也不解恨”,討薪1560元20次遭拒,農民工怒殺老板全家

易玄
2026-05-12 18:58:46
“不漏一戶、不落一人”!廣西自治區主席視頻連線調度地震現場情況,督導抗震救災工作

“不漏一戶、不落一人”!廣西自治區主席視頻連線調度地震現場情況,督導抗震救災工作

極目新聞
2026-05-19 12:41:42
國乒集體退賽,WTT新賽今晚開戰,勁敵齊聚

國乒集體退賽,WTT新賽今晚開戰,勁敵齊聚

小驛拍客在北漂
2026-05-19 11:02:07
摧毀MVP領獎夜,文班轟41+24創歷史之最!一戰包攬8大紀錄完勝SGA

摧毀MVP領獎夜,文班轟41+24創歷史之最!一戰包攬8大紀錄完勝SGA

鍋子籃球
2026-05-19 13:06:47
乘客要求網約車進車庫接人,女司機當場取消訂單,不給他投訴的機會

乘客要求網約車進車庫接人,女司機當場取消訂單,不給他投訴的機會

網約車觀察室
2026-05-18 09:59:44
北京VS上海G3前瞻!后場延續火力,麥基減少持球,末節陣容強悍!

北京VS上海G3前瞻!后場延續火力,麥基減少持球,末節陣容強悍!

籃球資訊達人
2026-05-19 15:13:23
驚爆!蔡卓妍含淚控訴丈夫,新婚20天官宣分手,直言好聚好散

驚爆!蔡卓妍含淚控訴丈夫,新婚20天官宣分手,直言好聚好散

人間煙火記事本
2026-05-19 08:14:15
他接受紀律審查和監察調查

他接受紀律審查和監察調查

錫望
2026-05-18 11:57:24
緬北七年親歷者講述:男女都會遭性侵,坐水牢放毒蛇,傷口撒辣椒

緬北七年親歷者講述:男女都會遭性侵,坐水牢放毒蛇,傷口撒辣椒

今朝牛馬
2026-02-06 17:57:17
手機集體大降價!記者實探鄭州線下門店:蘋果降價2000元銷量暴增七倍,華為折疊屏手機最高降3000元,首次跌破萬元,小米15系列線下已無貨

手機集體大降價!記者實探鄭州線下門店:蘋果降價2000元銷量暴增七倍,華為折疊屏手機最高降3000元,首次跌破萬元,小米15系列線下已無貨

極目新聞
2026-05-18 22:23:35
2026-05-19 17:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16721文章數 514968關注度
往期回顧 全部

科技要聞

馬斯克敗訴,法院判他起訴OpenAI太晚了

頭條要聞

4名男子赴泰國考察項目已失聯半月 家屬:人或在緬甸

頭條要聞

4名男子赴泰國考察項目已失聯半月 家屬:人或在緬甸

體育要聞

文班亞馬1比0雷霆:凌駕MVP的史詩價值

娛樂要聞

姚晨刪博難平眾怒,為什么她還能蹦噠

財經要聞

從賣流量到賣Token,運營商算力生意破局

汽車要聞

德味操控+聰明大腦,與眾07不輸新勢力

態度原創

時尚
手機
房產
游戲
親子

休閑闊腿褲怎么穿才美?看看這些穿搭公式,解鎖不重樣的造型

手機要聞

隨時隨地暢玩3A大作!聯想拯救者手機Y70新一代圖賞

房產要聞

7516元/㎡,161套一次全甩!海口住宅最低價出現了!

脫衣動作游戲《秋葉原之旅》15周年 銷量破百萬

親子要聞

一次注射,改寫命運:基因編輯正在從根源上攻克兒童癲癇

無障礙瀏覽 進入關懷版