![]()
新智元報道
![]()
【新智元導讀】有人曬出開源項目:GPT-5.5連續狂飆150小時,自主挑戰諾獎級AlphaFold2!它用拓撲「單純形」重構蛋白質折疊邏輯,雖然性能暫未登頂,卻展示了AI科學家的恐怖潛力:秒回滾、零情緒、全自動進化。科研范式,真要變天了。
就在最近,GitHub上一個名為SimplexFold 的開源項目突然火出了圈。
它的共同作者名單里,居然出現了這樣一個名字——GPT-5.5!
![]()
Meta的機器學習工程師、開源社區硬核黑客Chris Hayduk爆料:他讓GPT-5.5開啟了「全自主目標模式」,在沒有人類干預的情況下,連續不間斷地瘋狂運行了150多個小時!
它的終極任務只有一個:扮演一位硅基科學家,去挑戰、重構、甚至顛覆那個剛剛斬獲諾貝爾獎的行業神話——AlphaFold2。
![]()
在這場長達數天的「瘋狂長跑」中,GPT-5.5 展現出了令人驚嘆的科研自主性:它自己分析論文、自己設計網絡拓撲、自己推導幾何公式、自己魔改 PyTorch 代碼、自己跑訓練。
![]()
甚至,在遭遇嚴重過擬合時,它展現出了連人類專家都無法完全解釋的「自發泛化」神跡!
諾獎AI的重大缺陷:AlphaFold2到底漏掉了什么?
要理解 GPT-5.5 為什么要對 AlphaFold2 開刀,我們得先來看看現有的「行業霸主」到底有什么遺憾。
2024年,AlphaFold2 憑借無可爭議的晶體結構預測精度斬獲諾貝爾化學獎。
它的核心武器是Evoformer模塊。
![]()
在 Evoformer 內部,包含了一套非常強大的「殘基對(Residue Pairs)」與「三角形(Triangle)」推理機制。
模型把蛋白質的氨基酸殘基兩兩配對,用一個二階的成對張量(Pair TensorZ_{ij})來表示它們之間的關系。這在圖論里,相當于蛋白質的「邊(Edge)」。
著名的「三角更新(Triangle Updates)」機制,則是通過引入第三個殘基,來反復校正和增強這些邊之間的空間幾何一致性(比如強制讓殘基 i, j, k 的邊長滿足三角形三邊關系)。
![]()
但是,精妙的背后的代價是:遺忘。
現有的 AlphaFold2 在完成極其復雜的三角形計算后,做了一件非常「偷懶」的事——它順手把計算結果又塞回了那條一階的「邊(Z_{ij})」里面。
也就是說,AlphaFold2 內部并沒有為一整個完整的三角形面 (i,j,k) 或是四面體單元 (i,j,k,l) 維護一個持久的、連續更新的「高階狀態表示」。
![]()
它就像一個記憶力只有3秒的工匠,雖然每次砌磚時都會用一把精密的「三角尺」量一下角度,但量完就把尺子扔了,腦子里記住的依然只有「磚頭A和磚頭B挨得有多近」。
這,就是 AlphaFold2 的核心禁區,也是限制其在極微觀空間拓撲表達上更進一步的「隱形天花板」。
![]()
而 GPT-5.5 在翻閱了無數生物信息學文獻后,敏銳地盯住了這個盲區。
SimplexFold 項目的核心設問由此誕生——
如果我們在神經網絡里,直接讓模型去學習、維護、更新一整個「三角形面」和「四面體單元」的持久狀態,會發生什么?
用數學降維打擊生物學復雜性
為了解決這個問題,GPT-5.5 引入了一個在近代拓撲學中大放異彩的概念——單純形(Simplex)。
![]()
名字聽起來很高深,但其實它的直觀含義非常純粹:單純形,就是某個維度里最簡單的幾何圖形。
項目主頁用一張極其優雅的表格,向我們展示了蛋白質結構是如何被「單純形化」的。
![]()
現有的絕大多數蛋白質神經網絡,本質上都是普通的圖神經網絡。
在拓撲學語言里,它們只是一個孤獨的「1-骨架」——只有節點(點)和關系(邊)。
然而,生命不是一根根鐵絲擰成的網,生命是豐滿的三維實體。
蛋白質的折疊和多肽鏈的纏繞,內部充滿了極其苛刻的三體、四體甚至多體物理約束。比如:主鏈的角度、二面角扭轉、Beta折疊的扇面幾何、疏水核心的緊密堆積、局部殘基的側鏈空間排布、甚至口袋內部的空腔和手性。
![]()
如果只用「邊」來表達,模型不得不轉無數個彎去猜這些高階特征。
但如果引入「單純形」,一個「面特征(Face Feature)」可以直接理直氣壯地說: 「殘基 i, j, k 組成了一個局部的朝向表面,它的面積是多少,內角系統是怎樣的。」
一個「四面體特征(Tetra Feature)」則可以直接高喊: 「殘基 i, j, k, l 構成了一個緊湊的三維包裝核心,它的體積是正還是負(代表手性方向),空間位阻profile是什么!」
![]()
這就是 SimplexFold 壓下的驚天豪賭:通過引入顯式的高階拓撲狀態(點?邊?面?體),為神經網絡注入極其強大的幾何歸納偏置,從而用更少的數據、更優雅的架構,榨干蛋白質主鏈折疊的最后一絲精度!
![]()
自動研究 150 小時,GPT-5.5 究竟改了啥?
以上內容是不是太專業了,看不太懂?
X網友Michael Hla在線發問:「這 150 個小時里,AI 到底折騰出了什么硬核優化?」
作者 Chris Hayduk 隨即大方地公開了 GPT-5.5 的「科研成果」。
在原始的設計里,SimplexFold 的信息傳遞比較簡單粗暴:
邊 (Edge)??面 (Face) ??體 (Tetra)??面 (Face)??重新倒回邊和點。
![]()
這就好比大家開完會,最后派個代表寫個大雜燴簡報,把高維信息粗魯地倒回一維的單體特征里。
而 GPT-5.5 瘋狂加班 150 小時后,精細化地重構了整個通信路徑!它設計了一套「高度結構化的回寫機制」。
現在,被選中的三角形和四面體在往回傳導信息時,不再是「大鍋飯」式的傾倒。它們必須嚴格通過自己真正的邊界邊進行精準路由。
AI 還貼心地加入了幾何感知門控和弱三角形注意力提示。
這直接把原本粗糙的「傳話游戲」,升級成了帶有精準導航、具備空間方向感的「高維立體通信網絡」。
![]()
反轉與吃瓜
對于這個炸裂的項目,網上的各路技術大牛和吃瓜群眾當場討論起來。
疑問一:等一下,這個實驗圖表怎么還帶穿越的?
在作者曬出的自主實驗進程圖中,有眼尖的網友發現了一個詭異的現象。
「什么鬼?看第 80 次運行附近,曲線怎么突然倒流了?它回到了過去,然后創下了一個比后來還要高的新紀錄?」
![]()
面對這個怪事大家開始瘋狂猜測。最后得出的結論細思極恐: AI自己給自己開辟新路了。
AI在推進到某一步時,發現后面的路越走越窄。于是,它非常理智地回滾到了第 80 步那個曾經表現不錯的歷史分叉口,放棄了后面的錯誤路線,重新開辟了一條新戰線。
這在人類科研里太常見了。
唯一不同的是,人類要是做實驗做了好幾天發現錯了要推倒重來,回到前幾天的步驟,那種心理崩潰要痛苦得多。
疑問二:結果其實不太行?
就在大家激動的時候,冷酷的現實給了大家當頭一棒。
有人發現: 這玩意兒太瘋狂了,嚴重的過擬合居然引發了自發的泛化。
技術大佬解釋道: 沒什么好大驚小怪的。仔細看作者發的最新的指標結果,其實相當糟糕。在這條 Y 軸上,正牌的 AlphaFold 分數大概在 90 左右,而這個 SimplexFold 差得遠呢。別忘了,這模型可是把AlphaFold的論文喂給它訓出來的。
![]()
所以, 鬧了半天,最后搞出來的模型性能其實被原生 AlphaFold 吊打?
既然最終的預測結果并不能比肩AlphaFold,那這個瘋狂的「150小時實驗」失敗了嗎?
恰恰相反。
幾乎所有的一線AI實驗室和科學家都給出了相同的答案:這事兒的意義,根本不在于 SimplexFold這個模型,而是在「自動研究員」本身。
![]()
這次實驗,是一次極其硬核的概念驗證。它證明了高階邏輯的自洽性,展現了恐怖的樣本效率和抗挫折能力,而且是一次低成本的試錯。
連續 150 小時,自己給自己 debug、看報錯、換路線、主動回滾歷史分支。這種全自動的實驗閉環,一旦配上更強的大模型,進化速度將超出人類想象。
當AI自動研究員全面走向實驗室的那一天,或許就是人類無數頑疾被治愈的黎明。
參考資料:
https://x.com/chrishayduk/status/2055757345506877759?s=46
編輯:Aeneas David
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.