![]()
編輯丨@
在 AlphaFold 3 (AF3) 問世后,盡管開源社區(qū)迅速跟進(如 Chai-1, Protenix, Boltz-1 等),但在嚴格對齊訓練數(shù)據(jù)和模型規(guī)模的前提下,開源模型與AF3之間始終存在著「性能鴻溝」。
近日,字節(jié)跳動 ByteDance Seed 團隊發(fā)布了最新技術(shù)報告,推出了 Protenix-v1。這是一項里程碑式的工作:Protenix-v1 是首個在嚴格限制訓練數(shù)據(jù)截止時間(2021 年 9 月 30 日)、模型參數(shù)量和推理預算的情況下,性能達到甚至超越 AlphaFold 3 的完全開源模型 。
打破「復刻魔咒」:嚴格對齊下的 SOTA 性能
目前的開源復刻模型往往難以進行公平比較——有的使用了更多的數(shù)據(jù),有的使用更多參數(shù)。為了證明開源模型與 AF3 之間不存在根本性的技術(shù)壁壘,Protenix-v1 采取了極其嚴格的對照實驗設(shè)計:
- 數(shù)據(jù)截止時間嚴格鎖定在 2021 年 9 月 30 日(與 AF3 一致);
- 模型規(guī)模與推理預算完全對齊。
在這一「受控條件」下,Protenix-v1 在多個基準測試中表現(xiàn)強勁。
技術(shù)報告指出,現(xiàn)有的 FoldBench 基準存在數(shù)據(jù)覆蓋不全和統(tǒng)計方差大的問題,導致跨模型比較不可靠 。Protenix 團隊構(gòu)建了一個 FoldBench-Corrected 子集,確保所有模型在相同的樣本交集上進行評估。
結(jié)果顯示: 在 FoldBench 修正集上,Protenix-v1 在蛋白質(zhì)-蛋白質(zhì)(Protein-Protein)和抗體-抗原(Ab-Ag)復合物預測上均優(yōu)于 AlphaFold 3,同時大幅領(lǐng)先于 Chai-1、Boltz-1、Protenix-v0.5.0 等現(xiàn)有的開源模型 。
![]()
圖示:模型在樣本交集上的評估結(jié)果。
關(guān)鍵突破:Inference-Time Scaling(推理時擴展)
Protenix-v1 最引人注目的特性之一,是其推理時 Scaling 行為。
在 LLM 領(lǐng)域,Scaling Law 已是共識。而在結(jié)構(gòu)預測領(lǐng)域,AF3 曾展示過通過增加采樣數(shù)量(seeds)來提升性能的特性,但此前的開源模型大多未能復現(xiàn)這一能力。
Protenix-v1 成功解鎖了這一技能點。報告數(shù)據(jù)顯示,隨著采樣預算從基線水平增加到數(shù)百個候選樣本,Protenix-v1 的預測準確率呈現(xiàn)出一致的、近似對數(shù)線性的提升。
抗體-抗原復合物(Ab-Ag)預測是當下最有挑戰(zhàn)的結(jié)構(gòu)預測問題之一。當使用多個 seeds 進行推理時,Protenix-v1 的 DockQ 成功率從單 seed 的 36.01% 飆升至 42.92%,80 Seeds 時更達到 47.68%。這意味著,用戶獲得了一個可調(diào)節(jié)的「控制旋鈕」:在計算成本和預測精度之間進行權(quán)衡,這對于藥物發(fā)現(xiàn)等高價值場景至關(guān)重要。
![]()
雙版本策略:學術(shù)對標 vs 實戰(zhàn)應用
為了解決「學術(shù)復刻」與「實際應用」之間的矛盾,Protenix 采取了明智的雙版本發(fā)布策略 :
- Protenix-v1 (標準版本):
- 定位:學術(shù)基準對齊。
- 數(shù)據(jù)截止:和 Alphafold 3 對齊,2021 年 9 月 30 日。
- 作用:證明模型架構(gòu)和算法的有效性,確保與 AF3 的公平比較。
- Protenix-v1-20250630 (數(shù)據(jù)擴展版本):
- 定位:真實世界應用(如藥物發(fā)現(xiàn))。
- 數(shù)據(jù)截止:2025 年 6 月 30 日,包含了最近幾年發(fā)布的新結(jié)構(gòu)。
- 優(yōu)勢:利用了最新的結(jié)構(gòu)數(shù)據(jù)(包括 2022-2025 年發(fā)布的新靶點),在 PXM-2025H2 等新數(shù)據(jù)集上表現(xiàn)更佳,特別是在抗體-抗原任務上顯著優(yōu)于標準版本 。
這一策略讓研究人員既能驗證算法,又能直接上手最新的模型處理當前的實際問題。
全面升級的新 feature
除了模型本身,Protenix-v1 還提供了有價值的新 feature:
- 蛋白質(zhì)模板(Templates):采用了類似 AF3 的策略,整合了模板信息,不僅提升了準確率,還使訓練過程中的模型激活更加穩(wěn)定。
- 支持RNA MSA:集成了 RNA 多序列比對,顯著提升了 RNA 相關(guān)任務的表現(xiàn)。消融實驗顯示,移除 RNA MSA 會導致蛋白質(zhì)-RNA 接口預測性能下降。
建立更充分、更透明的評估標準:PXMeter
針對當前生物分子結(jié)構(gòu)預測領(lǐng)域基準測試(Benchmark)混亂、數(shù)據(jù)覆蓋不一致等問題,Protenix 團隊不僅發(fā)布了模型,還推出了一套完整的評估工具和數(shù)據(jù)集——PXMeter。
團隊構(gòu)建了按年份劃分的測試集PXM-2024和PXM-2025,可以用于評測模型在不同年度數(shù)據(jù)的表現(xiàn)。針對數(shù)據(jù)稀疏的抗體、小分子任務,構(gòu)建了橫跨 4 年的評測集PXM-22to25-AntibodyandPXM-22to25-Ligand。在這些更全面、數(shù)據(jù)量更大的測試集上,Protenix-v1 均展現(xiàn)出了優(yōu)于 Chai-1 和 Boltz-1 的 SOTA 性能。
更多探索:Protenix-Mini 系列的「輕量級」突圍
在追求極致精度的同時,Protenix 團隊并沒有忽視高通量場景的需求。他們之前發(fā)布的技術(shù)報告中還披露了在輕量化模型上的探索——Protenix-Mini和Protenix-Mini+。
針對需要極高推理速度的場景,Protenix-Mini 系列進行了大膽的架構(gòu)瘦身:
- 極致輕量:通過精簡模型結(jié)構(gòu)和引入Linear Attention(線性注意力機制),大幅降低了計算復雜度。
- 極速推理:在保持一定精度的前提下,實現(xiàn)了推理速度的質(zhì)變,特別適合大規(guī)模篩選任務。
- 單序列推理:使用蛋白質(zhì)語言模型替代 MSA 特征,避免了 MSA 搜索引入的巨大時間開銷。
- 設(shè)計領(lǐng)域的「篩選器」:在蛋白質(zhì)結(jié)合體(Binder)設(shè)計的驗證中,Protenix-Mini 系列展現(xiàn)出了不俗的篩選能力(Filtering Capability)。
報告中的 Filter Results 顯示,Protenix-Mini 系列在區(qū)分「結(jié)合」與「不結(jié)合」設(shè)計時的 AUC 分數(shù)甚至優(yōu)于部分大模型 。這意味著在 binder 設(shè)計篩選環(huán)節(jié),研究人員可以利用 Mini 版本快速過濾海量候選序列,再用 Protenix-v1 進行精細驗證,打出一套高效的「組合拳」。
總結(jié)
Protenix-v1 的發(fā)布,標志著開源生物分子結(jié)構(gòu)預測模型正式進入了「后 AlphaFold 3 時代」。它不僅是首個在嚴格限制條件下性能對標 AF3 的開源模型,更關(guān)鍵的是,它成功將 AF3 核心的「推理時 Scaling」能力帶入了開源世界,為結(jié)構(gòu)預測開源領(lǐng)域填補了最后一塊拼圖。
對于致力于 AI for Science、特別是大分子藥物設(shè)計的社區(qū)來說,Protenix-v1 提供了一個強大、透明且實用的新基座。
相關(guān)鏈接:https://www.biorxiv.org/content/10.64898/2026.02.05.703733v1
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.