Protenix-v1發(fā)布：首個超越AlphaFold 3性能的開源結(jié)構(gòu)預測模型

2026-02-11 17:05:54　來源: ScienceAI

河北舉報

分享至

編輯丨@

在 AlphaFold 3 (AF3) 問世后，盡管開源社區(qū)迅速跟進（如 Chai-1, Protenix, Boltz-1 等），但在嚴格對齊訓練數(shù)據(jù)和模型規(guī)模的前提下，開源模型與AF3之間始終存在著「性能鴻溝」。

近日，字節(jié)跳動 ByteDance Seed 團隊發(fā)布了最新技術(shù)報告，推出了 Protenix-v1。這是一項里程碑式的工作：Protenix-v1 是首個在嚴格限制訓練數(shù)據(jù)截止時間（2021 年 9 月 30 日）、模型參數(shù)量和推理預算的情況下，性能達到甚至超越 AlphaFold 3 的完全開源模型。

打破「復刻魔咒」：嚴格對齊下的 SOTA 性能

目前的開源復刻模型往往難以進行公平比較——有的使用了更多的數(shù)據(jù)，有的使用更多參數(shù)。為了證明開源模型與 AF3 之間不存在根本性的技術(shù)壁壘，Protenix-v1 采取了極其嚴格的對照實驗設(shè)計：

數(shù)據(jù)截止時間嚴格鎖定在 2021 年 9 月 30 日（與 AF3 一致）；
模型規(guī)模與推理預算完全對齊。

在這一「受控條件」下，Protenix-v1 在多個基準測試中表現(xiàn)強勁。

技術(shù)報告指出，現(xiàn)有的 FoldBench 基準存在數(shù)據(jù)覆蓋不全和統(tǒng)計方差大的問題，導致跨模型比較不可靠。Protenix 團隊構(gòu)建了一個 FoldBench-Corrected 子集，確保所有模型在相同的樣本交集上進行評估。

結(jié)果顯示：在 FoldBench 修正集上，Protenix-v1 在蛋白質(zhì)-蛋白質(zhì)（Protein-Protein）和抗體-抗原（Ab-Ag）復合物預測上均優(yōu)于 AlphaFold 3，同時大幅領(lǐng)先于 Chai-1、Boltz-1、Protenix-v0.5.0 等現(xiàn)有的開源模型。

圖示：模型在樣本交集上的評估結(jié)果。

關(guān)鍵突破：Inference-Time Scaling（推理時擴展）

Protenix-v1 最引人注目的特性之一，是其推理時 Scaling 行為。

在 LLM 領(lǐng)域，Scaling Law 已是共識。而在結(jié)構(gòu)預測領(lǐng)域，AF3 曾展示過通過增加采樣數(shù)量（seeds）來提升性能的特性，但此前的開源模型大多未能復現(xiàn)這一能力。

Protenix-v1 成功解鎖了這一技能點。報告數(shù)據(jù)顯示，隨著采樣預算從基線水平增加到數(shù)百個候選樣本，Protenix-v1 的預測準確率呈現(xiàn)出一致的、近似對數(shù)線性的提升。

抗體-抗原復合物（Ab-Ag）預測是當下最有挑戰(zhàn)的結(jié)構(gòu)預測問題之一。當使用多個 seeds 進行推理時，Protenix-v1 的 DockQ 成功率從單 seed 的 36.01% 飆升至 42.92%，80 Seeds 時更達到 47.68%。這意味著，用戶獲得了一個可調(diào)節(jié)的「控制旋鈕」：在計算成本和預測精度之間進行權(quán)衡，這對于藥物發(fā)現(xiàn)等高價值場景至關(guān)重要。

雙版本策略：學術(shù)對標 vs 實戰(zhàn)應用

為了解決「學術(shù)復刻」與「實際應用」之間的矛盾，Protenix 采取了明智的雙版本發(fā)布策略：

Protenix-v1 (標準版本)：

定位：學術(shù)基準對齊。
數(shù)據(jù)截止：和 Alphafold 3 對齊，2021 年 9 月 30 日。
作用：證明模型架構(gòu)和算法的有效性，確保與 AF3 的公平比較。

Protenix-v1-20250630 (數(shù)據(jù)擴展版本)：

定位：真實世界應用（如藥物發(fā)現(xiàn)）。
數(shù)據(jù)截止：2025 年 6 月 30 日，包含了最近幾年發(fā)布的新結(jié)構(gòu)。
優(yōu)勢：利用了最新的結(jié)構(gòu)數(shù)據(jù)（包括 2022-2025 年發(fā)布的新靶點），在 PXM-2025H2 等新數(shù)據(jù)集上表現(xiàn)更佳，特別是在抗體-抗原任務上顯著優(yōu)于標準版本。

這一策略讓研究人員既能驗證算法，又能直接上手最新的模型處理當前的實際問題。

全面升級的新 feature

除了模型本身，Protenix-v1 還提供了有價值的新 feature：

蛋白質(zhì)模板（Templates）：采用了類似 AF3 的策略，整合了模板信息，不僅提升了準確率，還使訓練過程中的模型激活更加穩(wěn)定。
支持RNA MSA：集成了 RNA 多序列比對，顯著提升了 RNA 相關(guān)任務的表現(xiàn)。消融實驗顯示，移除 RNA MSA 會導致蛋白質(zhì)-RNA 接口預測性能下降。

建立更充分、更透明的評估標準：PXMeter

針對當前生物分子結(jié)構(gòu)預測領(lǐng)域基準測試（Benchmark）混亂、數(shù)據(jù)覆蓋不一致等問題，Protenix 團隊不僅發(fā)布了模型，還推出了一套完整的評估工具和數(shù)據(jù)集——PXMeter。

團隊構(gòu)建了按年份劃分的測試集PXM-2024和PXM-2025，可以用于評測模型在不同年度數(shù)據(jù)的表現(xiàn)。針對數(shù)據(jù)稀疏的抗體、小分子任務，構(gòu)建了橫跨 4 年的評測集PXM-22to25-AntibodyandPXM-22to25-Ligand。在這些更全面、數(shù)據(jù)量更大的測試集上，Protenix-v1 均展現(xiàn)出了優(yōu)于 Chai-1 和 Boltz-1 的 SOTA 性能。

更多探索：Protenix-Mini 系列的「輕量級」突圍

在追求極致精度的同時，Protenix 團隊并沒有忽視高通量場景的需求。他們之前發(fā)布的技術(shù)報告中還披露了在輕量化模型上的探索——Protenix-Mini和Protenix-Mini+。

針對需要極高推理速度的場景，Protenix-Mini 系列進行了大膽的架構(gòu)瘦身：

極致輕量：通過精簡模型結(jié)構(gòu)和引入Linear Attention（線性注意力機制），大幅降低了計算復雜度。
極速推理：在保持一定精度的前提下，實現(xiàn)了推理速度的質(zhì)變，特別適合大規(guī)模篩選任務。
單序列推理：使用蛋白質(zhì)語言模型替代 MSA 特征，避免了 MSA 搜索引入的巨大時間開銷。
設(shè)計領(lǐng)域的「篩選器」：在蛋白質(zhì)結(jié)合體（Binder）設(shè)計的驗證中，Protenix-Mini 系列展現(xiàn)出了不俗的篩選能力（Filtering Capability）。

報告中的 Filter Results 顯示，Protenix-Mini 系列在區(qū)分「結(jié)合」與「不結(jié)合」設(shè)計時的 AUC 分數(shù)甚至優(yōu)于部分大模型。這意味著在 binder 設(shè)計篩選環(huán)節(jié)，研究人員可以利用 Mini 版本快速過濾海量候選序列，再用 Protenix-v1 進行精細驗證，打出一套高效的「組合拳」。

總結(jié)

Protenix-v1 的發(fā)布，標志著開源生物分子結(jié)構(gòu)預測模型正式進入了「后 AlphaFold 3 時代」。它不僅是首個在嚴格限制條件下性能對標 AF3 的開源模型，更關(guān)鍵的是，它成功將 AF3 核心的「推理時 Scaling」能力帶入了開源世界，為結(jié)構(gòu)預測開源領(lǐng)域填補了最后一塊拼圖。

對于致力于 AI for Science、特別是大分子藥物設(shè)計的社區(qū)來說，Protenix-v1 提供了一個強大、透明且實用的新基座。

相關(guān)鏈接：https://www.biorxiv.org/content/10.64898/2026.02.05.703733v1

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.