无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

清華大學發布ProteinOPD:面向蛋白質設計高效多目標偏好對齊框架

0
分享至



作者 | 論文團隊

編輯丨ScienceAI

當前,蛋白質語言模型正從「生成合理蛋白序列」逐步走向「按需生成具有特定性質的蛋白序列」。在合成生物學和藥物發現等場景中,研究者往往不只希望模型生成結構合理的蛋白,還希望候選序列同時具備更高折疊性、更好溶解性、更強熱穩定性等多種屬性。然而,多目標蛋白質偏好對齊長期面臨核心挑戰:在提升目標屬性的同時,模型容易遺忘預訓練階段獲得的蛋白設計能力,并且難以在多個相互競爭的偏好目標之間取得穩定平衡。

近日,清華大學高子琪團隊聯合 IDEA AI4S 團隊提出 ProteinOPD,該工作的主要貢獻如下:

1. 解決蛋白質偏好對齊中的多目標難點。ProteinOPD 是一個面向蛋白質設計的高效多目標偏好對齊框架,在提升目標屬性的同時,保留蛋白語言模型原有的設計能力與生成分布質量。

2. 提出多教師 OPD 的一種有效實現形式。該方法將預訓練蛋白語言模型適配為多個偏好專屬教師,并通過 normalized Product-of-Experts 構造幾何共識分布,使學生模型能夠在自身生成軌跡上接受 token-level on-policy distillation,從而將 OPD 從單教師、單目標設置擴展到多教師、多目標偏好對齊場景。

3. 提供較完整的開源支持。項目已開放論文、代碼、項目主頁和 Colab 體驗入口,覆蓋無條件生成與條件生成兩類設置,并提供教師構建、ProteinOPD 訓練、序列生成和推理體驗等關鍵流程,便于社區復現與后續擴展。



論文地址:https://arxiv.org/abs/2605.10189

開源地址:https://github.com/THU-AI4S/ProteinOPD

Colab 鏈接:https://colab.research.google.com/github/THU-AI4S/ProteinOPD/blob/main/notebooks/proteinopd_inference.ipynb

在模型表現方面,ProteinOPD 在多目標場景下取得了最優偏好對齊表現,同時對設計能力造成的損傷最小。以 ProtGPT2 為基礎模型時,ProteinOPD 分別將 foldability、solubility 和 thermostability 提升 14.8%、16.9% 與 54.2%;同時,其偏好對齊性能可在約 1/8 的訓練時間內達到 RL 方法的水平。

方法設計

ProteinOPD 的思路是將「偏好獲取」和「偏好組合」解耦。首先,針對折疊性、溶解性、熱穩定性等目標偏好,框架使用屬性 oracle 對蛋白序列進行打分,并選取少量高分樣本構建偏好專屬訓練集。隨后,通過輕量化適配,將預訓練蛋白語言模型轉化為多個偏好專屬教師。每個教師負責提供一種偏好的生成方向,而不是要求單個模型同時承擔全部目標。

在學生訓練階段,ProteinOPD 不采用傳統離線模仿方式,而是在學生模型自己的生成軌跡上進行 on-policy distillation。具體而言,學生模型先生成當前會訪問的蛋白序列前綴,教師模型再基于這些前綴給出下一 token 的概率分布。相比只在固定數據集上訓練,這種機制能夠讓學生在自身實際訪問的狀態空間中獲得糾正信號,從而緩解訓練階段與生成階段的分布不一致問題。同時,token-level 分布監督也比序列級獎勵更密集,有助于提升訓練效率和穩定性。



對于多目標偏好對齊,ProteinOPD 的關鍵設計是多教師 OPD。研究團隊將多個偏好教師的 next-token 分布通過 normalized Product-of-Experts 進行組合,形成一個幾何共識目標。與算術平均不同,幾何共識更強調多個教師共同支持的 token:只有當多個偏好教師都傾向于某個氨基酸選擇時,該 token 才會在共識分布中獲得更高權重。這一設計使模型更傾向于尋找多種偏好之間的交集,而不是被某一個目標單獨牽引。

這一機制還帶來一個重要性質:歸一化項可以反映教師之間的分歧程度。當多個教師在某個序列前綴上意見一致時,目標偏好之間沖突較小;當教師分布明顯不一致時,沖突程度增大。因此,ProteinOPD 不僅提供了多教師偏好組合的訓練目標,也為觀察多屬性之間的內部競爭提供了一個無需額外計算的信號。

模型性能

1. 多目標偏好對齊取得帕累托最優。(1) 相比評估中最強的跨范式參考方法 MoMPNN,ProteinOPD 的 HV 提升 34.8%。(2) 與基礎模型 ProtGPT2 相比,ProteinOPD 分別將蛋白可折疊性、溶解性和熱穩定性提升 14.8%、16.9% 與 54.2%。



論文主表:無條件設置下多目標偏好對齊性能對比。

2. 單目標實驗顯示 ProteinOPD 能夠轉移 SFT 教師的偏好能力同時緩解直接微調造成的蛋白設計能力的下降。(1) 在無條件生成中,ProteinOPD 在保留大部分屬性收益的同時,將新穎性損失控制在更低水平。(2) 在條件生成中,ProteinOPD 還提升了 ProTrek Score,說明模型在偏好對齊過程中沒有破壞原有條件一致性。



3. 訓練成本大幅降低。(1) ProteinOPD 相比 RL 類方法可以更快提升熱穩定性,并取得約 8 倍訓練加速。 (2) 教師構建只需要少量經 oracle 篩選的高質量樣本,使整體流程更適合實際蛋白設計中的快速迭代需求。



樣例研究

論文進一步給出了 ProteinOPD 與 ASPO 的生成樣例對比。為確保比較集中在多屬性對齊能力上,作者選取熱穩定性均超過 0.95 的樣例,并要求生成序列與 UniRef 的最大序列一致性低于 5%。在可視化結果中,ProteinOPD 生成樣例的 pLDDT 達到 0.73,高于 ASPO 的 0.49;溶解性得分達到 0.69,高于 ASPO 的 0.43。這表明 ProteinOPD 不僅能提升單一屬性,還能在保持新穎性的同時實現更有效的多屬性對齊。



ProteinOPD 為蛋白質偏好對齊提供了一條高效路徑:用輕量教師學習單一偏好,用多教師幾何共識處理目標沖突,再通過學生自身軌跡上的 token-level OPD 完成穩定遷移。該工作將 OPD 從語言模型偏好對齊拓展到蛋白質設計場景,并進一步推進到多目標、多教師設置,為生成式蛋白設計中的高效偏好對齊提供了新的技術參考。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

漢史趣聞
2026-05-21 11:05:32
女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務員一直舉牌勸阻卻被忽視

女子在高鐵靜音車廂連打20分鐘電話 乘客:乘務員一直舉牌勸阻卻被忽視

封面新聞
2026-05-21 12:12:47
繼蘿卜崗后,又出來“祖墳”崗?網友:誰能考上,一輩子有的吹了

繼蘿卜崗后,又出來“祖墳”崗?網友:誰能考上,一輩子有的吹了

社會日日鮮
2026-05-21 09:22:29
胡歌被正式確診為早F晚E,粉絲們都痛心不已

胡歌被正式確診為早F晚E,粉絲們都痛心不已

LULU生活家
2026-05-21 08:43:17
19歲男生凌晨2點多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報復;死者父親:他遇害前一個月未騎摩托

19歲男生凌晨2點多騎摩托被殺害,家屬稱兇手已被判處死刑!兇手:長期被噪音影響,想報復;死者父親:他遇害前一個月未騎摩托

都市快報橙柿互動
2026-05-20 17:07:55
普京回去了,給人一種莫名的傷感!

普京回去了,給人一種莫名的傷感!

達文西看世界
2026-05-21 09:48:14
網戀10天奔現4天領證!安徽離異女子攜子與新婚丈夫露營走紅網絡

網戀10天奔現4天領證!安徽離異女子攜子與新婚丈夫露營走紅網絡

火山詩話
2026-05-21 06:43:02
被判賠三家車企共226萬元,知名汽車博主回應:正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據支撐

被判賠三家車企共226萬元,知名汽車博主回應:正籌錢賠償,沒收任何黑心錢!律師:批評性言論須有可信證據支撐

每日經濟新聞
2026-05-21 00:51:17
楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區人心惶惶

楊梅才剛撲街,荔枝又被曝用藥!添加劑包裝曝光,評論區人心惶惶

譚談社會
2026-05-21 11:24:12
我定居日本20年,娶過3個妻子,發現日本的女人都有一個共同特點

我定居日本20年,娶過3個妻子,發現日本的女人都有一個共同特點

千秋文化
2026-05-20 20:33:05
職業運動員究竟有多厲害?網友:在天賦面前,努力一文不值!

職業運動員究竟有多厲害?網友:在天賦面前,努力一文不值!

另子維愛讀史
2026-05-21 08:03:05
A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

趨勢清風俠
2026-05-21 11:13:14
越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

觀史搜尋著
2026-05-21 05:41:15
恐怖!深圳深中通道雨水倒灌、大面積積水,有網友發帖一針見血

恐怖!深圳深中通道雨水倒灌、大面積積水,有網友發帖一針見血

火山詩話
2026-05-21 16:07:16
爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

念洲
2026-05-21 08:02:07
光速失業!禁足名單內10人目前仍為現役球員或在足球行業從事

光速失業!禁足名單內10人目前仍為現役球員或在足球行業從事

懂球帝
2026-05-21 15:41:08
三大元兇引發跳水 后期策略

三大元兇引發跳水 后期策略

趨勢巡航
2026-05-21 14:55:48
上海工大男生課堂喊殺后續:大四重修生,老師道歉,學校回應來了

上海工大男生課堂喊殺后續:大四重修生,老師道歉,學校回應來了

奇思妙想草葉君
2026-05-21 02:23:55
今天直接跌成股災了

今天直接跌成股災了

曹多魚的財經世界
2026-05-21 15:35:37
為了給中國人留下好印象,一生出訪無數的普京,這次終于破了例

為了給中國人留下好印象,一生出訪無數的普京,這次終于破了例

福建睿平
2026-05-20 14:09:24
2026-05-21 18:11:00
ScienceAI incentive-icons
ScienceAI
關注人工智能與其他前沿技術
1307文章數 227關注度
往期回顧 全部

科技要聞

好到離譜也不夠!英偉達交出816億美元營收

頭條要聞

中紀委連打三"虎":一人被指違規核發機動車號牌

頭條要聞

中紀委連打三"虎":一人被指違規核發機動車號牌

體育要聞

常住人口7000的小鎮,擁有了一支德甲球隊

娛樂要聞

反轉!金秀賢與金賽綸未成年時交往不實

財經要聞

英偉達業績超預!指引再新高仍不夠亮眼

汽車要聞

小鵬正在研發"高達" 融合機器人技術的主動懸架

態度原創

教育
房產
時尚
本地
親子

教育要聞

嶺大AI學科躋身軟科2025全球前200!三大碩士課程招生中!

房產要聞

順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學之約

全網首檔挑戰Al設備拍攝短劇現場直播!

本地新聞

用云錦的方式,打開江蘇南京

親子要聞

研究:生育對男性產生影響加劇,育兒成本到底該由誰來“買單”?

無障礙瀏覽 進入關懷版