恩和發(fā)布BPL協(xié)議語言，定位生物制造的“工業(yè)級編譯器”

2026-06-22 10:00:22　來源: 鈦媒體APP

北京舉報

分享至

近日，恩和科技在《bioRxiv》發(fā)布Biology Protocol Language（BPL）及其生成管線BPL-COGEN，首次為生物實驗協(xié)議建立了一套形式化的語言體系，打通了Physical AI進入物理世界的標準接口。

BPL是專為生物實驗協(xié)議設(shè)計的可編譯、可驗證的形式化語言。BPL-COGEN把自然語言協(xié)議自動翻譯為BPL程序，由一個300億參數(shù)微調(diào)大語言模型與確定性編譯器構(gòu)成“生成—驗證—修復”閉環(huán)。

在基于300篇《Nature Protocols》論文的基準測試中，BPL-COGEN實現(xiàn)95.1%的首輪一致性，通過2輪編譯-仿真閉環(huán)將正確率推進至98.6%。目前，相關(guān)代碼已在GitLab完全開源（MIT License）。

AI已會“思考”，但還不會“動手”

當前，AI已經(jīng)能在數(shù)字世界生成假設(shè)與設(shè)計實驗。材料科學領(lǐng)域已經(jīng)出現(xiàn)自主驅(qū)動的Self-driving Lab。但在生物學領(lǐng)域，無論上游AI多么強大，其輸出最終仍須被翻譯為物理操作，而這一過程，至今仍依賴自然語言文本。

這是一個半導體和軟件行業(yè)幾十年前就已跨越的問題。半導體設(shè)計通過Verilog和VHDL完成了從自然語言向硬件描述語言的躍遷，軟件工程通過類型化語言確立了可驗證的穩(wěn)定性。生物學一直缺少與之對應(yīng)的、具備編譯器驗證能力的底層語言，這正是當前AI驅(qū)動實驗設(shè)計與可復現(xiàn)物理執(zhí)行之間的速率限制環(huán)節(jié)。

代價是清晰的。《Nature》在2016年針對1,576名研究者的調(diào)查顯示，超過70%的人無法復現(xiàn)他人實驗，超過一半的人無法復現(xiàn)自己的實驗（Baker, *Nature*, 2016）。恩和團隊的論文進一步將問題歸納為三個維度：

協(xié)議精確度。典型指令中常隱藏濃度、時間、體積等多處未明分支點。幾十條此類指令疊加，使實驗可復現(xiàn)性完全依賴于人員的經(jīng)驗補全。

協(xié)議驗證。自然語言缺乏在執(zhí)行前模擬物理一致性的機制，內(nèi)部邏輯錯誤往往只能靠人工判斷甚至“實驗失敗”才能察覺。

跨平臺可遷移性。一項跨四個實驗室的合成生物學研究發(fā)現(xiàn)，名義一致的協(xié)議在不同實驗室間產(chǎn)生了兩倍以上的轉(zhuǎn)化效率差異（Beal et al., 2016, 2020），根源不在生物本身，而在執(zhí)行上下文的隱性差別。

科學的累積，源于方法可被復現(xiàn)與忠實傳遞。若協(xié)議無法被無歧義表達與跨環(huán)境復用，AI 生成的實驗設(shè)計就無法穩(wěn)定落地。

BPL設(shè)計: AI負責生成，BPL-COGEN負責仿真與驗證

BPL用形式化規(guī)范取代自然語言的歧義。在這套類型系統(tǒng)下，所有隱性參數(shù)都必須顯式聲明；任何違反物理規(guī)律的操作（如“將固態(tài)粉末加入空容器后取上清液”）將在編譯階段直接被攔截，從而避免了錯誤流入真實實驗臺。

為配合這一語言體系，團隊構(gòu)建了BPL-COGEN自動化編譯器。它將一個300億參數(shù)微調(diào)大語言模型與確定性編譯器耦合在“生成—驗證—修復”的閉環(huán)機制中：自然語言SOP被歸一化，轉(zhuǎn)換為BPL，根據(jù)編譯器診斷反復修正，直到所有物理、量綱、狀態(tài)約束全部滿足。LLM負責理解科學家的意圖，編譯器負責驗證物理世界的約束。

實驗驗證：多維度證實三大難題的解決

團隊從三個層面對BPL-COGEN進行系統(tǒng)性驗證。

大規(guī)模文本評測。在300篇Nature Protocols論文上，BPL-COGEN實現(xiàn)95.1%的首輪一致性。經(jīng)2輪編譯-仿真閉環(huán)達98.6%的迭代正確率。

分子生物學驗證。同一份BPL源碼同時編譯至手動操作與自動化設(shè)備兩種執(zhí)行上下文，均產(chǎn)生可復現(xiàn)的實驗結(jié)果。證明了協(xié)議在執(zhí)行模態(tài)上的可遷移性。

分析化學遷移驗證。在不同設(shè)備上下文之間遷移后，類胡蘿卜素的表征獲得了可比的分析結(jié)果，驗證了協(xié)議的設(shè)備無關(guān)可遷移性。

這三項驗證共同確認：BPL與BPL-COGEN同時解決了長期困擾行業(yè)的協(xié)議精確度、可驗證性、跨平臺可遷移性三大核心難題。

在SAION物理AI平臺中的定位

BPL是恩和SAION物理AI平臺“認知—控制—執(zhí)行”三層架構(gòu)中執(zhí)行層的標準接口。向下，它下發(fā)指令到生物鑄造廠的自動化設(shè)備與人類操作員；向上，它回流結(jié)構(gòu)化的實驗執(zhí)行數(shù)據(jù)，驅(qū)動認知層與控制層的持續(xù)進化。

結(jié)合此前SAION AI平臺在文獻閱讀到質(zhì)粒設(shè)計與濕實驗組裝的100%正確率、質(zhì)粒構(gòu)建90%成功率，BPL的引入使物理AI閉環(huán)的執(zhí)行層首次具備了可驗證、可遷移的標準協(xié)議基礎(chǔ)。

在AI+生物制造全球圖景中的意義

生物制造領(lǐng)域AI技術(shù)的核心價值，在于能否真實推動兌現(xiàn)數(shù)千萬元乃至數(shù)億元的經(jīng)濟效益。當AI真正驅(qū)動產(chǎn)業(yè)鏈、產(chǎn)品、訂單的經(jīng)濟價值兌現(xiàn)時，它在產(chǎn)業(yè)中才獲得存在的意義。BPL的提出，是恩和把“AI 兌現(xiàn)產(chǎn)業(yè)價值”落到執(zhí)行層的具體動作。

據(jù)相關(guān)機構(gòu)預測，至2035年全球生物制造市場規(guī)模將達到約6萬億美元。縱觀工業(yè)史，所有制造業(yè)從“作坊”走向“工業(yè)化”的關(guān)鍵點，都伴隨著形式化協(xié)議標準的建立。作為首個具備“編譯時物理驗證 + 跨平臺可遷移”雙能力的工程級方案，BPL為這一萬億級賽道的標準化推進提供了關(guān)鍵基礎(chǔ)設(shè)施。

正如研究團隊在論文中所指出的：BPL-COGEN提供了生物領(lǐng)域物理具身AI所需的關(guān)鍵基礎(chǔ)。只有當AI能夠以一種可被驗證的語言“說清楚自己想做什么”，自主實驗室代理才在工程上成為可能。生物制造的工程邊界，正被重新定義。

論文原文：Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. (2026). Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.