近日,恩和科技在《bioRxiv》發(fā)布Biology Protocol Language(BPL)及其生成管線BPL-COGEN,首次為生物實驗協(xié)議建立了一套形式化的語言體系,打通了Physical AI進入物理世界的標準接口。
![]()
BPL是專為生物實驗協(xié)議設(shè)計的可編譯、可驗證的形式化語言。BPL-COGEN把自然語言協(xié)議自動翻譯為BPL程序,由一個300億參數(shù)微調(diào)大語言模型與確定性編譯器構(gòu)成“生成—驗證—修復”閉環(huán)。
在基于300篇《Nature Protocols》論文的基準測試中,BPL-COGEN實現(xiàn)95.1%的首輪一致性,通過2輪編譯-仿真閉環(huán)將正確率推進至98.6%。目前,相關(guān)代碼已在GitLab完全開源(MIT License)。
AI已會“思考”,但還不會“動手”
當前,AI已經(jīng)能在數(shù)字世界生成假設(shè)與設(shè)計實驗。材料科學領(lǐng)域已經(jīng)出現(xiàn)自主驅(qū)動的Self-driving Lab。但在生物學領(lǐng)域,無論上游AI多么強大,其輸出最終仍須被翻譯為物理操作,而這一過程,至今仍依賴自然語言文本。
這是一個半導體和軟件行業(yè)幾十年前就已跨越的問題。半導體設(shè)計通過Verilog和VHDL完成了從自然語言向硬件描述語言的躍遷,軟件工程通過類型化語言確立了可驗證的穩(wěn)定性。生物學一直缺少與之對應(yīng)的、具備編譯器驗證能力的底層語言,這正是當前AI驅(qū)動實驗設(shè)計與可復現(xiàn)物理執(zhí)行之間的速率限制環(huán)節(jié)。
代價是清晰的。《Nature》在2016年針對1,576名研究者的調(diào)查顯示,超過70%的人無法復現(xiàn)他人實驗,超過一半的人無法復現(xiàn)自己的實驗(Baker, *Nature*, 2016)。恩和團隊的論文進一步將問題歸納為三個維度:
協(xié)議精確度。典型指令中常隱藏濃度、時間、體積等多處未明分支點。幾十條此類指令疊加,使實驗可復現(xiàn)性完全依賴于人員的經(jīng)驗補全。
協(xié)議驗證。自然語言缺乏在執(zhí)行前模擬物理一致性的機制,內(nèi)部邏輯錯誤往往只能靠人工判斷甚至“實驗失敗”才能察覺。
跨平臺可遷移性。一項跨四個實驗室的合成生物學研究發(fā)現(xiàn),名義一致的協(xié)議在不同實驗室間產(chǎn)生了兩倍以上的轉(zhuǎn)化效率差異(Beal et al., 2016, 2020),根源不在生物本身,而在執(zhí)行上下文的隱性差別。
科學的累積,源于方法可被復現(xiàn)與忠實傳遞。若協(xié)議無法被無歧義表達與跨環(huán)境復用,AI 生成的實驗設(shè)計就無法穩(wěn)定落地。
BPL設(shè)計: AI負責生成,BPL-COGEN負責仿真與驗證
BPL用形式化規(guī)范取代自然語言的歧義。在這套類型系統(tǒng)下,所有隱性參數(shù)都必須顯式聲明;任何違反物理規(guī)律的操作(如“將固態(tài)粉末加入空容器后取上清液”)將在編譯階段直接被攔截,從而避免了錯誤流入真實實驗臺。
為配合這一語言體系,團隊構(gòu)建了BPL-COGEN自動化編譯器。它將一個300億參數(shù)微調(diào)大語言模型與確定性編譯器耦合在“生成—驗證—修復”的閉環(huán)機制中:自然語言SOP被歸一化,轉(zhuǎn)換為BPL,根據(jù)編譯器診斷反復修正,直到所有物理、量綱、狀態(tài)約束全部滿足。LLM負責理解科學家的意圖,編譯器負責驗證物理世界的約束。
![]()
實驗驗證:多維度證實三大難題的解決
團隊從三個層面對BPL-COGEN進行系統(tǒng)性驗證。
大規(guī)模文本評測。在300篇Nature Protocols論文上,BPL-COGEN實現(xiàn)95.1%的首輪一致性。經(jīng)2輪編譯-仿真閉環(huán)達98.6%的迭代正確率。
![]()
![]()
分子生物學驗證。同一份BPL源碼同時編譯至手動操作與自動化設(shè)備兩種執(zhí)行上下文,均產(chǎn)生可復現(xiàn)的實驗結(jié)果。證明了協(xié)議在執(zhí)行模態(tài)上的可遷移性。
![]()
分析化學遷移驗證。在不同設(shè)備上下文之間遷移后,類胡蘿卜素的表征獲得了可比的分析結(jié)果,驗證了協(xié)議的設(shè)備無關(guān)可遷移性。
![]()
這三項驗證共同確認:BPL與BPL-COGEN同時解決了長期困擾行業(yè)的協(xié)議精確度、可驗證性、跨平臺可遷移性三大核心難題。
在SAION物理AI平臺中的定位
BPL是恩和SAION物理AI平臺“認知—控制—執(zhí)行”三層架構(gòu)中執(zhí)行層的標準接口。向下,它下發(fā)指令到生物鑄造廠的自動化設(shè)備與人類操作員;向上,它回流結(jié)構(gòu)化的實驗執(zhí)行數(shù)據(jù),驅(qū)動認知層與控制層的持續(xù)進化。
結(jié)合此前SAION AI平臺在文獻閱讀到質(zhì)粒設(shè)計與濕實驗組裝的100%正確率、質(zhì)粒構(gòu)建90%成功率,BPL的引入使物理AI閉環(huán)的執(zhí)行層首次具備了可驗證、可遷移的標準協(xié)議基礎(chǔ)。
在AI+生物制造全球圖景中的意義
生物制造領(lǐng)域AI技術(shù)的核心價值,在于能否真實推動兌現(xiàn)數(shù)千萬元乃至數(shù)億元的經(jīng)濟效益。當AI真正驅(qū)動產(chǎn)業(yè)鏈、產(chǎn)品、訂單的經(jīng)濟價值兌現(xiàn)時,它在產(chǎn)業(yè)中才獲得存在的意義。BPL的提出,是恩和把“AI 兌現(xiàn)產(chǎn)業(yè)價值”落到執(zhí)行層的具體動作。
據(jù)相關(guān)機構(gòu)預測,至2035年全球生物制造市場規(guī)模將達到約6萬億美元。縱觀工業(yè)史,所有制造業(yè)從“作坊”走向“工業(yè)化”的關(guān)鍵點,都伴隨著形式化協(xié)議標準的建立。作為首個具備“編譯時物理驗證 + 跨平臺可遷移”雙能力的工程級方案,BPL為這一萬億級賽道的標準化推進提供了關(guān)鍵基礎(chǔ)設(shè)施。
正如研究團隊在論文中所指出的:BPL-COGEN提供了生物領(lǐng)域物理具身AI所需的關(guān)鍵基礎(chǔ)。只有當AI能夠以一種可被驗證的語言“說清楚自己想做什么”,自主實驗室代理才在工程上成為可能。生物制造的工程邊界,正被重新定義。
論文原文:Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. (2026). Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.