![]()
圖源:Pixabay
撰文|劉少山、唐潔
具身智能(Embodied Artificial Intelligence,EAI)是指將人工智能系統(tǒng)嵌入具有物理形態(tài)的實(shí)體之中,使其能夠感知環(huán)境、從經(jīng)驗(yàn)中學(xué)習(xí),并在與真實(shí)世界的持續(xù)交互中形成認(rèn)知、決策與行動(dòng)能力[1]。與以符號(hào)推理或純計(jì)算為中心的傳統(tǒng)人工智能不同,具身智能強(qiáng)調(diào)智能并非脫離物理世界而存在,而是必須通過(guò)身體進(jìn)入環(huán)境,在行動(dòng)與反饋的循環(huán)中不斷演化。
當(dāng)這一思想被系統(tǒng)性地引入科學(xué)發(fā)現(xiàn)過(guò)程時(shí),便形成了面向科學(xué)研究的具身智能(Embodied AI for Science,EAI4S)。在這一新范式下,自主智能體直接置身于實(shí)驗(yàn)室等真實(shí)科研環(huán)境中,能夠感知實(shí)驗(yàn)狀態(tài),執(zhí)行實(shí)驗(yàn)操作,并在實(shí)踐中學(xué)習(xí)和積累實(shí)驗(yàn)技能;同時(shí),智能體并非只是機(jī)械地執(zhí)行流程,而是通過(guò)與物理世界的持續(xù)交互,不斷調(diào)整其科學(xué)推理、實(shí)驗(yàn)設(shè)計(jì)與決策策略。面向科學(xué)研究的具身智能的核心潛力,在于從根本上重塑科學(xué)發(fā)現(xiàn)的方式,通過(guò)更快的實(shí)驗(yàn)迭代、更穩(wěn)健的實(shí)驗(yàn)執(zhí)行,以及對(duì)因果關(guān)系和機(jī)理結(jié)構(gòu)的持續(xù)探索,突破當(dāng)前科研活動(dòng)在效率、可重復(fù)性和知識(shí)積累方式上的結(jié)構(gòu)性瓶頸。
本文將系統(tǒng)回顧機(jī)器人實(shí)驗(yàn)室的發(fā)展歷程,分析現(xiàn)有技術(shù)體系的內(nèi)在局限,并討論邁向真正具身化科學(xué)智能所需的關(guān)鍵突破方向。
01 機(jī)器人實(shí)驗(yàn)室的發(fā)展脈絡(luò)
機(jī)器人實(shí)驗(yàn)室最早的標(biāo)志性進(jìn)展,來(lái)自在物理系統(tǒng)中首次實(shí)現(xiàn)端到端自治的科學(xué)發(fā)現(xiàn)閉環(huán)。2004年,Ross D. King 團(tuán)隊(duì)在功能基因組學(xué)領(lǐng)域展示了一套機(jī)器人科學(xué)家系統(tǒng),該系統(tǒng)能夠在真實(shí)實(shí)驗(yàn)環(huán)境中自動(dòng)生成科學(xué)假設(shè),并通過(guò)實(shí)驗(yàn)加以驗(yàn)證[2]。這一工作首次證明,提出假設(shè)、設(shè)計(jì)實(shí)驗(yàn)、執(zhí)行實(shí)驗(yàn)和分析結(jié)果這一完整的科學(xué)方法流程,可以被形式化并交由機(jī)器在物理世界中閉環(huán)運(yùn)行。
在此基礎(chǔ)上,2009年提出的 Adam 系統(tǒng)對(duì)機(jī)器人科學(xué)家的思想進(jìn)行了進(jìn)一步的系統(tǒng)化和工程化實(shí)現(xiàn)[3]。Adam 系統(tǒng)明確編碼了假設(shè)生成與實(shí)驗(yàn)驗(yàn)證相結(jié)合的科學(xué)推理循環(huán),并強(qiáng)調(diào)實(shí)驗(yàn)過(guò)程的機(jī)器可讀表示、實(shí)驗(yàn)數(shù)據(jù)與流程的完整記錄,以及結(jié)果的可追溯性和可重復(fù)性。圍繞這些系統(tǒng),相關(guān)研究逐步總結(jié)出機(jī)器人科學(xué)家的通用技術(shù)架構(gòu),包括科學(xué)知識(shí)表示、假設(shè)生成、實(shí)驗(yàn)設(shè)計(jì)、機(jī)器人執(zhí)行以及基于實(shí)驗(yàn)結(jié)果的迭代學(xué)習(xí)等關(guān)鍵模塊。
機(jī)器人實(shí)驗(yàn)室發(fā)展的第二個(gè)重要階段,是從以科學(xué)假設(shè)為中心的系統(tǒng),轉(zhuǎn)向以閉環(huán)優(yōu)化為核心的自驅(qū)動(dòng)實(shí)驗(yàn)室(self-driving laboratories)。隨著實(shí)驗(yàn)自動(dòng)化平臺(tái)的成熟以及機(jī)器學(xué)習(xí)方法在實(shí)驗(yàn)設(shè)計(jì)中的廣泛應(yīng)用,研究重心逐漸轉(zhuǎn)向如何在資源受限的條件下,高效探索復(fù)雜、高維的實(shí)驗(yàn)空間。這一階段通常采用主動(dòng)學(xué)習(xí)和貝葉斯優(yōu)化等方法,使系統(tǒng)能夠根據(jù)實(shí)驗(yàn)反饋動(dòng)態(tài)調(diào)整實(shí)驗(yàn)策略,從而提高探索效率[4]。
2020年提出的移動(dòng)機(jī)器人化學(xué)家系統(tǒng),是這一范式的重要里程碑[5]。該系統(tǒng)在真實(shí)的人類(lèi)實(shí)驗(yàn)室環(huán)境中連續(xù)多天自主運(yùn)行,能夠獨(dú)立選擇實(shí)驗(yàn)條件、執(zhí)行實(shí)驗(yàn)并根據(jù)結(jié)果調(diào)整后續(xù)決策,展示了自驅(qū)動(dòng)實(shí)驗(yàn)室在長(zhǎng)期穩(wěn)定運(yùn)行和復(fù)雜決策方面的可行性。進(jìn)入2020年代初,綜述性研究對(duì)這一范式進(jìn)行了系統(tǒng)總結(jié),并普遍指出,系統(tǒng)集成的可靠性、自動(dòng)化執(zhí)行的穩(wěn)健性以及實(shí)驗(yàn)數(shù)據(jù)與流程的標(biāo)準(zhǔn)化溯源,是制約自驅(qū)動(dòng)實(shí)驗(yàn)室進(jìn)一步擴(kuò)展的主要工程瓶頸。
最近,隨著大語(yǔ)言模型和工具增強(qiáng)智能體架構(gòu)的快速發(fā)展,機(jī)器人實(shí)驗(yàn)室開(kāi)始引入語(yǔ)言模型作為科研工作流的高層組織與編排機(jī)制[6,7]。這類(lèi)系統(tǒng)能夠?qū)⒀芯磕繕?biāo)轉(zhuǎn)化為具體的實(shí)驗(yàn)計(jì)劃,協(xié)調(diào)軟件工具與物理儀器,并對(duì)端到端實(shí)驗(yàn)流程進(jìn)行統(tǒng)一管理。已有研究表明,這種以語(yǔ)言模型為核心的系統(tǒng)在任務(wù)靈活性、跨領(lǐng)域泛化能力以及流程重組方面,顯著優(yōu)于早期針對(duì)單一任務(wù)設(shè)計(jì)的機(jī)器人系統(tǒng)。
02 邁向面向科學(xué)研究的具身智能
盡管機(jī)器人科學(xué)家、自驅(qū)動(dòng)實(shí)驗(yàn)室以及基于語(yǔ)言模型的實(shí)驗(yàn)室系統(tǒng)取得了顯著進(jìn)展,但從本質(zhì)上看,這些系統(tǒng)仍主要依賴(lài)自動(dòng)化執(zhí)行和數(shù)值優(yōu)化,而尚未形成真正意義上的科學(xué)智能。它們?cè)趫?zhí)行預(yù)定義實(shí)驗(yàn)流程、在參數(shù)空間內(nèi)高效搜索以及組織復(fù)雜實(shí)驗(yàn)操作方面表現(xiàn)突出,但通常仍受限于人類(lèi)預(yù)先設(shè)定的表示體系,在面對(duì)真實(shí)實(shí)驗(yàn)環(huán)境中的物理不確定性、概念抽象以及科學(xué)機(jī)理理解時(shí)能力不足。
彌合這一差距,正是邁向面向科學(xué)研究的具身智能的關(guān)鍵所在。在這一新階段,自主智能體不僅能夠運(yùn)行實(shí)驗(yàn),更能夠?qū)?shí)驗(yàn)室視為一個(gè)持續(xù)變化的物理世界,通過(guò)不斷的感知、推理與行動(dòng),實(shí)現(xiàn)對(duì)實(shí)驗(yàn)過(guò)程的深度理解和主動(dòng)適應(yīng)。實(shí)現(xiàn)這一轉(zhuǎn)變,需要在三個(gè)彼此耦合的方向上取得突破。
首先是具身世界模型與實(shí)驗(yàn)技能學(xué)習(xí)。需要構(gòu)建多模態(tài)的感知與動(dòng)作模型,用以刻畫(huà)實(shí)驗(yàn)環(huán)境的動(dòng)力學(xué)特征,并支持實(shí)驗(yàn)操作技能的學(xué)習(xí)、復(fù)用與組合,使系統(tǒng)能夠在復(fù)雜環(huán)境中實(shí)現(xiàn)超越人工腳本的穩(wěn)健操作。
其次是因果關(guān)系與科學(xué)機(jī)理層面的推理能力。系統(tǒng)應(yīng)從單純追求實(shí)驗(yàn)結(jié)果優(yōu)化,轉(zhuǎn)向?qū)σ蚬Y(jié)構(gòu)和機(jī)理解釋的發(fā)現(xiàn),通過(guò)具有可識(shí)別性的實(shí)驗(yàn)設(shè)計(jì)和理論約束,形成具有解釋力和遷移能力的科學(xué)知識(shí)。
第三是可驗(yàn)證的自主運(yùn)行與科學(xué)操作系統(tǒng)。這要求構(gòu)建具備安全約束和審計(jì)能力的智能體架構(gòu),并通過(guò)對(duì)實(shí)驗(yàn)動(dòng)作、數(shù)據(jù)與溯源信息的統(tǒng)一規(guī)范,使具身化的科學(xué)智能體能夠在不同實(shí)驗(yàn)室、不同學(xué)科之間可靠擴(kuò)展,同時(shí)保持科研結(jié)果的可信性與可重復(fù)性。
03為何面向科學(xué)研究的具身智能具有現(xiàn)實(shí)緊迫性,以及開(kāi)放為何關(guān)鍵
當(dāng)前全球科學(xué)發(fā)現(xiàn)能力呈現(xiàn)出顯著的不均衡分布。這種不均衡并非主要源于科學(xué)思想或人才儲(chǔ)備的差異,而是深植于實(shí)驗(yàn)基礎(chǔ)設(shè)施獲取能力的結(jié)構(gòu)性差距之中。從統(tǒng)計(jì)結(jié)果看,全球被主要數(shù)據(jù)庫(kù)收錄的科學(xué)論文中,超過(guò)85%來(lái)自高收入和中高收入國(guó)家,而低收入地區(qū)在全球科研產(chǎn)出中所占比例極低[8]。這一事實(shí)表明,當(dāng)代科學(xué)研究越來(lái)越受到實(shí)驗(yàn)條件、設(shè)備成本以及系統(tǒng)可靠性的制約。
面向科學(xué)研究的具身智能為緩解這一結(jié)構(gòu)性問(wèn)題提供了一條現(xiàn)實(shí)可行的路徑。通過(guò)將隱性的實(shí)驗(yàn)經(jīng)驗(yàn)轉(zhuǎn)化為可復(fù)用的具身技能,并借助穩(wěn)定的閉環(huán)運(yùn)行機(jī)制和標(biāo)準(zhǔn)化的實(shí)驗(yàn)流程,相關(guān)系統(tǒng)有望在有限投入條件下顯著提升科研產(chǎn)出效率。如果這一技術(shù)體系在設(shè)計(jì)之初就堅(jiān)持開(kāi)放和可負(fù)擔(dān)原則,科研基礎(chǔ)相對(duì)薄弱的地區(qū)便有可能跨越傳統(tǒng)重資產(chǎn)實(shí)驗(yàn)室建設(shè)路徑,更有效地參與前沿科學(xué)研究。這一理念與聯(lián)合國(guó)教科文組織提出的開(kāi)放科學(xué)原則高度一致,其核心目標(biāo)正是通過(guò)共享和互操作的科研基礎(chǔ)設(shè)施,縮小全球知識(shí)生產(chǎn)的結(jié)構(gòu)性差距[9]。
04 開(kāi)源、標(biāo)準(zhǔn)化與可負(fù)擔(dān)的技術(shù)路徑,以及中國(guó)的角色
面向科學(xué)研究的具身智能標(biāo)志著機(jī)器人實(shí)驗(yàn)室從自動(dòng)化工具,邁向具備學(xué)習(xí)、推理和決策能力的科研主體。要使這一轉(zhuǎn)變真正產(chǎn)生廣泛而持久的影響,必須在技術(shù)路線(xiàn)和制度設(shè)計(jì)上堅(jiān)持三項(xiàng)基本原則。
第一,堅(jiān)持開(kāi)源導(dǎo)向。通過(guò)開(kāi)放核心系統(tǒng)、模型和實(shí)驗(yàn)技能,科研群體才能在共享與協(xié)作中持續(xù)積累能力,避免基礎(chǔ)技術(shù)重復(fù)建設(shè),從而加快整體創(chuàng)新節(jié)奏。
第二,系統(tǒng)推進(jìn)標(biāo)準(zhǔn)化建設(shè)。實(shí)驗(yàn)動(dòng)作、硬件接口、數(shù)據(jù)格式以及實(shí)驗(yàn)溯源機(jī)制的統(tǒng)一,是實(shí)現(xiàn)跨平臺(tái)協(xié)作、跨實(shí)驗(yàn)室遷移和跨領(lǐng)域擴(kuò)展的前提條件,也是科學(xué)結(jié)果可驗(yàn)證性和可復(fù)現(xiàn)性的制度基礎(chǔ)。
第三,將可負(fù)擔(dān)性作為核心設(shè)計(jì)目標(biāo)。面向科學(xué)研究的具身智能不應(yīng)僅服務(wù)于少數(shù)頂尖實(shí)驗(yàn)室,而應(yīng)成為更多科研機(jī)構(gòu)可以部署、維護(hù)并持續(xù)演進(jìn)的公共技術(shù)能力。
在這一關(guān)鍵窗口期,中國(guó)具備在該領(lǐng)域發(fā)揮更大作用的現(xiàn)實(shí)基礎(chǔ)。完善的制造體系、突出的工程化能力以及豐富的科研應(yīng)用場(chǎng)景,使中國(guó)有條件將面向科學(xué)研究的具身智能從實(shí)驗(yàn)室原型推進(jìn)為可規(guī)模化的技術(shù)體系。
未來(lái),中國(guó)應(yīng)在國(guó)家科研基礎(chǔ)設(shè)施布局中明確支持相關(guān)平臺(tái)建設(shè),積極參與并引領(lǐng)國(guó)際標(biāo)準(zhǔn)制定,并通過(guò)開(kāi)源技術(shù)與國(guó)際合作,將成熟的系統(tǒng)和經(jīng)驗(yàn)向全球,尤其是科研資源相對(duì)不足的地區(qū)輸出。通過(guò)這一方式,中國(guó)不僅能夠加快自身科學(xué)發(fā)現(xiàn)進(jìn)程,也有望在新一輪科研范式變革中,成為面向科學(xué)研究的具身智能技術(shù)與公共能力的重要全球供給者。
論文鏈接:
- [1] Fan, W., Liu, S. Putting the smarts into robot bodies. Communications of the ACM, 2025, 68(3): 6–8.
- [2] King, R. D. et al. Functional genomic hypothesis generation and experimentation by a robot scientist. Nature, 2004, 427(6971): 247–252.
- [3] King, R. D. et al. The automation of science. Science, 2009, 324(5923): 85–89.
- [4] H?se, F., Roch, L. M., Aspuru-Guzik, A. Next-generation experimentation with self-driving laboratories. Trends in Chemistry, 2019, 1(3): 282–291.
- [5] Burger, B. et al. A mobile robotic chemist. Nature, 2020, 583(7815): 237–241.
- [6] Boiko, D. A. et al. Autonomous chemical research with large language models. Nature, 2023, 624(7992): 570–578.
- [7] Bran, A. M. et al. Augmenting large language models with chemistry tools. Nature Machine Intelligence, 2024, 6: 525–535.
- [8] National Science Board. Publications Output: U.S. Trends and International Comparisons. NSB-2023-33, 2023.
- [9] UNESCO. UNESCO Recommendation on Open Science. 2021.
作者介紹:
劉少山,深圳人工智能與機(jī)器人研究院(AIRS)具身智能中心主任, 國(guó)際計(jì)算機(jī)學(xué)會(huì)(ACM)技術(shù)政策委員會(huì)成員。
唐潔,華南理工大學(xué)副教授,研究方向包括空間智能,機(jī)器人,計(jì)算系統(tǒng)等。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.