![]()
機(jī)器之心發(fā)布
讓人形機(jī)器人在移動(dòng)中完成精細(xì)操作,一直是具身智能領(lǐng)域沒(méi)有被很好解決的問(wèn)題。
過(guò)去的主流方案是把移動(dòng)和操作拆成兩個(gè)獨(dú)立模塊:機(jī)器人先走到目標(biāo)位置,停下來(lái),再執(zhí)行手部操作。這套邏輯在工廠流水線上勉強(qiáng)夠用,但放到真實(shí)世界里就會(huì)失效 —— 站姿決定抓取的可達(dá)范圍,軀干姿態(tài)影響手臂的施力方式,腳和地面的接觸條件決定全身平衡,而手部接觸動(dòng)態(tài)又會(huì)反過(guò)來(lái)影響身體接下來(lái)的運(yùn)動(dòng)。移動(dòng)和操作在物理上是耦合的,不能簡(jiǎn)單拆成兩步走。
Current Robotics 今天發(fā)布全身靈巧操作模型Curr-0,通過(guò)Single Policy將移動(dòng)控制、全身姿態(tài)協(xié)調(diào)和手部精細(xì)操作統(tǒng)一為一個(gè)端到端訓(xùn)練的策略,運(yùn)行在 70 + 自由度的人形機(jī)器人本體上,單一模型、共享權(quán)重,全程自主執(zhí)行。
![]()
![]()
![]()
Curr-0 展示的任務(wù)包括撕開(kāi)茶包、點(diǎn)香、文件蓋章、清理桌面垃圾,以及抱著玩具穿過(guò)門口蹲下放進(jìn)籃子 —— 這些動(dòng)作看起來(lái)簡(jiǎn)單,但每一個(gè)都要求機(jī)器人在移動(dòng)過(guò)程中實(shí)時(shí)調(diào)整全身姿態(tài),并在接觸瞬間完成精細(xì)的力控。
Single Policy 背后的系統(tǒng)設(shè)計(jì)
Curr-0 的核心思路是把全身靈巧操作當(dāng)作一個(gè)耦合的整體來(lái)訓(xùn)練,而不是先訓(xùn)練一個(gè)移動(dòng)策略,再訓(xùn)練一個(gè)操作策略,最后拼在一起。
系統(tǒng)內(nèi)部分為三層:上層負(fù)責(zé)理解任務(wù)和語(yǔ)言指令,中層負(fù)責(zé)協(xié)調(diào)全身運(yùn)動(dòng)和姿態(tài)穩(wěn)定,下層負(fù)責(zé)手部和物體的精細(xì)交互。三層不是按順序執(zhí)行的流水線,而是在同一個(gè)閉環(huán)策略里實(shí)時(shí)協(xié)同運(yùn)行,機(jī)器人可以在移動(dòng)過(guò)程中同步調(diào)整全身姿態(tài)和手部動(dòng)作。
數(shù)據(jù)怎么來(lái):自研全身外骨骼采集系統(tǒng)
支撐 Curr-0 訓(xùn)練的是21,000 小時(shí)真實(shí)人類行為數(shù)據(jù),其中包含 2,800 小時(shí)全身示教數(shù)據(jù),全部來(lái)自 Current Robotics 自研的HumanEx全身外骨骼數(shù)據(jù)采集系統(tǒng)。
HumanEx 是一套自研全身外骨骼數(shù)據(jù)采集系統(tǒng),其特點(diǎn)是不需要操控機(jī)器人本體。人類只需穿戴設(shè)備即可在真實(shí)場(chǎng)景中完成數(shù)據(jù)采集,系統(tǒng)同步記錄全身姿態(tài)、關(guān)節(jié)運(yùn)動(dòng)、手部動(dòng)作、本體感知、肌電信號(hào)和環(huán)境交互等多維數(shù)據(jù)。由于不依賴機(jī)器人本體,這套系統(tǒng)可以直接部署在工廠、實(shí)驗(yàn)室、辦公室等多種真實(shí)場(chǎng)景里采集數(shù)據(jù)。
![]()
通過(guò) HumanEx 的 Data Scaling。
Current Robotics 認(rèn)為,數(shù)據(jù)并不是訓(xùn)練模型的副產(chǎn)品,而是具身智能系統(tǒng)的核心基礎(chǔ)設(shè)施。這意味著數(shù)據(jù)規(guī)模的增長(zhǎng)不再受限于機(jī)器人的部署數(shù)量,而是可以隨人類的真實(shí)任務(wù)行為持續(xù)擴(kuò)大 —— 團(tuán)隊(duì)把這條路徑稱為從 "機(jī)器人部署小時(shí)數(shù)" 切換到 "人類任務(wù)小時(shí)數(shù)"。
用世界模型解決評(píng)測(cè)和部署的規(guī)模化難題
除了數(shù)據(jù)和模型,Current Robotics 還在解決另一個(gè)長(zhǎng)期被忽視的瓶頸:物理世界本身沒(méi)法規(guī)模化。
機(jī)器人每次真實(shí)測(cè)試都要消耗硬件、能源和人力,失敗了沒(méi)法回滾,場(chǎng)景沒(méi)法隨時(shí)重置。這直接限制了評(píng)測(cè)、后訓(xùn)練和部署能跑多快、跑多大規(guī)模。
為此,團(tuán)隊(duì)正在構(gòu)建多物理模態(tài)交互世界模型,覆蓋視覺(jué)、本體感知和力覺(jué)信號(hào),作為物理世界的可擴(kuò)展替代品,用來(lái)做策略評(píng)測(cè)、后訓(xùn)練和部署前的驗(yàn)證。在這個(gè)基礎(chǔ)上,團(tuán)隊(duì)還提出了 Human-in-the-World-Model 框架:策略在世界模型里跑,遇到錯(cuò)誤或不確定的情況,人可以直接在世界模型里介入修正,修正的數(shù)據(jù)馬上用于后續(xù)訓(xùn)練,從而讓評(píng)測(cè)、人工干預(yù)和后訓(xùn)練形成一個(gè)閉環(huán)。
全棧布局:數(shù)據(jù)、模型、評(píng)測(cè)、部署
把這幾塊拼起來(lái)看,Curr-0 不是一次孤立的模型發(fā)布,而是 Current Robotics 在具身智能基礎(chǔ)設(shè)施上的一次階段性展示。
從 HumanEx 采集真實(shí)人類數(shù)據(jù),到 Curr-0 端到端訓(xùn)練出全身靈巧操作能力,再到世界模型支撐的評(píng)測(cè)和后訓(xùn)練 —— 數(shù)據(jù)、模型、評(píng)測(cè)、部署這四個(gè)環(huán)節(jié)被串成一套可以持續(xù)迭代的體系。
隨著 VLA 模型和機(jī)器人本體能力持續(xù)進(jìn)步,數(shù)據(jù)基礎(chǔ)設(shè)施與迭代閉環(huán)也開(kāi)始受到越來(lái)越多關(guān)注。除了模型本身,Current Robotics 也在同步構(gòu)建數(shù)據(jù)采集、評(píng)測(cè)驗(yàn)證和部署迭代體系,靠這套體系的持續(xù)運(yùn)轉(zhuǎn)來(lái)推動(dòng)模型能力的提升。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.