網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人形機(jī)器人不再走走停停：Current Robotics發(fā)布全身靈巧操作模型

2026-06-18 18:24:26　來(lái)源: 機(jī)器之心Pro

河北舉報(bào)

分享至

機(jī)器之心發(fā)布

讓人形機(jī)器人在移動(dòng)中完成精細(xì)操作，一直是具身智能領(lǐng)域沒(méi)有被很好解決的問(wèn)題。

過(guò)去的主流方案是把移動(dòng)和操作拆成兩個(gè)獨(dú)立模塊：機(jī)器人先走到目標(biāo)位置，停下來(lái)，再執(zhí)行手部操作。這套邏輯在工廠流水線上勉強(qiáng)夠用，但放到真實(shí)世界里就會(huì)失效 —— 站姿決定抓取的可達(dá)范圍，軀干姿態(tài)影響手臂的施力方式，腳和地面的接觸條件決定全身平衡，而手部接觸動(dòng)態(tài)又會(huì)反過(guò)來(lái)影響身體接下來(lái)的運(yùn)動(dòng)。移動(dòng)和操作在物理上是耦合的，不能簡(jiǎn)單拆成兩步走。

Current Robotics 今天發(fā)布全身靈巧操作模型Curr-0，通過(guò)Single Policy將移動(dòng)控制、全身姿態(tài)協(xié)調(diào)和手部精細(xì)操作統(tǒng)一為一個(gè)端到端訓(xùn)練的策略，運(yùn)行在 70 + 自由度的人形機(jī)器人本體上，單一模型、共享權(quán)重，全程自主執(zhí)行。

Curr-0 展示的任務(wù)包括撕開(kāi)茶包、點(diǎn)香、文件蓋章、清理桌面垃圾，以及抱著玩具穿過(guò)門口蹲下放進(jìn)籃子 —— 這些動(dòng)作看起來(lái)簡(jiǎn)單，但每一個(gè)都要求機(jī)器人在移動(dòng)過(guò)程中實(shí)時(shí)調(diào)整全身姿態(tài)，并在接觸瞬間完成精細(xì)的力控。

Single Policy 背后的系統(tǒng)設(shè)計(jì)

Curr-0 的核心思路是把全身靈巧操作當(dāng)作一個(gè)耦合的整體來(lái)訓(xùn)練，而不是先訓(xùn)練一個(gè)移動(dòng)策略，再訓(xùn)練一個(gè)操作策略，最后拼在一起。

系統(tǒng)內(nèi)部分為三層：上層負(fù)責(zé)理解任務(wù)和語(yǔ)言指令，中層負(fù)責(zé)協(xié)調(diào)全身運(yùn)動(dòng)和姿態(tài)穩(wěn)定，下層負(fù)責(zé)手部和物體的精細(xì)交互。三層不是按順序執(zhí)行的流水線，而是在同一個(gè)閉環(huán)策略里實(shí)時(shí)協(xié)同運(yùn)行，機(jī)器人可以在移動(dòng)過(guò)程中同步調(diào)整全身姿態(tài)和手部動(dòng)作。

數(shù)據(jù)怎么來(lái)：自研全身外骨骼采集系統(tǒng)

支撐 Curr-0 訓(xùn)練的是21,000 小時(shí)真實(shí)人類行為數(shù)據(jù)，其中包含 2,800 小時(shí)全身示教數(shù)據(jù)，全部來(lái)自 Current Robotics 自研的HumanEx全身外骨骼數(shù)據(jù)采集系統(tǒng)。

HumanEx 是一套自研全身外骨骼數(shù)據(jù)采集系統(tǒng)，其特點(diǎn)是不需要操控機(jī)器人本體。人類只需穿戴設(shè)備即可在真實(shí)場(chǎng)景中完成數(shù)據(jù)采集，系統(tǒng)同步記錄全身姿態(tài)、關(guān)節(jié)運(yùn)動(dòng)、手部動(dòng)作、本體感知、肌電信號(hào)和環(huán)境交互等多維數(shù)據(jù)。由于不依賴機(jī)器人本體，這套系統(tǒng)可以直接部署在工廠、實(shí)驗(yàn)室、辦公室等多種真實(shí)場(chǎng)景里采集數(shù)據(jù)。

通過(guò) HumanEx 的 Data Scaling。

Current Robotics 認(rèn)為，數(shù)據(jù)并不是訓(xùn)練模型的副產(chǎn)品，而是具身智能系統(tǒng)的核心基礎(chǔ)設(shè)施。這意味著數(shù)據(jù)規(guī)模的增長(zhǎng)不再受限于機(jī)器人的部署數(shù)量，而是可以隨人類的真實(shí)任務(wù)行為持續(xù)擴(kuò)大 —— 團(tuán)隊(duì)把這條路徑稱為從 "機(jī)器人部署小時(shí)數(shù)" 切換到 "人類任務(wù)小時(shí)數(shù)"。

用世界模型解決評(píng)測(cè)和部署的規(guī)模化難題

除了數(shù)據(jù)和模型，Current Robotics 還在解決另一個(gè)長(zhǎng)期被忽視的瓶頸：物理世界本身沒(méi)法規(guī)模化。

機(jī)器人每次真實(shí)測(cè)試都要消耗硬件、能源和人力，失敗了沒(méi)法回滾，場(chǎng)景沒(méi)法隨時(shí)重置。這直接限制了評(píng)測(cè)、后訓(xùn)練和部署能跑多快、跑多大規(guī)模。

為此，團(tuán)隊(duì)正在構(gòu)建多物理模態(tài)交互世界模型，覆蓋視覺(jué)、本體感知和力覺(jué)信號(hào)，作為物理世界的可擴(kuò)展替代品，用來(lái)做策略評(píng)測(cè)、后訓(xùn)練和部署前的驗(yàn)證。在這個(gè)基礎(chǔ)上，團(tuán)隊(duì)還提出了 Human-in-the-World-Model 框架：策略在世界模型里跑，遇到錯(cuò)誤或不確定的情況，人可以直接在世界模型里介入修正，修正的數(shù)據(jù)馬上用于后續(xù)訓(xùn)練，從而讓評(píng)測(cè)、人工干預(yù)和后訓(xùn)練形成一個(gè)閉環(huán)。

全棧布局：數(shù)據(jù)、模型、評(píng)測(cè)、部署

把這幾塊拼起來(lái)看，Curr-0 不是一次孤立的模型發(fā)布，而是 Current Robotics 在具身智能基礎(chǔ)設(shè)施上的一次階段性展示。

從 HumanEx 采集真實(shí)人類數(shù)據(jù)，到 Curr-0 端到端訓(xùn)練出全身靈巧操作能力，再到世界模型支撐的評(píng)測(cè)和后訓(xùn)練 —— 數(shù)據(jù)、模型、評(píng)測(cè)、部署這四個(gè)環(huán)節(jié)被串成一套可以持續(xù)迭代的體系。

隨著 VLA 模型和機(jī)器人本體能力持續(xù)進(jìn)步，數(shù)據(jù)基礎(chǔ)設(shè)施與迭代閉環(huán)也開(kāi)始受到越來(lái)越多關(guān)注。除了模型本身，Current Robotics 也在同步構(gòu)建數(shù)據(jù)采集、評(píng)測(cè)驗(yàn)證和部署迭代體系，靠這套體系的持續(xù)運(yùn)轉(zhuǎn)來(lái)推動(dòng)模型能力的提升。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.