![]()
自變量開源XRZero-G0,數(shù)采成本直降到1/20。
作者丨齊鋮湧
編輯丨馬曉寧
最近具身行業(yè)被一個(gè)開源項(xiàng)目刷屏了。
最早只是小圈子里傳“有人在社區(qū)開源了一整套具身數(shù)據(jù)集”。我抱著“看看熱鬧”的心態(tài)去看了看,越看越不對(duì)勁,這不是簡(jiǎn)單的數(shù)據(jù)集,這是一整個(gè)無(wú)本體數(shù)采系統(tǒng)啊。
換句話說(shuō),別人開源的是"一段代碼",而這個(gè)開源的是一套全身無(wú)本體數(shù)采+質(zhì)檢+訓(xùn)練+真機(jī)評(píng)測(cè)的完整鏈路,還有2000多小時(shí)、覆蓋3000個(gè)任務(wù)的多模態(tài)無(wú)本體數(shù)據(jù)集,都完整打包放出來(lái)了。
![]()
![]()
論文地址:https://arxiv.org/abs/2604.13001
這在國(guó)內(nèi)還是頭一遭,于是我深扒了扒對(duì)應(yīng)的論文:
簡(jiǎn)單來(lái)說(shuō),XRZero-G0 這篇論文做了兩件事,第一是撬開了機(jī)器人數(shù)采的"黑箱",手把手演示了如何超低成本采集一套高質(zhì)量數(shù)據(jù)。第二,手把手教你怎么數(shù)據(jù)訓(xùn)練。
先說(shuō)第一點(diǎn),數(shù)據(jù)采集。之前大家可能聽說(shuō)過(guò)“具身行業(yè)采數(shù)據(jù)又難又貴”,甚至有人拋出暴論,說(shuō)具身發(fā)展慢,都是被數(shù)采拖累了。
你看大模型,吃的是文本,互聯(lián)網(wǎng)上到處都是。機(jī)器人吃的是物理數(shù)據(jù),每一條都得真金白銀去采。 而且過(guò)去采數(shù)據(jù),行業(yè)里有三個(gè)大坑,貴、臟、不可復(fù)用,這也構(gòu)成了具身數(shù)據(jù)層的"不可能三角"。
![]()
XRZero-G0論文里,給了一個(gè)巧妙的解法,核心就一句話:人戴著設(shè)備去干活,現(xiàn)場(chǎng)不需要機(jī)器人。
這條路其實(shí)有人走過(guò)(比如UMI范式),但以前這種方式有個(gè)致命的毛病,采回來(lái)的數(shù)據(jù)像個(gè)"黑箱",你不知道真機(jī)到底能不能跑通。而XRZero-G0這次通過(guò)三道"安檢",把黑箱變成了透明的白盒。
第一道安檢:三個(gè)攝像頭。
過(guò)去數(shù)采手持設(shè)備只有單視角或雙視角,這種有個(gè)缺點(diǎn),雙手一交叉,或者物體被手臂擋住,數(shù)據(jù)當(dāng)場(chǎng)報(bào)廢。XRZero-G0 的做法很直接:給操作員戴上PICO VR 頭顯,頭頂一個(gè)全局相機(jī),左右手腕各掛一個(gè)相機(jī)。
![]()
這三路視角加上六自由度位姿信息,加上背包邊緣計(jì)算做時(shí)空對(duì)齊,精度直接≤4 毫米,不管你怎么轉(zhuǎn)身、俯身、走動(dòng),遮擋和漂移問題都不會(huì)發(fā)生。
![]()
第二道安檢:裝一個(gè)虛擬限位器。
大家知道人的關(guān)節(jié)靈活,能做瑜伽,但機(jī)器人不行。之前遙操作的時(shí)候,我做了一個(gè)機(jī)器人做不出的動(dòng)作,結(jié)果電機(jī)燒了。XRZero-G0 很聰明,引入自動(dòng)逆運(yùn)動(dòng)學(xué)(IK)驗(yàn)證,過(guò)濾掉超出關(guān)節(jié)極限的動(dòng)作。
第三道安檢:真機(jī)回放。
前兩道篩完,系統(tǒng)還會(huì)隨機(jī)抽一部分?jǐn)?shù)據(jù),直接丟給真實(shí)的雙臂機(jī)器人做"開環(huán)回放"。只有機(jī)器人順利把任務(wù)做完,這批數(shù)據(jù)才算入庫(kù)。
三層漏斗篩下來(lái),入庫(kù)數(shù)據(jù)的有效率被拉升到了 85% 以上,可用性跟真機(jī)數(shù)據(jù)一樣,采集速度還更快。
看論文里數(shù)據(jù),簡(jiǎn)單任務(wù)從 35 秒壓縮到 15 秒,提速 2.33 倍;復(fù)雜任務(wù)也能快 1.71 倍。峰值采集速度達(dá)到 93.2 條軌跡每小時(shí)。這不比真機(jī)香?
![]()
但以上只是教會(huì)了"怎么更好的采集數(shù)據(jù)",XRZero-G0 論文里更關(guān)鍵的是教大家"怎么訓(xùn)"數(shù)據(jù)。
具身訓(xùn)練里,大家都知道要把"便宜無(wú)本體數(shù)據(jù)"和"昂貴真機(jī)數(shù)據(jù)"混在一起用,但比例怎么配?以前全靠煉丹。
XRZero-G0 團(tuán)隊(duì)做了一件特別扎實(shí)的事,系統(tǒng)性窮舉實(shí)驗(yàn),最終發(fā)現(xiàn)了一個(gè)"黃金比例"。
在這之前,他們對(duì)比了三套方案:
? 500 條純真機(jī)數(shù)據(jù)(基線)
?500 條真機(jī)+500 條無(wú)本體(1:1)
?50 條真機(jī)+500 條無(wú)本體(10:1)
結(jié)果出乎意料:10:1 的方案,成功率跟 500 條純真機(jī)基線持平,甚至更高。 說(shuō)人話就是:你把真機(jī)數(shù)據(jù)用量砍掉 90%,總成本壓到傳統(tǒng)方式的二十分之一,訓(xùn)出來(lái)的模型一樣聰明。20 倍的成本效率躍升。
論文解釋了這背后的原因,叫"少樣本物理錨定效應(yīng)"。
![]()
還沒完,這套數(shù)據(jù)訓(xùn)出來(lái)的模型,還能做到"零樣本"跨本體遷移。
前面說(shuō)了,傳統(tǒng)真機(jī)遙操作,最怕本體遷移。桌子高了十公分,或者換一臺(tái)機(jī)器人,直接崩。但 XRZero-G0 是背包式的,操作員走來(lái)走去,采集過(guò)程中視角、高度、光照天然充滿了動(dòng)態(tài)變化。這種豐富的"噪聲",反而讓模型練就了極強(qiáng)的魯棒性。
論文展示了非常震撼的細(xì)節(jié):把這套混合數(shù)據(jù)訓(xùn)出來(lái)的模型,扔到 EX001 和 CX001 上,沒有見過(guò)真機(jī)數(shù)據(jù),直接部署, 結(jié)果插花、疊毛巾、裝香腸都沒問題。
![]()
簡(jiǎn)單聊聊XRZero-G0 讀后感,這篇論文核心就是把"怎么低成本采數(shù)據(jù)"和"怎么高效用數(shù)據(jù)"兩件事,像說(shuō)明書一樣,掰開揉碎了給從業(yè)者看。
大家都能感知到,具身行業(yè)正從"拼Demo"轉(zhuǎn)向"拼數(shù)據(jù)"。但該如何堆時(shí)長(zhǎng),行業(yè)是缺乏共識(shí)和方向的。XRZero-G0把"更方便地采數(shù)據(jù)"、"找到完美的數(shù)據(jù)配比",進(jìn)而到最終實(shí)現(xiàn)"零樣本跨本體遷移"這一整條鏈路,都教給行業(yè)了。
這種工程化的工作,不是某一個(gè)高校實(shí)驗(yàn)室或者明星學(xué)者能單槍匹馬完成的,它必須是一支既懂學(xué)術(shù)又懂產(chǎn)業(yè)的產(chǎn)業(yè)界團(tuán)隊(duì)。
XRZero-G0 背后的公司,是自變量機(jī)器人(X-Square Robot)。
要理解自變量為啥能做XRZero-G0,看他們的路徑選擇就知道,公司從Day One就選端到端大模型,同時(shí)探索VLA、WM、WUM三條路線。圈內(nèi)人都懂,這種路線沒有扎實(shí)Infra能力根本跑不通,所以早期的從WALL-OSS,到XRZero-G0,自變量一直在建和Infra有關(guān)的基礎(chǔ)設(shè)施。
這條路雖然難,但是正確。看資本就知道了,自變量不到兩年9輪融資,估值過(guò)百億,字節(jié)、美團(tuán)、阿里、小米四家大廠都在股東名單。
至于XRZero-G0全量開源的原因,更簡(jiǎn)單粗暴了。
具身的"ChatGPT時(shí)刻"不可能靠一家公司憋出來(lái)。當(dāng)高校、中小團(tuán)隊(duì)、個(gè)人開發(fā)者都能用XRZero-G0這套標(biāo)準(zhǔn)化工具鏈批量產(chǎn)數(shù)據(jù)時(shí),全行業(yè)的數(shù)據(jù)飛輪才真正開始轉(zhuǎn)動(dòng),那時(shí)候自變量的護(hù)城河,就建起來(lái)了。
文末附上 XRZero-G0 的GitHub主頁(yè),建議大家去玩玩看:
https://github.com/X-Square-Robot/XRZero-G0
未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.