![]()
機(jī)器人公司找到了一種收集訓(xùn)練數(shù)據(jù)的廉價(jià)方案:給印度工廠工人戴上頭戴攝像頭,把他們每天的操作過程全程錄下來。
大語言模型可以從互聯(lián)網(wǎng)上海量的文本中學(xué)習(xí),機(jī)器人不行。機(jī)器人需要的是具身數(shù)據(jù)(embodied data),也就是真實(shí)世界里手怎么伸、腕怎么轉(zhuǎn)、東西滑落了怎么接、布料怎么折疊、工具卡住了怎么處理。這些數(shù)據(jù)極度稀缺,因?yàn)楝F(xiàn)實(shí)世界又慢又亂又貴。
自建機(jī)器人車隊(duì)來采集?買得起養(yǎng)不起,還危險(xiǎn)。用遠(yuǎn)程操控讓人類引導(dǎo)機(jī)器人動(dòng)作?每分鐘都在燒硬件、操作員和校準(zhǔn)成本。所以公司們退而求其次,去找最便宜的替代方案。
工人的第一人稱視頻當(dāng)然不等于機(jī)器人的動(dòng)作數(shù)據(jù),但它能捕捉到操作順序、身體姿態(tài)、雙手配合,以及那些讓熟練工作看起來毫不費(fèi)力的微調(diào)整。這些信息對(duì)訓(xùn)練模型仍然有價(jià)值。
換個(gè)角度看,機(jī)器人領(lǐng)域真正的前沿競爭,可能就是看誰能更高效地采集現(xiàn)實(shí)的數(shù)據(jù)。倉庫、工廠、廚房、維修臺(tái),這些地方之所以重要,是因?yàn)樗鼈兪侨祟惻c物理世界反復(fù)接觸的高密度場景,恰好是機(jī)器人最缺的東西。
工人的勞動(dòng)被用了兩次,第一次是干活本身,第二次是變成訓(xùn)練數(shù)據(jù)。而在具身數(shù)據(jù)的采集成本降下來之前,機(jī)器人會(huì)一直先向工人學(xué)習(xí),然后再考慮取代他們。
via:X@dotey
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.