无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

具身數據戰開打!普通人都能上手,邊采邊篩,只喂機器人愛吃的

0
分享至

衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI

現在,一部手機,加一個“夾爪”,就能隨時隨地完成具身智能數據采集了!



采出來的數據不臟也不廢,已經在實際模型訓練中跑出了效果

模型在多步連續任務中動作銜接更穩定;

在真實場景中面對光照變化、環境雜亂、物體遮擋時也更不容易失手,執行魯棒性顯著提升;

而當任務發生小幅變化,比如同類但不同順序的操作目標出現時,模型也更容易舉一反三,做出合理應對。

這套采集系統,模型效果是純純地全肯定。



這套可搭載手機的數采終端及其配套應用程序,名叫RoboPocket,來自具身智能創企穹徹智能

它是新興采集設備UMI(Universal Manipulation Interface)的進階狀態。

和傳統UMI方案相比,RoboPocket保持便攜易用的基礎上,更加輕盈:手機+夾爪即是一個節點。

如此一來,每個人——哪怕是普通人,都可以從口袋里掏出RoboPocket,隨時隨地采集具身數據。

但這還算不上它最出彩的地方。

最妙的是,RoboPocket把模型需求前置到采集一線,讓你隨時接入模型的訓練閉環。

采集行為發生時,系統會同步判斷每一段數據的訓練價值,并即時給出反饋與引導,盡量讓采集行為本身就朝著模型真正需要的方向收斂。

每一次采集都直接服務于模型進化,浪費不了一點。



在數據還在生成的過程中,就對其完成了價值篩選。

最終采來交付給模型的數據從采集源頭就來得更加清晰,更加準確,對模型也更有用。

具身模型想scale up,卡在數據哪一步?

在具身智能領域,數據的重要性幾乎是共識性的

具身模型們嗷嗷待哺,等待大量高質量、多樣性的具身數據的投喂。

從2023年起,許多團隊投入大量資源建設數采廠,希望通過規模化生產來支撐模型訓練。

實踐很快暴露出一個現實問題,數采流水線建起來了,數據量上來了,模型能力卻并沒有穩定持續地提升。

原因并不神秘。

數采廠依賴的是預設場景和標準化流程,這種方式在工業數據中行之有效,但在具身智能里,很難覆蓋真實世界中大量非標準、非重復的操作情境。

動作容易趨于模式化,任務分布集中,環境變化有限,數據之間高度相似,訓練收益很快出現邊際遞減。

有相關從業人員告訴我們,現在的具身數據一天比一天多了,結果訓練效率出現不升反降情況



而具身模型真正需要的,恰恰是那些發生在真實環境中的、不那么規整的操作過程。

這也是UMI出現的背景。

UMI輕量便攜,更易使用,一方面減少了數采成本,更重要的是開始讓具身數據采集擺脫了固定場地的限制。

任何人,可以在室內和戶外的任何真實世界場景里自然完成操作。

如此一來,采集的數據也是貼近現實分布的。這就彌補了數采廠和真實世界存在gap的問題。

但當UMI開始被業界認可和逐漸大規模使用后,新的問題也隨之顯現。

在真實場景中,采集更自由了,但質量控制隨之變難了。

動作是否有效?軌跡是否合理?采集節奏是否適合訓練?這些問題往往只有數據回傳清洗,開始拿來訓模型的后處理階段才能發現。

大量低價值數據被一路送進管線,清洗與返工成本迅速抬升,訓練周期被不斷拉長。

所以關于UMI的“不可能三角”被抬到了臺前——

采集質量、使用便捷性與后處理壓力三者難以同時優化

如果追求采集質量,就往往要犧牲便攜性;如果降低門檻提高便攜性,比如像傳統UMI僅靠腕部模組或“人-夾爪”采集,就又很難保證數據的可用性;如果希望用后處理階段兜底,就意味著要承受高昂的清洗、篩選與修復成本,訓練閉環被迫拉長。

現有的UMI方案并沒有解決“采得的數據能不能用”這個問題——這一點恰恰對模型訓練至關重要。

于是,穹徹團隊決定回到問題的原點,重新出發。

他們從第一性原理出發,提出一個關鍵設想。

  • 如果模型訓練最終還是要根據數據結構做判斷與篩選,那么為什么這件事不能在數據采集階段就發生?

這個問題其實是行業遲遲沒直面解決的。因為一旦著手解決,就意味著采集邏輯、平臺架構、成本結構、人才組織……都得變。

而RoboPocket第一次把它變成了現實。



內置一套實時運行的“數據價值中樞系統”

相比于過往的UMI設備,RoboPocket的關鍵改變集中體現在采集目標本身的定義上。

傳統UMI的普遍默認采集目標是“記錄人類操作行為”。

也就是通過腕部模組、夾爪、軌跡重建等方式,盡可能完整地還原人類執行任務的過程。

在訓練初期,這確實能為模型提供基本行為模板。

隨著模型走向更高維度、更長時序、更復雜場景,記錄動作本身已不足以滿足訓練所需

RoboPocket開始嘗試把采集的目標轉向模型的能力缺口。

模型還不會的,才是最值得采的數據。

基于這個理念,RoboPocket系統內置了一套實時運行的“數據價值中樞系統”

這套系統不再等數據采完后才去篩選、分類、評估,而是在采集發生的當下,就開始實時進行判斷。

不難想象,一旦沒有模型視角,采集很容易在堆量的過程中滑向重復、失真和低價值。

只有知道模型此刻真正需要什么樣的數據,才有能力搭建好這個中樞系統。

穹徹和上交大盧策吾團隊敢攬這個瓷器活,人家是真有公認的金剛鉆。

團隊長期從事具身模型訓練與數據閉環研究,既懂單點采集工具(此前推出過多款具身數據采集硬件),也懂圍繞具身模型訓練、評估與數據回流的完整閉環研究。

他們最清楚哪些軌跡會變成有效訓練信號,哪些看起來熱鬧但只會拖慢訓練,也更清楚模型在不同任務維度上的短板通常出在哪里,應該用什么樣的樣本去補。

這種能力依賴的不只是工程實現,而是對模型的長期理解與持續驗證,所以很難被復制。



采集數據的過程中,RoboPocket同時在推進并完成三件事——

第一是實時評估

在每一幀數據生成時,系統都會判斷采集到的數據是否具備有效的訓練信號,比如操作是否完整、動作是否在預期軌跡內、場景是否具備信息量。

第二是即時引導

如果系統檢測到采集者的操作可能低效或錯誤,比如動作過快、夾爪超出操作區域、多樣性不足等,就會實時發出提醒,引導采集者進行調整,避免采到低價值甚至廢棄的數據。



第三是動態調度

這一環節則直接接入當前模型的能力評估結果。

系統會根據模型在不同任務維度上的表現,識別出當前訓練最需要補齊的樣本類型,并實時分發相應的高優先級采集任務給采集者。

說句更好理解的話,RoboPocket就是個24小時stand by的數據采集主理人

它即時診斷每一幀數據的質量,智能指導甚至糾正采集員動作,實時互動動態評估數據價值,為后處理提供篩選依據。

這樣一來,在采集階段,數據就和訓練目標保持貼合,顯著減少冗余,訓練信號更加集中。

穹徹團隊介紹,RoboPocket采集的數據在訓練中展現出顯著優勢

尤其是在開放復雜環境中的多步驟任務中,模型執行的穩定性更強,不容易因光照變化、背景變化或任務干擾而出錯,準確識別每一步的上下文意圖,在不確定情境下仍保持清晰的目標推進邏輯。

無論是精準完成零食分揀裝袋,還是毛巾折疊整理,模型可以保持穩定、高效的協同作業,展現了卓越的雙臂協同與長序列操作能力。



此外,在環境復雜度提升、干擾增多的場景下,也能維持較高的成功率和一致性。

這顯現出一個重要趨勢

得益于采集過程更貼近真實任務,采集體系增強了訓練匹配能力,模型開始從“能夠粗糙地完成任務”向“能在非理想條件下可靠完成任務”演進。

而數據采集開始成為面向模型能力補齊的持續行為,這讓數據采集開始具備閉環屬性。

一旦采集與模型訓練形成聯動,整個數據系統的運行效率將得到顯著提升。



從堆量走向邊采邊篩,數據采集的分水嶺來了

如果放進更長的時間尺度來看,RoboPocket就不能視為一次孤立的產品更新。

機器人學習的發展,本質上是一部數據采集方式不斷演進的歷史。

最初,機器人只能在實驗室中完成標準任務,數據由少數研究人員在封閉環境中錄制。

隨著具身智能的發展,數據開始走向規模化采集場,遙操作與人機協作帶來大規模機器人數據。

2023年,穹徹智能聯合上海交通大學盧策吾團隊共同發布RH20T,機器人操作數據在中國首次實現系統性的規模化采集。但截至這一時期,機器人數據采集依然主要依賴預設場景。

2024年,斯坦福大學推出的UMI讓采集設備更加輕量和簡單,數據采集開始轉向“自然發生”。

2025年,穹徹智能推出CoMiner伴隨式數據采集系統,機器人開始走出采集場,進入真實世界,在開放環境中獲取更加多樣、復雜的操作數據

梳理這個過程可以看到,具身數據一步步走出搭建的實驗場景,愈來愈貼近現實。

2026年,RoboPocket的出現,將機器人數據采集,從特定場所與專業系統徹底釋放到整個社會中



手機成為節點,每個普通人可以參與采集。

無可否認,這是一次采集范式從“專業體系”走向“社會化網絡”的轉變。

當然啦,采什么、怎么采、優先級如何,這些都不是由人隨意決定的。

這時候,前端連接真實世界的分散場景,后端連接任務庫、模型訓練與評估系統的RoboPocket,就起到了數據入口與調度中樞的雙角色作用



正因為有這套持續在線的判斷與調度機制,數據采集才第一次具備了真正社會化的前提條件。

數采員可以是每一個普通人,但采集行為始終根據模型需求由數據中樞系統統一牽引調度。

長期來看,會推動具身數據從工具競爭邁向體系競爭。

誰的數據采集流程更早地接入模型反饋、誰的任務設計天然適配訓練目標,誰就能更快積累泛化能力與落地魯棒性。

行業普遍認為具身智能還在上半場,期待著這個領域和大模型一樣,能夠用暴力美學帶來能力涌現。



所有人都在往具身模型里扔更多數據,但真正贏的人,一定率先解決了其它更深層次的問題

既然如此,對想要持續scale up的具身智能行業來說,數據采集從源頭就對齊目標就是一場遲早會發生的機制變動。

因為未來模型之間的差距,很可能就源于數據閉環的建設深度。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
世界上持續最久的軍事同盟!簽了640年還管用,救了葡萄牙3次命

世界上持續最久的軍事同盟!簽了640年還管用,救了葡萄牙3次命

鶴羽說個事
2026-06-09 23:03:52
一個“活著真可怕”的社會是怎樣煉成的?

一個“活著真可怕”的社會是怎樣煉成的?

通往遠方的路
2026-06-10 09:08:29
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
頂著張大長臉,混進央視劇中演女主咋咋呼呼,誰的審美出了問題?

頂著張大長臉,混進央視劇中演女主咋咋呼呼,誰的審美出了問題?

翰飛觀事
2026-06-11 14:32:56
一條裙子炸出2條神回復:直男審美“健康美腿”才是最高贊譽

一條裙子炸出2條神回復:直男審美“健康美腿”才是最高贊譽

生活觀察員啊
2026-06-11 00:14:55
“特朗普來了也得拍”,重慶落地簽一夜爆火

“特朗普來了也得拍”,重慶落地簽一夜爆火

南風窗
2026-06-10 13:03:33
大牛市即將回歸!別等了,現在就可以加倉了!

大牛市即將回歸!別等了,現在就可以加倉了!

新浪財經
2026-06-10 18:09:40
宋珍珍再爆猛料,老登只愿給她 10 萬,還說讓她去物業調監控起訴

宋珍珍再爆猛料,老登只愿給她 10 萬,還說讓她去物業調監控起訴

瀲滟晴方DAY
2026-06-11 14:48:58
想3打1?東沙爆發沖突,海巡署3艦一齊圍攻海警船,對峙34小時

想3打1?東沙爆發沖突,海巡署3艦一齊圍攻海警船,對峙34小時

鐵錘簡科
2026-06-09 14:06:02
吃完嫩的吃老的,山西兒媳出軌公公10年,親自給丈夫生下一個妹妹

吃完嫩的吃老的,山西兒媳出軌公公10年,親自給丈夫生下一個妹妹

莫地方
2026-06-02 00:10:26
等不了了,菲律賓找中國了!此前還不停挑釁中國

等不了了,菲律賓找中國了!此前還不停挑釁中國

魔都姐姐雜談
2026-06-10 18:00:42
馬刺遭尼克斯29分大逆轉!看看籃球界專家們怎么說 裁判偏向馬刺

馬刺遭尼克斯29分大逆轉!看看籃球界專家們怎么說 裁判偏向馬刺

楊仔述
2026-06-11 11:59:57
武漢一男嬰被確診腦癱,父親提議拔管!19年后孩子考上北大

武漢一男嬰被確診腦癱,父親提議拔管!19年后孩子考上北大

莫地方
2026-06-06 01:25:04
“幾十年的血沒清洗過,您覺得干凈嗎?”

“幾十年的血沒清洗過,您覺得干凈嗎?”

中國新聞周刊
2026-06-11 07:22:08
52歲林志玲現身巴塞羅那逛集市,打扮風情萬種,臉部飽滿科技感重

52歲林志玲現身巴塞羅那逛集市,打扮風情萬種,臉部飽滿科技感重

小撇說事
2026-06-11 13:45:58
我國最大遺憾!1994年將領土劃給俄羅斯,如今還能再收回來嗎?

我國最大遺憾!1994年將領土劃給俄羅斯,如今還能再收回來嗎?

談古論今歷史有道
2026-06-10 09:30:09
“高中簽率”新股!惠科股份明日申購發行價10.12元/股,一自然人報出111.53元/股最高價

“高中簽率”新股!惠科股份明日申購發行價10.12元/股,一自然人報出111.53元/股最高價

金融界
2026-06-11 13:03:08
不能錯過!6月11日上午11:30比賽!中央5套CCTV5、CCTV5+直播表

不能錯過!6月11日上午11:30比賽!中央5套CCTV5、CCTV5+直播表

劉哥談體育
2026-06-11 13:18:58
手術一動,人就垮了嗎?醫生:5種病沒必要開刀,別讓無知害自己

手術一動,人就垮了嗎?醫生:5種病沒必要開刀,別讓無知害自己

芹姐說生活
2026-06-09 13:30:59
21歲拍三級片,30歲被出軌,38歲嫁大佬,如今51歲沒孩子被寵為寶

21歲拍三級片,30歲被出軌,38歲嫁大佬,如今51歲沒孩子被寵為寶

傲傲講歷史
2026-05-13 02:40:45
2026-06-11 15:28:49
量子位 incentive-icons
量子位
追蹤人工智能動態
12780文章數 176490關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

大批印度學生高考考卷被"調包" 40萬人申請看掃描件

頭條要聞

大批印度學生高考考卷被"調包" 40萬人申請看掃描件

體育要聞

文班:付出那么多努力,卻把勝利拱手讓人

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

埃安i60 530寧德時代版上市限時煥新價10.36萬起

態度原創

旅游
教育
本地
時尚
軍事航空

旅游要聞

粵看粵美|廣州:金色花海美成童話世界

教育要聞

“Every dog has its day”非狗叫,是莎士比亞400年前的翻身密碼

本地新聞

世界杯還沒開始,蘇超已經火到爆梗

畢業季,為林徽因正名的年輕女孩們

軍事要聞

特朗普召開戰情室會議討論對伊朗軍事行動

無障礙瀏覽 進入關懷版