![]()
作者:彭堃方、呂鑫燚
編輯:呂鑫燚
出品:具身研習社
2026 年數據元年已經成為具身智能為數不多的共識。這份共識并非空喊,而是在具身智能物理世界真實應用里 “算法跑不通、場景不通用” 的現實倒逼而成的必然。
有趣的是,如果說 2025 年“量產元年”更像是本體廠商的口號,以及給市場階段性回饋的成績;那 2026 年“數據元年”則是本體、模型廠商必須解決的產業結構性矛盾。更深層次的差異在于,2025 年本體企業即便暫未量產,仍有技術迭代、產能爬坡的容錯空間。但 2026 年如果廠商沒有打磨出差異化的數據解決方案,始終徘徊在 Scaling Law 的門口,那或許會逐步消耗外界對廠商的耐心。
于是我們可以看到,一場關于數據采集設備的競賽已悄然拉開帷幕。從規模化的應用 VR+手柄遙操作采集本體真機數據,到現在無本體數據采集設備 UMI、Ego,再到基于外骨骼遙操作的真機數據采集解決方案,在真機和仿真的二元對立間劈開了一條新路。其實已經側面說明了一件事,對于數據究竟誰能得到業界認可,業界又真正需要什么樣的數據,一直沒有回答清楚。
從產業發展來看,數據采集的設備競賽,導致本體廠商忙著自建數據采集團隊,模型公司扎堆布局混合數據生成引擎,所有人都試圖用差異化打法改寫 “數據饑渴” 的困境,夯實自身的數據壁壘。
但這場狂歡真的能解渴嗎?ALL IN 數據的廠商們,究竟是被行業焦慮裹挾的跟風者,還是真正抽絲剝繭找到了底層痛點的破局者?
我們暫且不提那些老生常談的數據問題,單從最近的大動態來看,2025 年末 Generalist 27 萬小時數據炸場具身智能,看起來好像是 Scaling law 時刻已至,但不乏有業內聲音認為其底色是一場“暴力美學”。
畢竟,規模和豐富只是數據饑渴的原因之一,精細化和高質量也是解決問題的充分必要條件。數據饑渴的本質,從來不是 “缺數據”,而是 “缺有用的數據”。這才是具身數據元年的關鍵,不是 “堆規模”,而是 “找對路徑”。
那么,當我們拋開焦慮情緒,具身智能數據真正的核心拷問才剛剛浮現。
![]()
坦白說,不少人尚未意識到“數據是為場景服務的”。
很多人看待數據金字塔存在謬誤,始終覺得數據最難得但最好用的是真機數據,但事實上,數據金字塔其實是動態的,并非一成不變,取決在什么場景解決什么問題。
就像即將完成IPO“大考”的王興興在西門子首屆科技峰會上所說,“我們公司和業內,能用仿真環境、仿真訓練解決的,盡可能用仿真解決,因為速度快、成本低,可以調整一些參數”,這在人形機器人走、跑、打拳常見。而他坦言,“機器人做‘操作’相關的動作,靠仿真做得還不夠好,全球范圍內還是靠真人采集數據去訓練”,當然真人采集也面臨搭建環境有限、成本高等痛點。
從王興興的話中,其實可以看出他對數據的取舍,即始終要從數據本身的“可供性”出發,并從場景的驗證中得到實踐反饋。企業想要知道缺什么類型的數據,不是廠商在實驗室里猜出來的,而是在真實場景中找到的。
所以,通過場景來看,無論是互聯網數據還是少量真機+仿真形成的海量數據,都能讓具身智能機器人完成“大開大合式”動作。這些數據支撐了機器人從實驗室走進物理世界,但距離我們想要的生產力仍有一段距離。
互聯網視頻數據缺失力覺、觸覺反饋,仿真數據難以還原不同材質的物理特性(如布料的柔軟度、金屬的光滑度),即便是少量真機數據,也多聚焦于本體運動,而非末端操作的細節。但在家庭服務、物流分揀、工業制造的大部分生產力場景中,都需要“本體運動+大量的末端操作”。換句話說,今天數據的核心訴求,可以聚焦到末端執行器上,尤其是有著復雜的“指間功夫”的靈巧手。
![]()
現在從國外呼聲最高的特斯拉、Figure 都已經證實,二者的機器人在真正落地時,靈巧手干活參與度并不高,很多還是徒有“手”,卻干著“夾爪”的活。
但遺憾的是,這類數據無法通過 “暴力采集” 獲得。與通用場景數據不同,靈巧手數據具有極強的場景特異性:同樣是 “抓取” 動作,抓取玻璃制品與抓取橡膠零件的力控曲線完全不同;同樣是 “擰動” 動作,手動螺絲刀與電動螺絲刀的操作邏輯存在本質差異。這意味著,廠商必須深入具體場景,通過一系列數采設備采集 “針對性數據”。這也正是其稀缺性的核心原因。
這場數據補位戰,本質是從 “泛化數據堆砌” 向 “場景化精細數據深耕” 的轉型,而靈巧手數據的儲備厚度,將直接決定機器人的生產力邊界。
![]()
當下業內已經意識到靈巧手數據采集的重要性,下一步就落在了如何采集更準確的數據。
目前看到的數據采集設備競賽已至。除了仍在擴張的真機數采廠之外,現在 UMI、Ego、外骨骼也異軍突起,都在用低成本、高效率的方式破局。
當前 UMI 主要聚焦于機械臂末端的操作數據采集,也因此 goub 器 goub 以覆蓋機器人全身協調動作,以及大多是兩指夾爪作為末端專注于夾爪類任務,這使其在需要全身交互的場景中應用受限。
但對于聚焦單一操作任務的中小企業而言,UMI 仍是當前階段 “成本與精度平衡” 的最優解之一;由此衍生出解決機器人全身協調動作的解決方案 Ego,但是 Ego 也出現依賴強大的算法后端做完成多維重建和數據對齊的難題,并且兩者在數據采集中更偏向提供海量數據用于預訓練,數據質量問題堆砌到后期,而這個階段會付出很高的成本。
![]()
而且,目前看 UMI 和 Ego 這兩類數采設備逐漸開始強綁定,比如鹿明機器人、簡智機器人都相繼在UMI之后推出Ego數采設備,并相互支持、配合使用。業內將這二者采集的數據視為互補的信息來源。
但如果只到這一步,仍不見得能夠解決靈巧操作的難題。一方面 UMI 局限于夾爪形態,另一方面 Ego 這類以自我為中心的人類數據雖然有很強的擴展性,但亞毫米的手指位姿和觸覺數據仍存在缺失。這使得 UMI、Ego 甚至其組合都難以讓機器掌握精細操作技能。
所以,我們會看到更多關乎“靈巧末端”的數據采集新硬件,例如近期智在無界(BeingBeyond)正式推出的 U1,全球首款 Real DexUMI,深受 UMI 范式影響,將靈巧手硬件、本體交互接口、動態追蹤與觸覺感知整合在同一系統中,用自己的手自然地操控另一只手;還包括靈巧智能 DexCap 外骨骼數據采集系統,它實現了人體上肢及腰部的全維度動態捕捉,在常規視覺遙操的基礎上,增加了手部端有震動力覺反饋,為靈巧手產品開發提供了好用、可靠的數據來源。
當然,靈巧智能不是概念先行,早在 25 年上半年,業內還未意識到末端操作數據重要性時,其已在用外骨骼路徑做規模化采集。如今接近一年技術迭代后,在 UMI、Ego 引起廣泛熱議之際,再談起這一設備并非“技術考古”,而是見證其穿越技術周期,仍以必要性存在于前沿數據采集中,落在產業發展的實處。
此外,當前末端操作的數據采集技術路線五花八門,除了UMI、Ego、外骨骼,還包括光學動捕、慣性動捕、IMU/量子傳感/光纖/彈性傳感的數據手套等都可以采集末端數據,但是經過市場驗證,這些手套更適用于中低精度和弱磁場環境,且數據在后期處理成本極高,目前的技術發展條件下,規模化潛力有限。
總之,這場設備競賽的終局,從來不是 “誰取代誰”,而是 “誰能更好地融入協同生態”。外骨骼設備憑借力覺觸覺復刻、長期穩定輸出、數據標準化的三重核心優勢,成為靈巧手精細化數據采集的 “剛需配置”;UMI 與 Ego 則以高效、低成本的特點,承擔規模化數據積累的角色;各類數據手套也在技術蟄伏。
必須強調,設備和數據更多時間不是“排他性”的,相反更應該嘗試有效結合。
![]()
一個比較有意思的現象是,一方面具身智能產業鏈在逐步完善,以前大體分為本體、大腦兩個陣營,現在已經跑出深耕數據的獨角獸。一時間,市面上人人都有數據,人人都想占山為王。
但數據話語權應該給誰?
答案是擁有硬件的人,無論是本體還是模型還是數據廠商,誰更懂數據采集的硬件,誰才有話語權。
數據采集從不是簡單的 “記錄動作”,而是要讓物理世界的操作精準轉化為數字世界的可用資產,這背后離不開硬件的三大核心支撐:數據維度,數據質量,數據處理成本。
數據維度要求數據采集到的信息是足夠豐富的,如果數據維度不夠豐富,會讓模型在訓練中大量去“猜”,最終是無法收斂。數據質量,則某種程度上決定了模型吃的是粗糧還是細糠,“吃的粗”模型就長得“糙”,干不來精細活。
最后是數據處理成本,也指“全鏈路處理成本”,即數據采前、采后的管線建設、人員培訓、數據清洗、算法映射等一整套“工業產線”式的成本。這幾者,共同決定了數據采集的成功與否。
目前看,不少數采企業在這些環節上普遍未掌握全要素。但也涌現出一些廠商和設備的理念考慮到了數據的“維度、質量與處理成本”。
![]()
圖片來源:靈巧智能 DexCap 演示視頻 (2X Speed)
以靈巧智能的 DexCap 系統為例,其具備了這是三大核心支撐。“全維度動態捕捉”,涵蓋手和雙臂及腰部多維度數據,這相比只聚焦末端數據來說信息豐富度暴增。再者像“千赫茲響應和觸覺感知增強”確保虛擬操控與真實動作 1:1 映射,絲滑且真實。當然外骨骼設備硬件還具備高耐用性,長期采集過程中精度無衰減,數據質量持續穩定。此外,設備輸出數據格式統一、維度完整,為后續標注、清洗與復用提供便利,助力構建可持續迭代的高質量數據集。
并且必須要強調的是,靈巧智能是知名靈巧手本體廠商,尤其是在高自由度靈巧手方面,成果顯著。它離“手”最近,其最懂靈巧操作的數據該長什么樣。
所以回過頭看,數據話語權的爭奪,核心是對 “物理世界數字化入口” 的掌控。本體廠商通過硬件的輕量、高效、協同創新,構建了數據采集的底層基礎設施,讓高質量數據的規模化生產成為可能;而靈巧智能則依托這一基礎設施,將數據價值轉化為真實可用的操作能力,形成 “硬件賦能數據,數據驅動智能” 的正向循環。
這也正是具身智能產業的核心邏輯:誰掌握了硬件這一數據采集的 “第一觸點”,誰就掌握了整個產業的發展主動權。
結語:數據元年真正的含義
其實回到數據元年這個背景中來看,“數據元年”并不單指數據突然陡增,而是意味著行業開始意識到:數據生產本身就是核心能力。
在互聯網時代,數據往往被動產生;而在具身智能時代,數據必須主動制造。這使得數據不再那樣唾手可得,進而我們必須面對的現實是,它更像一種與硬件深度綁定的工業產出。誰擁有設備,誰控制部署,誰理解場景,誰才能穩定地生產高價值數據。
在具身智能的世界里,真正稀缺的從來不是數據本身,而是穩定產出高價值數據的能力。通過靈巧智能的案例來看,誰離真實數據更近,并建立穩定、高質量、可擴展的數據生產體系,誰就更有可能在未來競爭中占據優勢。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.