![]()
黃仁勛一針見血地指出,沒有真實世界的數據,具身智能只能是幻覺。
2026 年春晚,一群機器人在臺上翻跟頭、打功夫,贏得滿堂彩。但換一個環境,這些活靈活現的機器人,可能連礦泉水的瓶蓋都擰不開。聚光燈之外,一個本質問題始終懸而未決:機器人什么時候才能像人一樣,真正學會做事?
先說清楚,關鍵問題不在硬件。這些年,機械層面的進步有目共睹。真正的瓶頸,在于數據。
為什么具身智能如此 “缺數據”?這是其技術內核決定的。無論是計算下一個詞,還是下一個動作,本質上都是概率預測。對人類來說,擰瓶蓋是出于本能的肌肉記憶。
對機器人而言,卻需要分步驟拆解:第一步是看見,認出這是個瓶子,識別材質。第二步是決策,判斷是往左擰還是往右擰、用多大勁、手要抓哪里。第三步是執行,觸覺實時反饋、算法實時處理、電機實時響應。第四步是驗證,成功需要一個明確信號、可能是 “咔噠” 一聲。
![]()
每一個環節,都需要海量的、來自物理世界交互的數據。為了解決數據饑渴,行業摸索出四條路徑。
第一條路是遙控操作。由操作員手把手操控機器人采集數據。這種方式精度最高,但成本也最高。第二條路是靈巧手采集。通過觸覺傳感器,精準記錄人手的精細動作,為精密裝配提供關鍵數據。
第三條路是仿真。通過數字模型生成數據,優勢是成本低、速度快、規模大。第四條路是純視覺。讓機器人通過 “觀看” 視頻學習技能,繞過硬件限制。
這四條路徑各有所長,也各有局限。盡管成果顯著,但當前更多是 “單機、單場景、單任務” 的采集,距離通用具身智能,還有不短的距離。
我們面臨三大困境。首先,跨本體學習障礙:A 型號機器人學到的數據,換到 B 型號身上,可能就不靈了。分體采集割裂:運動控制和 “大腦” 分開訓練,使得機器人難以學習到真正的全身協同。再次,跨場景能力遷移:好不容易學會擰瓶蓋,若要讓它去搬箱子,又得重新學習。
最終,這些機器人只能各自困守于自己的 “數據孤島”,難以互通,孤立進化。
![]()
這些問題交織在一起,反映出當前具身智能數據生態面臨的深層困境:并非某個單一環節出了毛病,而是數據、模型、硬件和場景之間的價值鏈,存在多個斷點。
面對這種系統性難題,單靠企業自發摸索遠遠不夠。國家層面的頂層設計和強力推動,成了破局關鍵。
2024 年,國內首個具身智能數據集行業標準《人工智能具身智能數據采集規范》發布,數據標準化正式上升為頂層戰略。
國家級訓練場、行業開源社區、企業數據平臺三方同時發力,數據標注開始走向標準化、體系化、規模化。眼下,多地數據標注基地已經在 “搶跑” 通用型數據集的構建。
如今,我們已經處在一個關鍵節點。唯有筑牢數據生態基礎,讓模型、硬件等要素齊頭并進,才能抵達通用具身智能的彼岸。一場關于數據的戰役,才剛剛打響。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.