中國深圳2026年4月21日-- 當行業還在討論模型,真正決定具身智能上限的競爭,已經轉向數據基礎設施。
近日,戴盟機器人聯合Google DeepMind、中國移動、新加坡國立大學、香港科技大學、北京大學、清華大學等多家全球頂尖學術機構與產業伙伴,正式發布全球最大規模含觸覺的全模態物理世界數據集Daimon-Infinity。
![]()
這并不是一次普通的數據集發布。更準確地說,這是具身智能產業從"能力驗證"走向"基礎設施建設"的一個標志性節點。
按照規劃,Daimon-Infinity將于年內形成數百萬小時級數據規模,覆蓋家庭、戶外、工業、公共服務等多個真實場景,融合觸覺、視覺、動作軌跡、執行動作、語音文本等多維信息。其中,10000小時高質量數據已率先開源,上線當日即被阿里魔搭社區置頂熱推。
如果說過去行業爭論的核心是"什么模型更強、什么本體更優",那么今天一個越來越清晰的共識正在形成:決定具身智能能否真正走出實驗室、進入復雜現實世界的,已經不只是模型本身,而是高質量、規模化、可持續生產的物理世界數據。
Daimon-Infinity的意義,不只是"又一個數據集"。它更像是在具身智能時代,提前卡位一張真正稀缺的牌:數據底座、訓練燃料和生態接口。
這件事為什么重要?因為它同時踩中了具身智能當前最關鍵的三個點:物理交互、真實場景、持續生產能力。
一,缺乏物理交互,具身智能走不遠
過去很長一段時間,具身智能主要依賴視覺模態。但在真實物理世界里,機器人面對的不是干凈、標準、無遮擋的環境,而是充滿反光、遮擋、形變、摩擦、滑移、不確定接觸的復雜場景。僅靠視覺,機器人可以完成識別和定位,卻很難真正完成穩定、精細、可泛化的操作。
而觸覺,恰恰補上了這一層最關鍵的反饋。它讓機器人不僅知道"物體在哪里",更知道"是否接觸""接觸是否穩定""是否正在滑移""材質是軟是硬""紋理和形變如何變化"。
這背后不是一次傳感器升級,而是一次能力范式的切換:機器人開始從"看見世界",走向"接觸世界、理解世界、操作世界"。
這也是 Daimon-Infinity 最核心的價值之一。市場上不少數據集也會標注"含觸覺",但深挖之后會發現,很多仍停留在單一力覺或低維觸覺層面;而 Daimon-Infinity 引入的是真正意義上的高密度全模態觸覺數據,覆蓋接觸形變、滑移趨勢、接觸狀態、物體紋理、軟硬程度、材質特征等十余種關鍵物理信號,能夠更完整地還原真實物理交互過程。
![]()
這條路線并不是概念先行,而是建立在戴盟長期積累的技術能力之上。團隊孵化于香港科技大學,以視觸覺技術為核心壁壘,將復雜觸覺信息轉化為更適配模型學習的圖像化表達,大幅降低具身模型理解物理交互的門檻。
從效果上看,觸覺的加入并非邊際優化,而是顯著提升:經驗證,使用Daimon Infinity對具身模型進行預訓練時,僅需約十分之一的數據量,即可在精細操作任務中達到更優效果,訓練效率提升10倍。這也意味著,真正高價值的數據,不是簡單堆量,而是能顯著提升模型學習效率的數據。
二、真正稀缺的,不是數據量,而是持續生產真實世界數據的能力
今天很多團隊都認同"數據重要",但真正的分水嶺并不在認知層,而在供給層。
過去,具身數據采集高度依賴封閉式數采廠。這類模式的問題很明顯:成本高、場景窄、重復度高、環境過于標準化。它可以生產"整齊"的數據,卻很難生產真正對現實泛化有價值的數據。而具身智能最需要的,不是高度重復的理想樣本,而恰恰是那些來自真實環境、真實任務、真實人類操作中的復雜長尾數據。
Daimon-Infinity的另一個關鍵點,在于戴盟構建了全球最大規模的外發式數據采集網絡。通過自研的輕量化、便攜式采集設備,數據采集被從封閉場地中釋放出來,進入家庭、戶外、工廠、教育、公共服務等更廣泛、更復雜,也更非標準化的真實場景。
![]()
這帶來的意義,不只是"多了一些場景",而是直接改變了數據供給機制, 是一種典型的基礎設施型能力。因為一次性做出一批數據,并不構成長期優勢;真正構成長期優勢的,是建立起一個能穩定、持續、低成本地產出高價值數據的系統。數百萬小時級的數據規劃,其真正的分量也在于此。它代表的不是一次發布的體量,而是一個已經開始成型的數據生產網絡。
三、從原始采集到模型可用,中間隔著真正的門檻
具身智能的數據難點,從來不只是"采到",而是"能不能用"。當觸覺加入后,數據處理難度會顯著上升:如何將觸覺與視覺、動作軌跡、語言指令等多模態信息在時間軸與空間軸上精準對齊,如何把真實世界中的接觸狀態、滑移變化、操作過程轉化為模型真正可學習的訓練樣本,這需要一整套復雜的數據處理管線。
擁有海量原始數據,并不等于擁有高質量訓練數據。真正的差異,體現在后端的數據處理、融合、標注、重建與結構化能力上。這也是戴盟與阿里云聯手的關鍵意義——雙方共同打造"頂級數據 × 頂級算力"的全鏈路數據處理引擎,將大規模原始數據轉化為可供具身模型高效吸收的有效數據,實現多模態的高精度融合,把真實物理交互過程嵌入到每一幀數據之中。
![]()
從產業角度看,這意味Daimon-Infinity的競爭力并不只是前端采集能力,而是已經開始形成"采集—處理—訓練—開源—生態反饋"的完整閉環。一旦閉環形成,數據將不再是靜態資源,而是會不斷復利的動態資產。
四、開源的意義,不只是共享資源,而是加速形成行業標準
此次數據集由戴盟主導,聯合多家全球頂尖高校、科研機構與產業伙伴共同參與,本質上已經超越了一家公司單點產品發布的范疇。這更是集產業與學術之力,共同推動一套新的數據標準和協作范式。
由此可見,在任何一個新產業周期里,真正能放大價值的,從來都不只是單點產品能力,而是能否占據底層基礎設施、關鍵標準和生態組織位置。
從這個維度看,Daimon-Infinity 的想象空間,顯然已經超出了"數據集"本身。它不是一個孤立的數據產品,而是戴盟在具身智能時代提前鋪設的一條核心主干道——連接真實世界、模型訓練、場景泛化與產業落地的那條路。從具身產業發展的視角來看,Daimon-Infinity的價值就不再只是"數據很多",而是它開始成為機構共同依賴、推動行業往前走時繞不開的基礎能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.