網易首頁 > 網易號 > 正文 申請入駐

物理AI時代核心“賣鏟人”:數據采集是機器人下一個風口?

0
分享至

人工智能的底層邏輯正從大語言模型的“語言理解”轉向世界模型的“預測世界”。在這一躍遷中,物理數據的質量與采集能力成為發展核心。作為解決世界模型與具身智能“數據燃料”問題的關鍵,具身數據采集正開啟下一代數據基建浪潮。

國泰海通最新報告指出,具身智能發展的最大障礙已不再是算法,而是數據缺口。其對數據的需求量呈指數級膨脹,遠超傳統AI模型。在這一背景下,能夠率先填補數據缺口的數據供應商與基礎設施商,將作為物理AI時代的“賣鏟人”,占據產業鏈核心價值節點,有望享受顯著的估值溢價。

技術路線上,真實數據、仿真/合成數據、視頻數據各有利弊:純真實數據成本過高,純仿真數據存在“Sim2Real”(仿真到現實)鴻溝。未來主流路徑逐漸清晰:仿真/視頻數據用于大規模預訓練 + 真實數據用于微調與強化學習。

隨著主流技術路線日漸清晰,資本正加速涌入數據采集工具鏈(動捕、遙操作)、視頻數據升維平臺及仿真訓練場——這些數據采集基礎設施,正成為機器人產業真正的風口與“鏟子”生意。

范式轉移:世界模型重塑AI基石,數據需求膨脹至EB級

AI正從“數據相關性”驅動轉向“物理因果性”驅動,2025年已成為世界模型應用落地的元年。具身智能對數據的需求量及復雜度正呈指數級爆發。

傳統神經網絡與大語言模型本質上依賴模式識別與概率關聯,而“世界模型”的核心在于內建物理規律(如重力、慣性),并具備預測時空演化的能力。自2025年起,該領域迎來集中突破:Meta的V-JEPA 2、谷歌的Genie、OpenAI的Sora以及World Labs的RTFM相繼問世。


世界模型將賦能游戲、自動駕駛與具身智能三大核心場景。其中,具身智能的爆發對數據提出了前所未有的苛刻要求。與大語言模型及自動駕駛(PB級數據量、以文本或視覺為主)不同,具身智能需適應形態各異的硬件平臺,數據需求高達EB級,且極度強調物理交互(力覺、觸覺、關節反饋)。目前行業仍處早期階段,預訓練數據極度緊缺,“數據孤島”與異構數據融合難題已成為制約產業爆發的核心瓶頸。



三大主流數據采集方案利弊共存,視頻數據成為業內關注新焦點

構建高效的數據閉環,是具身智能能力躍升的核心。當前,資本與技術主要圍繞三大數據采集方案展開

  • 真實數據(高保真但極度昂貴):通過遙操作、穿戴式動捕等方式直接采集。優勢在于不存在Sim2Real差距;致命短板是成本高、擴展性差,難以覆蓋長尾邊緣場景。


  • 合成/仿真數據(高性價比但存在遷移鴻溝):利用物理引擎在虛擬環境中生成。成本極低且自帶完美標簽,但面臨顯著的“Sim2Real Gap”(動力學、感知、控制等差異),導致模型在真實環境中性能衰減。


  • 視頻數據(來源廣但直接應用難):業內新興焦點,通過升維技術利用海量互聯網視頻。成本低、規模大,但缺乏物理交互屬性(如重力、摩擦力),噪聲大且缺少精確的三維標注。


產業演進趨勢:Generalist AI的GEN-0模型(≥7B參數)已證明,在海量真實交互數據下,模型性能呈冪律增長。在真實數據成本被徹底打下來之前,“仿真/視頻數據預訓練 + 真實數據微調/強化學習”的虛實結合方案將是絕對主流。

與此同時,底層數據基建正在國家力量與開源生態的推動下加速成型:上海落地了全國首個具身智能領域國家級標準化試點(“1+N”模式訓練場),北京建立了首個基于真實場景的數據訓練基地。谷歌、星海圖、傅利葉、智元等紛紛發布開源數據集,中國信通院則牽頭制定了國內首個具身智能數據集質量評價標準。


機器人本體廠商的“數據站隊”與戰略分化

正是由于真實數據成本高、仿真數據存在遷移鴻溝、視頻數據噪聲大,國內外主流機器人本體廠商在數據路線上出現了明顯分化。這一分化,反過來為數據采集基建的方向提供了最直接的產業驗證。

  • 真實數據優先派:認為只有真實交互才能跨越Sim2Real鴻溝。智元機器人在大模型訓練階段100%使用真機真實數據,仿真僅用于工程迭代;自變量機器人在復雜物理交互場景中完全不使用仿真數據;1X Technologies同樣將“大規模真實世界數據”作為核心壁壘。



  • 合成與仿真數據優先派:押注成本與規模。銀河通用采用99%的合成數據配以1%的真實數據進行訓練,試圖以極低成本逼近真實分布。


  • 視頻數據戰略高地:特斯拉、Figure AI等巨頭正加速布局,核心邏輯在于互聯網視頻規模遠超任何單一機器人平臺能采集的真實數據。特斯拉Optimus已放棄早期動捕與遙操作,轉向深挖互聯網視頻;千尋智能Spirit v1的70%預訓練來自互聯網視頻;Figure AI啟動Project Go-Big,探索人類視頻到機器人的零樣本遷移;星動紀元、逐際動力則分別采用“視頻預訓練+真機微調”及多源數據組合策略。



這三條路線的并存恰恰說明:當前尚無單一數據來源能獨立解決具身智能的數據瓶頸。無論最終哪條路線收斂,數據采集工具鏈、仿真平臺與視頻升維技術——即物理AI時代的“賣鏟人”——都將是確定性受益的方向。

數據“賣鏟人”全景圖

隨著具身智能對數據的需求量級與復雜度指數級上升,能夠有效解決數據獲取成本與效率問題的供應商,正迎來一輪估值重估。這一重估覆蓋四個關鍵方向:視頻數據轉化、仿真平臺、多模態硬件采集,以及綜合數據服務。

  • 視頻數據轉化方向:核心突破在于將海量互聯網視頻低成本轉化為機器人可用的訓練數據,部分方案已能將綜合采集成本降至行業平均水平的千分之五以下。

  • 仿真平臺方向:全鏈路合成數據體系以極低成本生成帶完美標注的大規模虛擬數據,并逐步縮小Sim2Real差距。

  • 真實數據采集硬件方向:光慣融合手套、電子皮膚等傳感器結合高質量開源數據集,正在構建高保真底座。

  • 真實數據生態與遙操作方向:大規模自建采集場景與高精度遙操作設備,已成為主流微調數據的重要來源。

在二級市場視角下,綜合性數據服務商通過多元方案(遙操作、動捕、合成數據)建設具身智能數據訓練場與工程化平臺;仿真平臺公司則通過收購整合打通虛實數據壁壘,提供全生命周期物理AI解決方案。

整體來看,無論是視頻轉化、仿真生成、硬件采集還是綜合服務,能夠顯著提升數據“可獲得性”與“成本效率”的供應商,正在從產業邊緣走向估值中樞。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
三星想給每名員工發230萬獎金,不僅被拒絕還可能罷工!工會的理由讓人意外

三星想給每名員工發230萬獎金,不僅被拒絕還可能罷工!工會的理由讓人意外

可達鴨面面觀
2026-05-08 12:03:22
南京經濟技術開發區管委會原巡視員倪德龍接受紀律審查和監察調查

南京經濟技術開發區管委會原巡視員倪德龍接受紀律審查和監察調查

揚子晚報
2026-05-08 15:24:55
國務院一紙令下!六月起強制執行,騎電動車再也不用見警就躲了

國務院一紙令下!六月起強制執行,騎電動車再也不用見警就躲了

今朝牛馬
2026-05-07 20:58:21
5月1日起紅燈右轉全國統一新規:不是不讓轉,是不要再亂轉了

5月1日起紅燈右轉全國統一新規:不是不讓轉,是不要再亂轉了

笑熬漿糊111
2026-05-08 05:47:49
37死1失聯!涉瀏陽"5·4"煙花爆炸事故8名責任者到案!在醫救治51人

37死1失聯!涉瀏陽"5·4"煙花爆炸事故8名責任者到案!在醫救治51人

聲情專遞
2026-05-08 12:22:29
中方宣布無視美國制裁,美媒稱史無前例,魯比奧:或追加二次制裁

中方宣布無視美國制裁,美媒稱史無前例,魯比奧:或追加二次制裁

書紀文譚
2026-05-07 15:11:53
誰是五一“吸金王”?這5座城市讓游客心甘情愿掏錢包

誰是五一“吸金王”?這5座城市讓游客心甘情愿掏錢包

曉栗
2026-05-08 01:08:33
快訊!國際足聯還是低頭了!

快訊!國際足聯還是低頭了!

故事終將光明磊落
2026-05-08 16:00:50
巴西免簽了,但你可能根本去不了

巴西免簽了,但你可能根本去不了

BT財經
2026-05-08 08:24:02
娃哈哈董事長,大婚!

娃哈哈董事長,大婚!

家傳編輯部
2026-05-07 22:11:46
隊長被打進醫院!皇馬更衣室徹底失控,內亂不止顏面盡失!

隊長被打進醫院!皇馬更衣室徹底失控,內亂不止顏面盡失!

田先生籃球
2026-05-08 08:16:44
瀏陽煙花廠爆炸37人死亡,湖南省委書記召開調度會,現場全體默哀;芒果TV宣布《親愛的·客棧2026》《乘風2026》《你好,星期六》推遲播出

瀏陽煙花廠爆炸37人死亡,湖南省委書記召開調度會,現場全體默哀;芒果TV宣布《親愛的·客棧2026》《乘風2026》《你好,星期六》推遲播出

大風新聞
2026-05-08 14:15:10
三亞“4只皮皮蝦1035元”店主事發次日去世,年僅43歲,留下兩個孩子;家人稱其事發前已腦出血,店鋪收到威脅電話,不打算繼續開業

三亞“4只皮皮蝦1035元”店主事發次日去世,年僅43歲,留下兩個孩子;家人稱其事發前已腦出血,店鋪收到威脅電話,不打算繼續開業

大象新聞
2026-05-08 13:46:04
保住納稅人的錢!美國防部長宣布采購革命:企業自己掏錢建廠,交不出貨就換人

保住納稅人的錢!美國防部長宣布采購革命:企業自己掏錢建廠,交不出貨就換人

爆角追蹤
2026-05-08 08:22:25
“紙上安全”VS現實噩夢:華為問界產業鏈為何淪為“忽悠型”造車的重災區?

“紙上安全”VS現實噩夢:華為問界產業鏈為何淪為“忽悠型”造車的重災區?

SmartHey
2026-05-08 10:10:02
中央決定:陳揚帆任中國移動董事、總經理、黨組副書記

中央決定:陳揚帆任中國移動董事、總經理、黨組副書記

界面新聞
2026-05-08 17:51:43
36歲名校海歸博士求職無門:不上班最難受的不是沒錢,是精神失重

36歲名校海歸博士求職無門:不上班最難受的不是沒錢,是精神失重

三言四拍
2026-05-08 09:01:06
國乒5月8號賽程很強,王皓提拔3人,向鵬王楚欽林詩棟挑大梁

國乒5月8號賽程很強,王皓提拔3人,向鵬王楚欽林詩棟挑大梁

阿信點評
2026-05-08 16:16:40
比核彈更致命?伊朗海底7條光纜,扼住全球經濟命脈

比核彈更致命?伊朗海底7條光纜,扼住全球經濟命脈

網易新聞出品
2026-05-07 19:33:27
賴清德返臺后稱臺灣是國家,下令拆除蔣介石像,大陸六字預言結局

賴清德返臺后稱臺灣是國家,下令拆除蔣介石像,大陸六字預言結局

涼了時光人
2026-05-08 09:46:12
2026-05-08 18:56:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
145806文章數 2653493關注度
往期回顧 全部

科技要聞

SK海力士平均獎金600萬 工服成相親神器

頭條要聞

伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

頭條要聞

伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經要聞

輪到豆包收割了?

汽車要聞

智能雙艙大五座SUV 樂道L80將于5月15日正式上市

態度原創

本地
家居
游戲
公開課
軍事航空

本地新聞

用蘇繡的方式,打開江西婺源

家居要聞

流動的尺度 打破家的形式主義

《Darwin’s Paradox!》發布Steam?版本「Community Patch」更新

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:最高領袖穆杰塔巴全面掌控局勢

無障礙瀏覽 進入關懷版