網易首頁 > 網易號 > 正文 申請入駐

Robo 科普| VLA剛成主流就遭遇“世界模型”挑戰?

0
分享至


“理解世界,并非模仿。”

編輯|云瀾

出品|Robo Venture

在過去的2025年,VLA(視覺-語言-動作模型)幾乎是具身智能的“唯一答案”。特斯拉、Figure、智平方、自變量——所有明星玩家都沿著這條端到端路線狂奔。

但這個標準答案的生命周期,比想象中短得多。

3月底,塔夫茨大學一篇論文在圈內炸開。漢諾塔任務上,神經符號模型(NSM)以95%的成功率碾壓VLA的34%;當任務升級到從未訓練過的4塊版本時,VLA全軍覆沒,而NSM依然保持78%。更讓資本后背發涼的是VLA微調消耗的能量是NSM訓練的近100倍。



VLA與NSM實驗比較(清華大學數據科學研究院數據派)

如果說學術數據還只是預警,那么產業巨頭的動作則徹底把路線之爭推到了臺前。4月2日,英偉達發布物理AI模型Cosmos和GR00T,明確將“世界模型”作為下一代具身智能的核心方向。幾乎同時,Google DeepMind與波士頓動力深度合作,將Gemini Robotics植入Atlas機器人。

一邊是神經符號模型擊穿VLA的泛化短板,另一邊是英偉達、DeepMind重注世界模型。具身智能正站在技術路線的十字路口。VLA的端到端范式能否進化出真正的推理能力?還是必須回歸符號邏輯與神經網絡的融合路線?

#01

學術之爭還是生存之爭

這場路線之爭的導火索,來自塔夫茨大學團隊的一篇論文。在經典的漢諾塔任務中,研究團隊設計了一場“公平對決”:一方是當前最先進的開源VLA模型π0,另一方則是結合了PDDL符號規劃與擴散策略的神經符號模型(NSM)。結果則是3塊任務上,NSM成功率高達95%,而VLA僅為34%;當任務升級到從未訓練過的4塊版本時,VLA全軍覆沒,NSM仍然保持了78%的成功率。

更耐人尋味的是數據效率的差距。VLA消耗了300個完整的漢諾塔軌跡進行訓練,而NSM只用了50個簡單的“堆疊”演示,從未見過完整的漢諾塔求解過程。與此同時,VLA微調消耗的能量是NSM訓練的近100倍,這篇題為《The Price Is Not Right》的論文將于5月在維也納國際機器人與自動化會議上正式發表。

學術研究還只是預警,產業巨頭的密集動作則把路線之爭推向了臺前。

4月2日,英偉達在GTC大會上發布Cosmos 3和GR00T N1.7,明確將世界模型作為下一代具身智能的核心方向。幾乎同時,Google DeepMind與波士頓動力達成深度合作,將Gemini Robotics模型植入Atlas機器人——這等于給行業畫了一條明確的路線。


學術派同樣在行動。李飛飛的World Labs完成10億美元新融資,推出3D世界模型Marble;楊立昆的AMI Labs種子輪超10億美元。另一邊,VLA路線的玩家也沒有停下:Figure AI推出第二代Helix 02,智平方手握近5億元工業訂單,元戎啟行VLA已上車近10萬輛。有趣的是,英偉達在定義GR00T N1.7時,同時使用了“VLA”和“世界模型”兩個標簽,他不認為二者互斥,而是在同時押注兩條路線,甚至試圖把它們縫合在一起。

#02

“世界模型”好在哪里

簡單來說,世界模型是智能體為了理解和預測環境而構建的內部表征。一個訓練好的世界模型,不僅能預測“下一個畫面”是什么,更能理解一個球被拋出去會如何下落,機器人手臂抬起杯子時液體是否會灑出。這正是Yann LeCun反復強調的核心,只有具備了像人類一樣“預測未來”的能力,AI才能進行復雜的規劃。

對比VLA與“世界模型”,則會看到VLA的底層邏輯是“看多了就會做”,通過海量真實數據學習從感知到動作的端到端映射。而世界模型的底層邏輯則是“想明白了再做”,先在大腦中理解世界的運行規律,再據此規劃行動。


對比VLA與世界模型

從技術本質上看,VLA集成了視覺感知、語言理解和動作生成,將感知輸入直接映射為控制動作,類似于模仿人類“看到→理解→行動”的過程,但被認為缺少對物理世界的結構化理解。而世界模型則從感官數據中學習和預測運動、力以及空間關系等動態特性,從根本上理解物理世界中事物的性質、運行規律和空間特性。

在泛化上, VLA面對未見過的場景變體時極易失效;但世界模型由于掌握了底層規律,在面對新場景時能夠舉一反三;數據策略中,VLA嚴重依賴昂貴且稀缺的真機數據,這類數據由人工操作機器完成采集,而世界模型更多轉向互聯網上的圖像和文字數據,這些數據記錄了大量的物理規律。英偉達Cosmos WFM的核心價值恰恰在于加速合成數據生成,并將其作為后訓練的基礎,開發下游物理AI模型來解決訓練數據不足的挑戰;在模擬與訓練效率上,世界模型就像一個高效的“數據引擎”和“思維預演器”,能讓機器人在虛擬世界中以10到100倍的效率進行學習和自我進化,大幅降低真實數據采集的成本和時間。

似乎世界模型在眾多方面都優于VLA?難道VLA路線就這樣被堵住了嗎?

競爭的本質和未來入場券

但兩條路線的商業化節奏,似乎不在同一個時鐘上。

VLA路線的邏輯是“先跑起來”。Figure AI的Helix 02、智平方的GOVLA、元戎啟行的量產上車,都是在工業制造、物流分揀、輔助駕駛等“環境相對可控、任務模式固定”的場景中率先落地。這條路的優勢在于短期可見的收入和訂單——智平方手握近5億元工業訂單,元戎啟行VLA已上車近10萬輛。對投資人來說,這是看得見的現金流和ROI。

世界模型路線的邏輯則是“先想明白”。極佳視界用世界模型生成了90%以上的訓練數據,讓機器人在虛擬世界中以10到100倍的效率進行學習;流形空間的WorldScape模型則致力于補齊世界模型落地到物理AI的最后一塊拼圖。這條路的前期投入大、商業化周期長,但一旦跨過能力閾值,泛化能力的邊際成本趨近于零。

和當下的爭論類似,大語言模型也經歷過選擇押注的尖峰時刻。Minimax的創始人閆俊杰在2023年力排眾議押注MoE架構,經歷了兩次失敗后第三次才成功。試驗成功讓Minimax實現用OpenAI 1%的成本實現了95%的性能,破解了高性能、低成本與商業化的三角難題。而后,Minimax被貼上了國內首個MoE大模型標簽,在大規模商業化部署上也實現了突破,這種極低的訓練和推理成本讓市場擴張獲得很大的比較優勢,也造就了海外收入占比超70%的結果。后來,Minimax C輪融資近3億美元,在2026年1月港交所上市,截至4月7日收盤,市值2978億港幣。MoE架構已成為行業共識,取代了稠密架構。


本體企業靠量產規模撬動飛輪,重腦企業靠模型和數據構筑壁壘,兩者“是完全相悖的商業邏輯”。用同一把尺子去丈量兩種不同路線的公司,本身就是一種誤讀。

2026年將是具身智能公司從“技術研發導向”轉向“企業經營與運營能力”的關鍵一年。無論是選擇VLA、世界模型還是融合路線,最終都要回到一個核心命題——你的技術能否在真實場景中創造真實價值。

對于VC,這是一個考驗技術判斷力而非跟風能力的時刻;對于創業者,這是一個考驗戰略定力與場景洞察能力的時刻。

路線或許沒有絕對的對錯,更重要的是場景與能力的匹配。

更多干貨分享敬請關注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環提出:我想回家

1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環提出:我想回家

華人星光
2026-04-20 09:59:15
炸翻全球軍界!沙特怒砸120億買斷中國神裝,美軍徹底被踢出局

炸翻全球軍界!沙特怒砸120億買斷中國神裝,美軍徹底被踢出局

風信子的花
2026-04-21 14:31:44
致敬傳奇!王治郅正式入選國際籃聯名人堂,諾維茨基一同入選

致敬傳奇!王治郅正式入選國際籃聯名人堂,諾維茨基一同入選

懂球帝
2026-04-21 20:06:06
外院縫合被同行怒批:瞎胡鬧,游醫水平!一個真讓做,一個真敢做

外院縫合被同行怒批:瞎胡鬧,游醫水平!一個真讓做,一個真敢做

新浪財經
2026-04-22 12:10:58
10大天規,不可打破,君子知命不算命!

10大天規,不可打破,君子知命不算命!

神奇故事
2026-04-20 19:27:24
突發:Claude Code把Pro用戶「踢」了

突發:Claude Code把Pro用戶「踢」了

AppSo
2026-04-22 07:49:03
男女同居后,大部分女性通常忍受不了男性這些行為

男女同居后,大部分女性通常忍受不了男性這些行為

阿凱銷售場
2026-04-22 11:44:56
又一個五常國,做出瘋狂決定,比日本都狠!俄羅斯:打的就是你

又一個五常國,做出瘋狂決定,比日本都狠!俄羅斯:打的就是你

揚子的故事屋
2026-04-22 10:58:16
決勝局53-17領先被翻!25歲范爭一9-10出局 43歲墨菲死里逃生狂歡

決勝局53-17領先被翻!25歲范爭一9-10出局 43歲墨菲死里逃生狂歡

風過鄉
2026-04-22 07:20:02
太陽:只要格林,一切關于申京的交易都免談!亞歷山大式交易再現

太陽:只要格林,一切關于申京的交易都免談!亞歷山大式交易再現

呀古銅
2026-04-22 10:33:48
郭士強現場考察,個人認為三名球員應進國家隊,21歲小將上榜

郭士強現場考察,個人認為三名球員應進國家隊,21歲小將上榜

男足的小球童
2026-04-21 18:16:37
馬刺主帥:目前只知道文班是腦震蕩,我們會采取正確的步驟處理

馬刺主帥:目前只知道文班是腦震蕩,我們會采取正確的步驟處理

懂球帝
2026-04-22 12:20:02
驚天內幕!中國專家揭露美國攻打伊朗的真正目的,竟然是這個!

驚天內幕!中國專家揭露美國攻打伊朗的真正目的,竟然是這個!

橙色書卷
2026-04-18 22:56:03
伯納烏不留舊人!皇馬高層拒絕穆里尼奧執教,巔峰已成過去時

伯納烏不留舊人!皇馬高層拒絕穆里尼奧執教,巔峰已成過去時

體育閑話說
2026-04-21 21:48:20
四川省教育廳新任命副廳長!

四川省教育廳新任命副廳長!

創作者_1494406553502
2026-04-22 11:22:00
鬧翻了!遼籃更衣室內訌,趙繼偉深夜2文“炮轟” 弗格打臉管理層

鬧翻了!遼籃更衣室內訌,趙繼偉深夜2文“炮轟” 弗格打臉管理層

小徐講八卦
2026-04-22 05:45:02
齊沃整活被痛批!恰爾汗奧盧獨造3球力挽狂瀾,國米3-2絕殺科莫

齊沃整活被痛批!恰爾汗奧盧獨造3球力挽狂瀾,國米3-2絕殺科莫

釘釘陌上花開
2026-04-22 05:00:39
西班牙打響“反以”第一槍后,匈牙利新總理:內塔敢來,必被逮捕

西班牙打響“反以”第一槍后,匈牙利新總理:內塔敢來,必被逮捕

墜入二次元的海洋
2026-04-22 09:53:44
近10年崩得最狠的專業:從年薪幾十萬到月薪兩千五!

近10年崩得最狠的專業:從年薪幾十萬到月薪兩千五!

燈錦年
2026-04-21 13:28:31
43歲李宗偉談羽聯改革:若改用15分制,說不定我也會復出

43歲李宗偉談羽聯改革:若改用15分制,說不定我也會復出

懂球帝
2026-04-22 10:47:23
2026-04-22 12:52:49
極新 incentive-icons
極新
我們是垂直于企服和硬科技的創投和行業研究媒體,致力于陪伴和記錄科技企業進步和產業成長。
1164文章數 5關注度
往期回顧 全部

科技要聞

凌晨突發!ChatGPT Images 2.0發布

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

汽車要聞

四款全球首秀+AI落地 大眾汽車集團在華轉型全面提速

態度原創

游戲
親子
數碼
房產
藝術

預計680元起 黑旗RE典藏版內容曝光!雕像等超多好禮

親子要聞

管不住,一身的反骨

數碼要聞

官宣!追覓硅谷發布會定檔,4月27日-30日登陸北美

房產要聞

狂搶284輪!中海海口再拿重磅宅地!

藝術要聞

無花不風景

無障礙瀏覽 進入關懷版