![]()
機器之心發布
WorldArena 世界模型賽道從來都是競爭異常激烈,在經歷了前幾次比賽過程中的放榜之后,CVPR 2026 WorldArena 世界模型賽道鎖定總成績,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下簡稱 GE 2.0)拿下了最終的冠軍,成為了 “強者中的強者”。
![]()
WorldArena 是目前世界模型賽道最權威的榜單,擁有最嚴苛的評測基準,構建了包含 16 項細分核心指標和 3 大真實應用任務的立體評估體系,旨在對具身世界模型的感知精度、物理規律理解、三維空間認知以及動作預測與落地能力進行最嚴苛的考察。由于其極高的學術嚴謹性與行業公信力,WorldArena 吸引了全球幾乎所有頭部世界模型團隊同臺競技。
在該賽道評測中,智元團隊使用了原生的世界模型 GE 2.0,并未針對賽題進行特殊設計優化,僅基于榜單數據進行了基礎微調(Finetune)。“輕裝上陣” 依然拔得頭籌,充分印證了 GE 2.0 強大的通用適配性。面對近期世界模型方向的火熱關注和創業浪潮,智元始終保持自己的節奏,從長遠第一性原理出發 ,專注于打磨具身世界模型的堅實技術底座。此次登頂,是智元堅持長期技術演進的實力見證。
![]()
- 項目鏈接:https://ge-sim-v2.github.io/
- Arxiv:https://arxiv.org/abs/2605.27491
- Github:https://github.com/AgibotTech/GE-Sim-V2
裸考封神
智元 GE 2.0 模型實力登頂
沒有針對 WorldArena 進行特別調優,裸考出戰依然斷層領跑。在 GE 2.0 技術報告中,智元團隊對模型進行了全面的能力剖析。相比上一代模型,GE 2.0 不僅在單點性能上實現了躍升,更真正演進為一個全功能、高可用的世界模擬器,構建可試錯、可迭代、可進化的虛擬仿真環境,讓機器人策略在虛擬場景中自主積累經驗、完成動態試錯,規避真實場景的試錯成本,最終高效遷移至真實物理世界穩定落地,真正實現從 “感知預測” 到 “仿真進化、自主決策” 的閉環升級。
功能矩陣全面補齊:GE 2.0 在功能上首次全面覆蓋了長時序生成、多視角生成、本體狀態生成、近實時推理以及獎勵判別等核心環節,構建了世界模擬器完整的技術能力閉環。
![]()
長時序推演能力突破: 在長時序推理任務中,GE 2.0 表現出極強的穩定性,畫面質量隨推理時長的衰減顯著弱于行業基線方案。即使在連續推演 40-50 秒的長視頻片段時,其生成質量依然超越了基線模型前 10 秒內的表現。
![]()
高可靠的閉環評測:作為世界模擬器,核心在于能否真實反映物理世界。團隊驗證了大量閉環評測結果,證明 GE 2.0 在多項任務上均與真實世界保持著強相關性。這種相關性不止步于宏觀統計意義上的 “成功率一致”,團隊還進行了逐案(Case-by-case)的 rollout 結果對比分析,并通過混淆矩陣(Confusion Matrix)提供了嚴謹的量化佐證,強有力地證明了 GE 2.0 作為策略評測器的可靠性。
![]()
打通數據回流反哺機制:在獎勵模型(Reward Model)的加持下,GE 2.0 能夠對閉環評測的 rollout 過程進行自動化篩選,將世界模型中產出的有效高質量數據精準回流給策略模型(Policy Model)。實驗證明,這一機制在多項任務上均助力策略模型實現了顯著的性能漲點。
![]()
從技術沉淀來看,智元 GE 2.0 的登頂,是長期深耕底層算法、打磨物理 AI 核心能力的必然結果。相較于行業同類模型,該模型實現了全方位技術躍升,不僅補齊長時序穩定推演、多視角精準生成、實時物理還原、閉環獎勵判別等全維度能力,更突破傳統模型 “重視覺、輕物理、難落地” 的行業痛點。即便在 40-50 秒超長時序復雜場景推演中,依舊能保持畫面穩定、物理邏輯精準、空間結構無偏差,生成數據可直接反哺機器人策略模型迭代,真正實現從 “視覺擬真” 到 “物理可信、可用、可落地” 的質變,算法通用性、穩定性、實用性全面領先行業水平。
ALL IN AI
智元定位 “具身智能的基礎模型公司”
區別于行業多數聚焦機器人硬件整機、場景應用或單點技術優化的企業,智元堅定錨定具身智能基礎模型公司核心定位,核心邏輯不在于制造機器人本體,而在于打造支撐整個物理 AI 行業發展的底層基礎設施與通用基礎能力。不同于單點應用技術的迭代,智元深耕通用具身基礎模型,打造可適配全場景、可通用泛化、可自主進化的底層 AI 能力,為機器人的運動、感知、決策、作業提供核心大腦。
今年 4 月,智元連續一周進行了 “ALL IN AI” 智元 AI WEEK 成果發布,完成了開源數據集、開源仿真平臺、基座大模型、世界仿真器、機器人部署應用平臺五大核心維度的完整技術閉環搭建,構建了行業獨一份的 “數據筑基 — 仿真賦能 — 模型進化 — 應用落地 — 生態開放” 全鏈路能力體系,徹底擺脫單點技術短板,成為具身智能領域全能型戰士。
- AGIBOT WORLD 2026:首個系統性覆蓋具身智能全域研究的開源數據集
- Genie Sim 3.0:首個大語言模型驅動的仿真開發平臺
- Genie Operator-2:通用具身基座大模型,定義 “知行合一” 新高度
- Genie Envisioner 2.0:世界模型驅動的環境模擬器
- Genie Studio Agent:面向具身作業場景的零代碼 Agent 應用平臺
當前行業普遍存在數據質量參差不齊、仿真成本高、模型落地難、部署門檻高的痛點,智元通過全棧基礎技術布局,打通了完整價值閉環,解決了制約行業發展的共性底層難題。同時,智元堅持 ALL IN AI 的核心戰略,所有技術迭代均圍繞通用基礎能力升級,而非單一場景定制優化,其技術成果可覆蓋全品類機器人、全行業物理作業場景,具備極強的產業賦能屬性,真正承擔起具身智能領域基礎底座搭建者、行業標準定義者的角色,也是智元能夠拿下世界模型賽道全球總冠軍、持續領跑物理 AI 的核心根源。
真正的通用機器人,離不開硬件本體與智能系統的深度協同,更需要全棧自研的 AI 能力體系作為堅實底座。具身智能的未來,不在于零散的單點創新,而在于可持續進化、可協同放大的系統性能力。從建成全球首個 3000 平方米機器人實景數據采集場地,到推出一站式仿真開發平臺 Genie Sim;從通用具身基礎模型 Genie Operator 1,到實現對物理世界深度理解的世界模型 Genie Envisioner;再到面向全量開發者的具身智能一站式開發平臺 Genie Studio:智元持續構建面向物理 AI 的完整能力底座,打通技術價值閉環,讓每一項 AI 能力都成為推動機器人邁向 “部署態” 的堅實支撐。
錨定 “部署態”
讓具身智能從炫技走向商用閉環
部署態是今年智元在 2026APC 合作伙伴大會上提出來的概念,智元依托全棧技術閉環,實現機器人在真實復雜場景中大規模穩定作業、持續迭代,具備可落地、可復用特質,真正標志著具身智能從技術演示邁向規模化商用新階段。
成功實施 “部署態” 的核心在于底層算法的演進,智元 ALL IN AI 的核心邏輯始終圍繞真實物理世界、真實作業需求、真實商用落地,全部服務于機器人規模化部署:真實場景數據集保證模型適配復雜真實環境;生成式仿真大幅降低試錯成本;基座模型保障作業精準穩定;世界模型提升復雜任務自主決策能力;零代碼平臺徹底解決落地難、復制難、迭代難的產業痛點,實現技術價值到產業價值的完整閉環。
一次裸考登頂,是實力的印證;持續全域領跑,是強者的常態。智元本次登頂 WorldArena 世界模型總分冠軍,是智元長期堅持 All in AI 戰略的成果。算法是未來具身智能產業的競爭核心,只有持續迭代世界模型、基座大模型等核心算法能力,深化虛實融合技術閉環,才能在具身智能這條長跑之路上,不斷引領向前。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.