網易首頁 > 網易號 > 正文申請入駐

剛剛，智元拿下WorldArena世界模型總分冠軍！

2026-05-29 21:54:56　來源: 機器之心Pro

河北舉報

分享至

機器之心發布

WorldArena 世界模型賽道從來都是競爭異常激烈，在經歷了前幾次比賽過程中的放榜之后，CVPR 2026 WorldArena 世界模型賽道鎖定總成績，智元自研的世界模型 Genie Envisioner-Sim 2.0（以下簡稱 GE 2.0）拿下了最終的冠軍，成為了 “強者中的強者”。

WorldArena 是目前世界模型賽道最權威的榜單，擁有最嚴苛的評測基準，構建了包含 16 項細分核心指標和 3 大真實應用任務的立體評估體系，旨在對具身世界模型的感知精度、物理規律理解、三維空間認知以及動作預測與落地能力進行最嚴苛的考察。由于其極高的學術嚴謹性與行業公信力，WorldArena 吸引了全球幾乎所有頭部世界模型團隊同臺競技。

在該賽道評測中，智元團隊使用了原生的世界模型 GE 2.0，并未針對賽題進行特殊設計優化，僅基于榜單數據進行了基礎微調（Finetune）。“輕裝上陣” 依然拔得頭籌，充分印證了 GE 2.0 強大的通用適配性。面對近期世界模型方向的火熱關注和創業浪潮，智元始終保持自己的節奏，從長遠第一性原理出發，專注于打磨具身世界模型的堅實技術底座。此次登頂，是智元堅持長期技術演進的實力見證。

項目鏈接：https://ge-sim-v2.github.io/
Arxiv：https://arxiv.org/abs/2605.27491
Github：https://github.com/AgibotTech/GE-Sim-V2

裸考封神

智元 GE 2.0 模型實力登頂

沒有針對 WorldArena 進行特別調優，裸考出戰依然斷層領跑。在 GE 2.0 技術報告中，智元團隊對模型進行了全面的能力剖析。相比上一代模型，GE 2.0 不僅在單點性能上實現了躍升，更真正演進為一個全功能、高可用的世界模擬器，構建可試錯、可迭代、可進化的虛擬仿真環境，讓機器人策略在虛擬場景中自主積累經驗、完成動態試錯，規避真實場景的試錯成本，最終高效遷移至真實物理世界穩定落地，真正實現從 “感知預測” 到 “仿真進化、自主決策” 的閉環升級。

功能矩陣全面補齊：GE 2.0 在功能上首次全面覆蓋了長時序生成、多視角生成、本體狀態生成、近實時推理以及獎勵判別等核心環節，構建了世界模擬器完整的技術能力閉環。

長時序推演能力突破：在長時序推理任務中，GE 2.0 表現出極強的穩定性，畫面質量隨推理時長的衰減顯著弱于行業基線方案。即使在連續推演 40-50 秒的長視頻片段時，其生成質量依然超越了基線模型前 10 秒內的表現。

高可靠的閉環評測：作為世界模擬器，核心在于能否真實反映物理世界。團隊驗證了大量閉環評測結果，證明 GE 2.0 在多項任務上均與真實世界保持著強相關性。這種相關性不止步于宏觀統計意義上的 “成功率一致”，團隊還進行了逐案（Case-by-case）的 rollout 結果對比分析，并通過混淆矩陣（Confusion Matrix）提供了嚴謹的量化佐證，強有力地證明了 GE 2.0 作為策略評測器的可靠性。

打通數據回流反哺機制：在獎勵模型（Reward Model）的加持下，GE 2.0 能夠對閉環評測的 rollout 過程進行自動化篩選，將世界模型中產出的有效高質量數據精準回流給策略模型（Policy Model）。實驗證明，這一機制在多項任務上均助力策略模型實現了顯著的性能漲點。

從技術沉淀來看，智元 GE 2.0 的登頂，是長期深耕底層算法、打磨物理 AI 核心能力的必然結果。相較于行業同類模型，該模型實現了全方位技術躍升，不僅補齊長時序穩定推演、多視角精準生成、實時物理還原、閉環獎勵判別等全維度能力，更突破傳統模型 “重視覺、輕物理、難落地” 的行業痛點。即便在 40-50 秒超長時序復雜場景推演中，依舊能保持畫面穩定、物理邏輯精準、空間結構無偏差，生成數據可直接反哺機器人策略模型迭代，真正實現從 “視覺擬真” 到 “物理可信、可用、可落地” 的質變，算法通用性、穩定性、實用性全面領先行業水平。

ALL IN AI

智元定位 “具身智能的基礎模型公司”

區別于行業多數聚焦機器人硬件整機、場景應用或單點技術優化的企業，智元堅定錨定具身智能基礎模型公司核心定位，核心邏輯不在于制造機器人本體，而在于打造支撐整個物理 AI 行業發展的底層基礎設施與通用基礎能力。不同于單點應用技術的迭代，智元深耕通用具身基礎模型，打造可適配全場景、可通用泛化、可自主進化的底層 AI 能力，為機器人的運動、感知、決策、作業提供核心大腦。

今年 4 月，智元連續一周進行了 “ALL IN AI” 智元 AI WEEK 成果發布，完成了開源數據集、開源仿真平臺、基座大模型、世界仿真器、機器人部署應用平臺五大核心維度的完整技術閉環搭建，構建了行業獨一份的 “數據筑基 — 仿真賦能 — 模型進化 — 應用落地 — 生態開放” 全鏈路能力體系，徹底擺脫單點技術短板，成為具身智能領域全能型戰士。

AGIBOT WORLD 2026：首個系統性覆蓋具身智能全域研究的開源數據集
Genie Sim 3.0：首個大語言模型驅動的仿真開發平臺
Genie Operator-2：通用具身基座大模型，定義 “知行合一” 新高度
Genie Envisioner 2.0：世界模型驅動的環境模擬器
Genie Studio Agent：面向具身作業場景的零代碼 Agent 應用平臺

當前行業普遍存在數據質量參差不齊、仿真成本高、模型落地難、部署門檻高的痛點，智元通過全棧基礎技術布局，打通了完整價值閉環，解決了制約行業發展的共性底層難題。同時，智元堅持 ALL IN AI 的核心戰略，所有技術迭代均圍繞通用基礎能力升級，而非單一場景定制優化，其技術成果可覆蓋全品類機器人、全行業物理作業場景，具備極強的產業賦能屬性，真正承擔起具身智能領域基礎底座搭建者、行業標準定義者的角色，也是智元能夠拿下世界模型賽道全球總冠軍、持續領跑物理 AI 的核心根源。

真正的通用機器人，離不開硬件本體與智能系統的深度協同，更需要全棧自研的 AI 能力體系作為堅實底座。具身智能的未來，不在于零散的單點創新，而在于可持續進化、可協同放大的系統性能力。從建成全球首個 3000 平方米機器人實景數據采集場地，到推出一站式仿真開發平臺 Genie Sim；從通用具身基礎模型 Genie Operator 1，到實現對物理世界深度理解的世界模型 Genie Envisioner；再到面向全量開發者的具身智能一站式開發平臺 Genie Studio：智元持續構建面向物理 AI 的完整能力底座，打通技術價值閉環，讓每一項 AI 能力都成為推動機器人邁向 “部署態” 的堅實支撐。

錨定 “部署態”

讓具身智能從炫技走向商用閉環

部署態是今年智元在 2026APC 合作伙伴大會上提出來的概念，智元依托全棧技術閉環，實現機器人在真實復雜場景中大規模穩定作業、持續迭代，具備可落地、可復用特質，真正標志著具身智能從技術演示邁向規模化商用新階段。

成功實施 “部署態” 的核心在于底層算法的演進，智元 ALL IN AI 的核心邏輯始終圍繞真實物理世界、真實作業需求、真實商用落地，全部服務于機器人規模化部署：真實場景數據集保證模型適配復雜真實環境；生成式仿真大幅降低試錯成本；基座模型保障作業精準穩定；世界模型提升復雜任務自主決策能力；零代碼平臺徹底解決落地難、復制難、迭代難的產業痛點，實現技術價值到產業價值的完整閉環。

一次裸考登頂，是實力的印證；持續全域領跑，是強者的常態。智元本次登頂 WorldArena 世界模型總分冠軍，是智元長期堅持 All in AI 戰略的成果。算法是未來具身智能產業的競爭核心，只有持續迭代世界模型、基座大模型等核心算法能力，深化虛實融合技術閉環，才能在具身智能這條長跑之路上，不斷引領向前。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.