網易首頁 > 網易號 > 正文申請入駐

全球第一！智元斬獲WorldArena世界模型總分冠軍

2026-05-30 17:19:36　來源: 文匯報

上海舉報

分享至

近日，具身領域熱門榜單 WorldArena Track1（世界模型感知與動作響應賽道）最新評測結果揭曉。智元自研的世界模型 Genie Envisioner-Sim 2.0（以下簡稱GE 2.0）憑借優異的綜合表現，登頂榜單榜首。

“世界模型感知與動作響應”賽道聚焦具身智能最本質的“認知與行動”能力，是評判通用人形機器人智能化水平的核心標尺。在該賽道評測中，智元團隊使用了原生的世界模型GE 2.0，并未針對賽題進行特殊設計優化，僅基于榜單數據進行了基礎微調（Finetune）。

“輕裝上陣”依然拔得頭籌，充分印證了GE 2.0強大的通用適配性。面對近期世界模型方向的火熱關注和創業浪潮，智元始終保持自己的節奏，從長遠第一性原理出發，專注于打磨具身世界模型的堅實技術底座。此次登頂，是智元堅持長期技術演進的實力見證。

在GE 2.0技術報告中，智元團隊對模型進行了全面的能力剖析。相比上一代模型，GE 2.0不僅在單點性能上實現了躍升，更真正演進為一個全功能、高可用的世界模擬器，可構建可試錯、可迭代、可進化的虛擬仿真環境，讓機器人策略在虛擬場景中自主積累經驗、完成動態試錯，規避真實場景的試錯成本，最終高效遷移至真實物理世界穩定落地，真正實現從“感知預測”到“仿真進化、自主決策”的閉環升級。

功能矩陣全面補齊：GE 2.0在功能上首次全面覆蓋了長時序生成、多視角生成、本體狀態生成、近實時推理以及獎勵判別等核心環節，構建了世界模擬器完整的技術能力閉環。

長時序推演能力突破：在長時序推理任務中，GE 2.0表現出極強的穩定性，畫面質量隨推理時長的衰減顯著弱于行業基線方案。即使在連續推演40-50秒的長視頻片段時，其生成質量依然超越了基線模型前10秒內的表現。

高可靠的閉環評測：作為世界模擬器，核心在于能否真實反映物理世界。團隊驗證了大量閉環評測結果，證明GE 2.0在多項任務上均與真實世界保持著強相關性。這種相關性不止步于宏觀統計意義上的“成功率一致”，團隊還進行了逐案（Case-by-case）的 rollout 結果對比分析，并通過混淆矩陣（Confusion Matrix）提供了嚴謹的量化佐證，強有力地證明了GE 2.0作為策略評測器的可靠性。

打通數據回流反哺機制：在獎勵模型（Reward Model）的加持下，GE 2.0能夠對閉環評測的 rollout 過程進行自動化篩選，將世界模型中產出的有效高質量數據精準回流給策略模型（Policy Model）。實驗證明，這一機制在多項任務上均助力策略模型實現了顯著的性能漲點。

2026年是具身智能“部署態”元年，機器人從實驗室走向真實場景，規模化部署，真正發揮具身智能生產力，這也對算法提出了更高的要求。專注底層技術攻堅與產業價值落地，是智元一貫的技術理念。未來，智元將持續迭代世界模擬器技術體系，打通具身智能技術閉環，推動世界模型真正走進真實場景，為人形機器人規模化落地筑牢核心技術底座。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.