![]()
近日,具身領域熱門榜單 WorldArena Track1(世界模型感知與動作響應賽道)最新評測結果揭曉。智元自研的世界模型 Genie Envisioner-Sim 2.0(以下簡稱GE 2.0)憑借優異的綜合表現,登頂榜單榜首。
![]()
“世界模型感知與動作響應”賽道聚焦具身智能最本質的“認知與行動”能力,是評判通用人形機器人智能化水平的核心標尺。在該賽道評測中,智元團隊使用了原生的世界模型GE 2.0,并未針對賽題進行特殊設計優化,僅基于榜單數據進行了基礎微調(Finetune)。
“輕裝上陣”依然拔得頭籌,充分印證了GE 2.0強大的通用適配性。面對近期世界模型方向的火熱關注和創業浪潮,智元始終保持自己的節奏,從長遠第一性原理出發 ,專注于打磨具身世界模型的堅實技術底座。此次登頂,是智元堅持長期技術演進的實力見證。
![]()
在GE 2.0技術報告中,智元團隊對模型進行了全面的能力剖析。相比上一代模型,GE 2.0不僅在單點性能上實現了躍升,更真正演進為一個全功能、高可用的世界模擬器,可構建可試錯、可迭代、可進化的虛擬仿真環境,讓機器人策略在虛擬場景中自主積累經驗、完成動態試錯,規避真實場景的試錯成本,最終高效遷移至真實物理世界穩定落地,真正實現從“感知預測”到“仿真進化、自主決策”的閉環升級。
功能矩陣全面補齊:GE 2.0在功能上首次全面覆蓋了長時序生成、多視角生成、本體狀態生成、近實時推理以及獎勵判別等核心環節,構建了世界模擬器完整的技術能力閉環。
長時序推演能力突破: 在長時序推理任務中,GE 2.0表現出極強的穩定性,畫面質量隨推理時長的衰減顯著弱于行業基線方案。即使在連續推演40-50秒的長視頻片段時,其生成質量依然超越了基線模型前10秒內的表現。
高可靠的閉環評測: 作為世界模擬器,核心在于能否真實反映物理世界。團隊驗證了大量閉環評測結果,證明GE 2.0在多項任務上均與真實世界保持著強相關性。這種相關性不止步于宏觀統計意義上的“成功率一致”,團隊還進行了逐案(Case-by-case)的 rollout 結果對比分析,并通過混淆矩陣(Confusion Matrix)提供了嚴謹的量化佐證,強有力地證明了GE 2.0作為策略評測器的可靠性。
打通數據回流反哺機制: 在獎勵模型(Reward Model)的加持下,GE 2.0能夠對閉環評測的 rollout 過程進行自動化篩選,將世界模型中產出的有效高質量數據精準回流給策略模型(Policy Model)。實驗證明,這一機制在多項任務上均助力策略模型實現了顯著的性能漲點。
2026年是具身智能“部署態”元年,機器人從實驗室走向真實場景,規模化部署,真正發揮具身智能生產力,這也對算法提出了更高的要求。專注底層技術攻堅與產業價值落地,是智元一貫的技術理念。未來,智元將持續迭代世界模擬器技術體系,打通具身智能技術閉環,推動世界模型真正走進真實場景,為人形機器人規模化落地筑牢核心技術底座。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.