![]()
![]()
![]()
近日,具身智能領域權威評測榜單WorldArena Track1(世界模型感知與動作響應賽道)公布最新測評結果。智元自研通用世界模型Genie Envisioner-Sim 2.0(GE 2.0)憑借綜合能力優勢,取得賽道綜合排名第一。
作為衡量人形機器人智能化水平的重要維度,本次評測重點考察模型的環境感知、邏輯認知與動作響應等基礎核心能力。參評過程中,智元采用原生版本GE 2.0模型,未針對評測題目做專項定制優化,僅基于公開數據完成基礎微調,在通用狀態下取得優異成績,體現出模型良好的通用性與適配能力。在行業技術快速迭代、賽道熱度持續攀升的背景下,智元長期聚焦底層技術積累,穩步打磨具身世界模型基礎能力,本次榜單成績,是企業持續深耕基礎研發的階段性成果。
據技術報告顯示,相較于上一代產品,GE 2.0在單點性能穩步提升的同時,完成了整體能力體系的系統性升級,形成功能完整、穩定性更強的世界模擬能力。模型可搭建動態、可迭代的虛擬仿真場景,支持機器人在虛擬環境中自主推演、試錯學習、積累運行經驗,有效降低真實場景調試成本,提升算法迭代效率,實現從基礎感知預測,到仿真推演、自主決策的完整技術閉環。
在功能體系建設上,GE 2.0補齊多項關鍵能力,全面覆蓋長時序內容生成、多視角場景構建、本體狀態模擬、近實時推理、獎勵判別等核心模塊,構建起完整的世界模擬器技術閉環,適配多樣化機器人訓練與仿真需求。
針對長時序推演難題,新版模型穩定性明顯提升。在數十秒級連續推演任務中,畫面與場景邏輯的衰減程度顯著優于行業基準方案,即便持續推演40至50秒,整體生成效果仍優于基線模型短時間推演表現,能夠更好適配機器人連續作業、長周期決策的應用場景。
為驗證仿真效果的真實性,研發團隊開展多維度閉環對比評測,通過大量實驗數據證明,GE 2.0模擬場景與真實物理世界具備高度相關性。評測不僅完成宏觀維度的效果對標,還通過逐案例對比、混淆矩陣量化分析,進一步驗證模型仿真結果的可靠性,能夠客觀、精準地支撐機器人策略評測與算法驗證工作。
同時,模型搭建起完整的數據回流優化機制。依托獎勵模型能力,GE 2.0可自動篩選仿真推演過程中的高質量有效數據,反向賦能策略模型迭代優化。相關實驗結果顯示,該數據閉環機制能夠持續提升算法性能,為模型持續進化、能力迭代提供穩定支撐。
業內普遍認為,2026年將成為具身智能規模化落地的起步之年,機器人技術正從實驗室研發走向真實場景規模化應用,對算法穩定性、實用性、落地性提出更高標準。智元正聚焦底層技術攻堅與場景價值落地,打通具身智能技術閉環,推動世界模型真正走進真實場景,為人形機器人規模化落地筑牢核心技術底座。
原標題:《智元世界模型獲評行業榜單首位,夯實具身智能技術底座》
欄目編輯:楊玉紅
本文作者:新民晚報 葉薇
題圖來源:采訪對象供圖
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.