![]()
來源:獵云網
近日,大曉機器人開悟世界模型(Kairos)同時在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot、DreamGen等全球針對世界模型視頻生成和狀態預測的權威具身智能評測中均實現第一,超越Cosmos3、PI、MotuBrain、being-H0.7、Abot、Fast-WAM、Wan2.2等全球主流世界模型 。憑借首創的原生統一世界模型架構——“多模態理解—生成—預測”一體化架構,實現了從具身視頻生成、任務指令追隨、泛化能力到場景魯棒性的全維度領先,并向全行業開源。
針對行業普遍基于視頻生成模型做后訓練所固有的物理缺失、因果匱乏與推理延遲等痛點,大曉機器人(ACE ROBOTICS)于2025年12月重磅推出創新的一體化統一架構。作為國內唯一堅持自主設計網絡架構與自主預訓練范式的團隊,大曉徹底摒棄了“外掛式”改良捷徑,從底層重構世界模型運行邏輯。該架構深度融合理解、生成與預測三大核心能力,依托自研混合線性注意力算子與全局狀態共享機制實現全鏈路高效協同。這一顛覆性設計確立了全球主流演進方向,英偉達最新發布的Cosmos 3.0亦采用同源架構,印證了Kairos的絕對引領地位。
在數據層面,得益于完全自主的預訓練范式,Kairos廣泛匯聚十余萬小時human-centric實景數據與數百萬小時互聯網真實世界視頻,全面覆蓋數百類職業場景。結合顯式模仿學習與隱空間強化學習,模型徹底打通了從數據感知到深度理解的閉環,使基模型的場景認知、時序因果推演與泛化適配取得全方位突破。這不僅夯實了具身智能落地的底層基座,更為世界模型數據層面的尺度定律探索做出了重要貢獻。
憑借領先架構與海量高質量數據,Kairos兼具強勁物理直覺、頂尖泛化能力與極致魯棒性。基于此打造的Kairos-4B成為全球首款可端側直驅機器人本體的具身世界模型,成功打通世界理解與狀態預測的端到端閉環,消除中間轉譯延遲,讓機器人真正實現“想到即做到”。這一里程碑式突破大幅提升了實時響應與作業精度,為具身智能的商業化落地開辟了全新路徑。
登頂RoboTwin 2.0,復雜雙臂操作能力獲權威驗證
在全球最具挑戰性的雙臂機器人操作評測基準RoboTwin 2.0中,Kairos以96.1%的平均成功率位列所有參評方法第一,刷新當前最好成績,并顯著領先傳統VLA模型,展現出在復雜雙臂協作、精細操作與多任務泛化場景中的領先能力。
![]()
RoboTwin 2.0由上海交通大學、香港大學 ,聯合上海人工智能實驗室等研究團隊共同推出的高難度雙臂操作評測基準,包含50項復雜協同任務。該基準核心對比了VLA(視覺語言動作)模型與WAM(世界動作模型)兩大技術范式,后者因具備環境動力學預測能力,更契合長時序推理與復雜規劃需求。
在這一極具挑戰的測試中,Kairos以96.1分的平均成功率強勢登頂榜首。其在Clean(標準)場景取得96.9分,在Randomized(隨機化)場景取得95.2分,不僅遠超G0.5(93.2)starVLA(88.3)等VLA模型,也全面超越AIM(93.1)Fast-WAM(91.8)MotuBrain(96.0)等主流世界模型。這一顯著優勢得益于Kairos對世界動力學與動作演化的聯合建模,使其在復雜雙臂操作的規劃、執行及應對現實不確定性方面實現了質的飛躍。
全面超越VLA模型登頂LIBERO-Plus,實現世界模型路線范式超越
在全球最嚴苛的場景級泛化能力評測基準LIBERO-Plus中,Kairos世界模型以89.0分的總成績力壓所有主流VLA模型和世界模型,登頂全球榜首。
LIBERO-Plus由上海創智學院、復旦大學、同濟大學和新加坡國立大學的研究團隊共同提出,通過模擬相機視角、機器人形態、語言指令、光照條件、背景環境、噪聲干擾、空間布局等7種真實場景變量,測試模型在未知擾動下的魯棒性,是衡量機器人能否適應開放世界的“終極考驗”。
評測結果顯示,Kairos不僅大幅超越同為世界模型的Being-H0.7(84.8分),更全面超越了包括ACoT-VLA(88.0分)、Pi 0.5(85.7分)、ProGAL-VLA(85.5分)在內的所有主流VLA模型。在核心子維度上,Kairos展現出碾壓級的環境魯棒性:光照(97.7)背景(95.8)噪聲(96.8)三大維度均取得接近滿分的成績,相機視角(95.5)語言指令(86.8)維度也位居前列。
這一里程碑式的成績首次證明,世界模型路線在場景級泛化能力上已經超越了傳統VLA路線。Kairos世界模型能夠在光照突變、背景雜亂、存在噪聲干擾的復雜環境中穩定執行任務,準確理解多樣化的語言指令,并適應不同的相機視角。這意味著搭載Kairos世界模型的機器人以極小代價,即可直接部署到家庭、工廠、商場等多樣化真實場景中,為具身智能的大規模商業化落地掃清了最后一道核心技術障礙。
登頂WorldModelBench Robot,物理建模精度達到高水平
在衡量機器人世界建模能力的行業金標準WorldModelBench機器人專項測試中,Kairos-4B以9.30分的總成績登頂全球榜首,僅用4B參數便全面超越了包括28B參數的Lingbot、16B參數的Cosmos3、14B參數的Abot-Physworld、5B參數的Wan2.2在內的主流模型,創造了世界模型領域參數效率的新紀錄。
該基準由加州大學伯克利分校、加州大學圣迭戈分校、英偉達和麻省理工學院的聯合研究團隊提出,核心評估指令遵循和未來幀生成兩大能力,直接決定機器人能否理解人類指令并預判動作后果,是具身智能最基礎的核心能力。
評測結果顯示,Kairos在多個核心維度實現全面領先。指令遵循得分2.36,與16B參數的Cosmos3并列全球第一,參數效率提升4倍;在物理遵循維度取得4.96分的高分,其中牛頓力學、重力兩大核心物理規律維度全部斬獲滿分1.00;此外,在時序質量指標上取得滿分1.00,展現出超越競品的時序一致性與視覺連續性。
這一成績標志著Kairos世界模型已同時具備世界級建模能力和物理級精準的環境交互能力,為具身智能從實驗室走向大規模商業化落地奠定了關鍵技術基礎。
斬獲DreamGen雙冠,泛化能力領跑全球
在專為機器人具身智能設計的DreamGen Bench評測中,Kairos世界模型一舉奪得平均物理遵循(AVG_PA 0.538)和總平均分(AVG_Score 0.618)兩項全球第一,全面超越Cosmos3、Lingbot、Wan2.2等主流世界模型。
DreamGen由英偉達,聯合華盛頓大學、加州大學伯克利分校、加州大學洛杉磯分校等多所頂尖高校的研究團隊共同提出,是目前系統性評估世界模型真實場景泛化能力的基準,其得分與下游機器人策略訓練性能呈顯著正相關,分數越高,模型生成的合成數據訓練出的機器人實際表現越好。
在核心三大泛化場景中,Kairos世界模型在物理遵循(PA)維度上大幅領先,其中新行為執行得分0.489和新環境適配得分0.581位居全球第一。在指令遵循(IF)維度上,新行為執行得分0.745也取得第一名。綜合泛化能力大幅超越Lingbot、Cosmos3、Abot-PhysWorld等主流世界模型。
這一成績不僅印證了Kairos世界模型在物理世界建模上的絕對精度,更凸顯了其行業領先的泛化能力。它意味著Kairos世界模型生成的合成數據不僅符合真實物理規律,更能有效遷移到從未見過的物體、行為和環境中,將大幅降低機器人在新場景下的訓練成本和周期,為具身智能的大規模商業化落地提供了核心數據引擎。
四大權威榜單的全面領先,充分驗證了Kairos世界模型技術路線的先進性和完整性。從基礎的物理規律理解,到未知場景的能力泛化,再到復雜環境的魯棒性和精細的雙臂協同操作,Kairos世界模型在具身智能的所有核心能力維度上都達到了全球頂尖水平。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.