亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

CVPR 2026 WorldArena挑戰(zhàn)賽啟動(dòng),高德開源高性能世界模型基線

0
分享至

機(jī)器之心發(fā)布

過去兩年,從 Sora 到 Veo,再到 Cosmos,視頻生成模型在「視覺逼真」這條路上飛速狂奔,生成的畫面已經(jīng)足以以假亂真。但一個(gè)根本性的問題始終懸而未決:這些模型真的「理解」了物理世界嗎?這個(gè)問題目前還沒有一個(gè)答案。

事實(shí)上,當(dāng)這些模型去生成機(jī)器人操作的視頻,「夾爪穿模、物體憑空消失、時(shí)序錯(cuò)亂」等物理違規(guī)現(xiàn)象比比皆是。從「看起來像」到「真能干活」,一直橫亙著一條技術(shù)實(shí)現(xiàn)的鴻溝。

究竟什么樣的模型才可以真能干活?圍繞這個(gè)問題,一場(chǎng)全球性的技術(shù)競(jìng)賽正在打響 ——CVPR 2026 WorldArena Challenge



  • 賽事官網(wǎng):http://cvpr2026challenge.world-arena.ai/
  • WorldArena 排行榜:https://world-arena.ai/
  • WorldArena GitHub:https://github.com/tsinghua-fib-lab/WorldArena
  • ABot-PhysWorld GitHub:https://github.com/amap-cvlab/ABot-PhysWorld
  • ABot-PhysWorld 論文:https://github.com/amap-cvlab/ABot-PhysWorld/blob/main/tech_report/ABot-PhysWorld.pdf
  • Workshop 官網(wǎng):https://videoworldmodel-workshop.github.io/
  • 官方交流群(微信):https://github.com/tsinghua-fib-lab/WorldArena/assets/WeChat.jpg
  • 官方交流群(Discord):https://discord.gg/ZMrJJD55
  • 官方郵箱:WorldArena1@outlook.com

一、WorldArena Challenge:世界模型的「大考」來了

WorldArena Challenge 是依托 CVPR 2026 Video World Model Workshop 舉辦的國際挑戰(zhàn)賽,由高德地圖視覺技術(shù)中心(AMAP CV Lab)、流形空間(Manifold.ai)和清華大學(xué)牽頭,聯(lián)合普林斯頓大學(xué)、新加坡國立大學(xué)、香港大學(xué)等全球頂尖學(xué)術(shù)機(jī)構(gòu)共同主辦。

與此前的世界模型評(píng)測(cè)不同,WorldArena 的核心理念可以用四個(gè)字概括:「真能干活」。評(píng)測(cè)體系不僅關(guān)注視頻「好不好看」,更聚焦于生成的內(nèi)容是否遵循物理規(guī)律、是否能支撐機(jī)器人的實(shí)際操作。比賽基于清華大學(xué)等 8 所頂尖高校聯(lián)合研發(fā)的 WorldArena Benchmark,涵蓋 16 大核心指標(biāo)和 3 大真實(shí)應(yīng)用任務(wù),旨在推動(dòng)世界模型從「視覺逼真」向「功能可用」轉(zhuǎn)型。此次比賽設(shè)置了以下兩個(gè)賽道,參賽團(tuán)隊(duì)可根據(jù)研究方向選擇單一賽道或雙賽道并行參與。

賽道一評(píng)估世界模型在視頻生成層面的綜合感知質(zhì)量 —— 不是簡(jiǎn)單地看「畫面漂不漂亮」,而是從視覺質(zhì)量、動(dòng)作質(zhì)量、內(nèi)容一致性、物理法則遵循度、可控性和 3D 準(zhǔn)確性六大維度,通過 16 項(xiàng)量化指標(biāo)展開全方位評(píng)測(cè)。最終通過 EWMScore 整合為統(tǒng)一的綜合分?jǐn)?shù)排名。簡(jiǎn)單說,不是比誰的視頻最好看,而是比誰的視頻最「合理」。



賽道二為具身任務(wù)功能性賽道。這是 WorldArena 的核心創(chuàng)新方向,首次將評(píng)測(cè)延伸至真實(shí)的具身任務(wù)執(zhí)行層面,圍繞世界模型在具身智能中的三大核心使用價(jià)值展開評(píng)估:作為數(shù)據(jù)合成引擎,能否生成有效提升策略模型性能的合成數(shù)據(jù);作為策略評(píng)估器,能否替代物理仿真器準(zhǔn)確評(píng)估策略;作為行動(dòng)規(guī)劃器,能否直接規(guī)劃出可執(zhí)行的動(dòng)作序列。賽道二將率先開放數(shù)據(jù)合成引擎與策略評(píng)估器的提交通道,對(duì)于排名靠前的方案,后續(xù)將引入行動(dòng)規(guī)劃器進(jìn)行額外加權(quán)打分,以全面驗(yàn)證模型的實(shí)用價(jià)值。



二、即刻上手,高性能開源世界模型已就位

賽事主辦方之一的高德為提升創(chuàng)新活躍、降低參賽門檻,已將其世界模型ABot-PhysWorld完全開源 —— 這個(gè)模型目前在 WorldArena Leaderboard 上排名領(lǐng)先,參賽者可以直接在此基礎(chǔ)上訓(xùn)練和優(yōu)化。

ABot-PhysWorld 是高德即將發(fā)布的 ABot-World 系列的首個(gè)子工作,聚焦于具身場(chǎng)景下的物理一致性視頻生成。與現(xiàn)有模型追求「視覺合理性」不同,ABot-PhysWorld 的核心目標(biāo)是「物理真實(shí)性」—— 讓 AI 生成的不僅是連續(xù)幀,而是符合物理規(guī)律的可行操作序列。



在技術(shù)實(shí)現(xiàn)上,該模型取得了多項(xiàng)關(guān)鍵突破:

四維泛化數(shù)據(jù):從 300 萬原始數(shù)據(jù)清洗至 30 萬高質(zhì)量 SFT 數(shù)據(jù),覆蓋本體泛化(不同機(jī)器人形態(tài))、任務(wù)泛化(50+ 任務(wù)類型)、場(chǎng)景泛化(10+ 場(chǎng)景)和物體泛化(1000+ 物體類別),確保模型不偏向特定場(chǎng)景。

DPO 偏好對(duì)齊:通過 VLM-as-Judge 構(gòu)造 1 萬條偏好數(shù)據(jù)對(duì),使用 Direct Preference Optimization 讓模型在「物理正確」和「物理錯(cuò)誤」之間做出正確選擇,顯著減少穿模、變形等物理違規(guī)現(xiàn)象。

Dense Action Map 精細(xì)控制:11 萬條動(dòng)作控制數(shù)據(jù),將機(jī)器人動(dòng)作編碼為空間稠密的控制信號(hào),通過 Context Blocks 分支與視頻 latent 融合,實(shí)現(xiàn)精細(xì)化動(dòng)作注入。

在獨(dú)立的 PAI-Bench 基準(zhǔn)上,ABot-PhysWorld 以0.8491 的綜合得分0.9306 的領(lǐng)域得分刷新 SOTA,顯著超越 GigaWorld、Wanx-2.5、Veo 3.1、Sora 2 等開源和閉源模型。更重要的是,它成功打破了業(yè)界長(zhǎng)期存在的「視覺質(zhì)量與物理合規(guī)性」之間的 Trade-off—— 在保持極具競(jìng)爭(zhēng)力的視覺質(zhì)量的同時(shí),實(shí)現(xiàn)了領(lǐng)域得分的大幅領(lǐng)先。

在 WorldArena Leaderboard 上,ABot-PhysWorld 同樣表現(xiàn)優(yōu)異,名列前茅。這一成績(jī)充分證明了高德在具身世界模型方向的技術(shù)實(shí)力。

為保障賽事公平性并加速社區(qū)創(chuàng)新,主辦方明確 ABot-PhysWorld 不參與最終評(píng)獎(jiǎng)。該模型已開放完整模型權(quán)重、訓(xùn)練代碼及數(shù)據(jù)處理流程,參賽團(tuán)隊(duì)可直接在此高起點(diǎn)基線上進(jìn)行微調(diào)、數(shù)據(jù)策略優(yōu)化或技術(shù)創(chuàng)新。

值得一提的是,今年以來高德在具身智能領(lǐng)域動(dòng)作頻頻,先后發(fā)布多款具身模型,并在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中取得 SOTA。結(jié)合此次 ABot-PhysWorld 的開源及 ABot-World 系列的預(yù)告,高德在具身世界模型領(lǐng)域的產(chǎn)業(yè)布局正持續(xù)深化。

三、賽程安排與參賽指南

賽事總獎(jiǎng)金池超過 14,000 美元,各賽道分設(shè)一、二、三等獎(jiǎng)。獲獎(jiǎng)團(tuán)隊(duì)將獲得 CVPR Workshop 報(bào)告展示機(jī)會(huì),頂尖隊(duì)伍可跨賽道獲獎(jiǎng)。目前提交通道已開放并支持實(shí)時(shí)刷榜,最終提交截止時(shí)間為 2026 年 5 月 25 日,結(jié)果將于 6 月 1 日公布,并于 6 月 4 日在 CVPR 期間舉行頒獎(jiǎng)典禮。

參賽流程非常簡(jiǎn)潔,預(yù)計(jì)半天即可跑通第一個(gè)提交:

  1. 準(zhǔn)備數(shù)據(jù):從 Hugging Face 下載 val_dataset /test_dataset。
  2. 生成視頻:用您的模型輸出 ≥640×480、121 幀 @24fps 視頻(輸入:初始幀 + 文本 / 動(dòng)作)。
  3. 打包提交:壓縮成 zip(視頻文件夾 + model_README.md),在官網(wǎng)注冊(cè)提交或發(fā)送至官方郵箱。

目前已有眾多頂尖學(xué)術(shù)團(tuán)隊(duì)與產(chǎn)業(yè)機(jī)構(gòu)報(bào)名參賽,賽事詳情與報(bào)名入口請(qǐng)?jiān)L問官網(wǎng)。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
越來越多的人查出腸癌!醫(yī)生含淚苦勸:冰箱久置的這4物是幫兇

越來越多的人查出腸癌!醫(yī)生含淚苦勸:冰箱久置的這4物是幫兇

岐黃傳人孫大夫
2026-03-17 23:25:03
別再傳“蒙古國防中國”了!南邊連草都不長(zhǎng),讓人怎么???

別再傳“蒙古國防中國”了!南邊連草都不長(zhǎng),讓人怎么住?

起喜電影
2026-04-15 18:57:22
2.4萬億元,一個(gè)人怎么能闖出這么大的禍…

2.4萬億元,一個(gè)人怎么能闖出這么大的禍…

蔥哥說
2026-04-14 22:04:16
孫楊官宣有娃僅1天,妻子私生活被扒底朝天,令人擔(dān)心的事出現(xiàn)了

孫楊官宣有娃僅1天,妻子私生活被扒底朝天,令人擔(dān)心的事出現(xiàn)了

圓夢(mèng)的小老頭
2026-04-15 15:00:48
丹麥把旅居臺(tái)灣民眾居留證國籍、出生地登記改為中國,國臺(tái)辦回應(yīng)

丹麥把旅居臺(tái)灣民眾居留證國籍、出生地登記改為中國,國臺(tái)辦回應(yīng)

新京報(bào)
2026-04-15 11:21:58
國臺(tái)辦果然沒看錯(cuò),鄭麗文真面目被徹底揭露!小算盤到此為止了

國臺(tái)辦果然沒看錯(cuò),鄭麗文真面目被徹底揭露!小算盤到此為止了

比利
2026-01-23 12:41:53
豪斯+兩內(nèi)救了張慶鵬!北控戰(zhàn)績(jī)壓廣州1勝場(chǎng),再贏2場(chǎng)鎖季后賽!

豪斯+兩內(nèi)救了張慶鵬!北控戰(zhàn)績(jī)壓廣州1勝場(chǎng),再贏2場(chǎng)鎖季后賽!

籃球資訊達(dá)人
2026-04-15 22:35:17
張本主動(dòng)讓核心!松島輝空淡定發(fā)言逗笑全場(chǎng),日乒男團(tuán)沖冠有新招

張本主動(dòng)讓核心!松島輝空淡定發(fā)言逗笑全場(chǎng),日乒男團(tuán)沖冠有新招

峰云峰雨
2026-04-14 18:52:15
NFC、FC、HPP……哪種才是100%真果汁?

NFC、FC、HPP……哪種才是100%真果汁?

混知
2026-03-24 17:07:26
李國慶張丹紅吃剩菜還不忘開會(huì),互相指責(zé)太真實(shí),生活習(xí)慣差異大

李國慶張丹紅吃剩菜還不忘開會(huì),互相指責(zé)太真實(shí),生活習(xí)慣差異大

嫹筆牂牂
2026-04-15 08:01:48
妻子偷偷給情夫轉(zhuǎn)六百萬,丈夫直接裝傻報(bào)警:錢丟了,妻子當(dāng)場(chǎng)崩潰

妻子偷偷給情夫轉(zhuǎn)六百萬,丈夫直接裝傻報(bào)警:錢丟了,妻子當(dāng)場(chǎng)崩潰

奶茶麥子
2026-04-15 15:46:05
許家印認(rèn)罪!南京恒大爛尾項(xiàng)目,何去何從?

許家印認(rèn)罪!南京恒大爛尾項(xiàng)目,何去何從?

地產(chǎn)銳評(píng)
2026-04-15 16:45:53
青澀的愛:那時(shí)候的我們,連牽手都要鼓起勇氣

青澀的愛:那時(shí)候的我們,連牽手都要鼓起勇氣

疾跑的小蝸牛
2026-04-15 20:43:41
日本全面叫停種植牙?種牙潛藏的風(fēng)險(xiǎn)與后遺癥,一次為你講明白

日本全面叫停種植牙?種牙潛藏的風(fēng)險(xiǎn)與后遺癥,一次為你講明白

垚垚分享健康
2026-04-11 08:51:57
范志毅任上海足協(xié)副主席,和上綜藝賺錢兩不誤,3婚與嬌妻很幸福

范志毅任上海足協(xié)副主席,和上綜藝賺錢兩不誤,3婚與嬌妻很幸福

君笙的拂兮
2026-04-14 22:57:41
13歲男孩被老人私拴繩索割喉,已脫離生命危險(xiǎn),但仍有一段氣管未能找到……他成績(jī)?nèi)G叭赣H白血病加乳腺癌,網(wǎng)友已籌款超60萬

13歲男孩被老人私拴繩索割喉,已脫離生命危險(xiǎn),但仍有一段氣管未能找到……他成績(jī)?nèi)G叭?,母親白血病加乳腺癌,網(wǎng)友已籌款超60萬

極目新聞
2026-04-14 22:38:03
劉雨鑫吃了6000家餐廳、走遍幾十個(gè)國家,他的錢其實(shí)就3個(gè)來源

劉雨鑫吃了6000家餐廳、走遍幾十個(gè)國家,他的錢其實(shí)就3個(gè)來源

老吳教育課堂
2026-04-14 07:44:56
順峰餐廳北京門店全部關(guān)閉:司法糾紛不斷,消費(fèi)者上萬儲(chǔ)值打水漂?

順峰餐廳北京門店全部關(guān)閉:司法糾紛不斷,消費(fèi)者上萬儲(chǔ)值打水漂?

北京商報(bào)
2026-04-15 20:03:10
臺(tái)海觀察:十項(xiàng)涉臺(tái)新政充滿誠意善意,島內(nèi)期盼惠及各行各業(yè)

臺(tái)海觀察:十項(xiàng)涉臺(tái)新政充滿誠意善意,島內(nèi)期盼惠及各行各業(yè)

上觀新聞
2026-04-15 06:55:05
太陽慘遭大逆轉(zhuǎn)!布克反思屢遭翻盤:領(lǐng)先就浪,怨我罰球太爛

太陽慘遭大逆轉(zhuǎn)!布克反思屢遭翻盤:領(lǐng)先就浪,怨我罰球太爛

仰臥撐FTUer
2026-04-15 22:24:02
2026-04-15 23:32:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12772文章數(shù) 142628關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
旅游
房產(chǎn)
教育

藝術(shù)要聞

這山水,蕩滌胸中塵埃

赫本愛穿的傘裙,好優(yōu)雅!

旅游要聞

美翻了!成都植物園100余種月季迎來盛花期

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

教育要聞

千城百縣看中國|山東定陶:創(chuàng)意滿格大課間

無障礙瀏覽 進(jìn)入關(guān)懷版