還得是咱國(guó)產(chǎn)世界模型牛!
極佳視界最新力作GigaWorld-1,直接擊穿谷歌英偉達(dá),WorldArena登頂全球第一。
而且還是唯一一個(gè)綜合得分突破60分大關(guān)的具身世界模型。
![]()
什么概念呢?就以三大核心維度為例,幾乎是斷層式領(lǐng)先:
- Physics Adherence(物理遵循):相比第二名提升了整整16%。
- 3D Accuracy(3D準(zhǔn)確度):近乎逼近滿分。
- Visual Quality(視覺質(zhì)量):同樣遙遙領(lǐng)先。
![]()
也就是說,GigaWorld-1是真正的全能型具身世界模型,不僅視覺真實(shí),而且?guī)缀尉珳?zhǔn)、物理準(zhǔn)確。
這意味著,極佳視界這家由清華系領(lǐng)銜,匯聚了阿里、百度、地平線等一眾頂尖大廠核心骨干的中國(guó)團(tuán)隊(duì),已經(jīng)率先完成了一次教科書式的技術(shù)超車。
從最嚴(yán)苛的“試金石”脫穎而出
眾所周知,WorldArena是世界模型領(lǐng)域公認(rèn)的“試金石”。
它由清華大學(xué)聯(lián)合普林斯頓大學(xué)、新加坡國(guó)立大學(xué)、北京大學(xué)、香港大學(xué)、中國(guó)科學(xué)院、上海交通大學(xué)以及中國(guó)科學(xué)技術(shù)大學(xué)等8所國(guó)內(nèi)外頂尖高校及科研機(jī)構(gòu)共同打造。
![]()
其摒棄了單一維度的片面測(cè)試,轉(zhuǎn)而構(gòu)建包含16項(xiàng)細(xì)分核心指標(biāo)和3大真實(shí)應(yīng)用任務(wù)的立體評(píng)估體系,旨在對(duì)具身世界模型的感知精度、物理規(guī)律理解、三維空間認(rèn)知以及動(dòng)作預(yù)測(cè)與落地能力進(jìn)行最嚴(yán)苛的壓力測(cè)試。
也正因如此,WorldArena吸引了全球幾乎所有頭部世界模型團(tuán)隊(duì)同臺(tái)競(jìng)技,首批參評(píng)名單包括谷歌、英偉達(dá)等。
最終的結(jié)果也出乎所有人意料,不是科技巨頭,而是這家低調(diào)耕耘的技術(shù)掃地僧——極佳視界。
其旗下最新的GigaWorld-1憑借硬核實(shí)力,成功摘得桂冠!
顯式動(dòng)作建模與可微分物理引擎的完美融合
那么為何GigaWorld-1能取得如此傲人的成績(jī)呢?
首先從技術(shù)路線看,GigaWorld-1是一款專為具身場(chǎng)景打造的AC-WM(Action-Conditioned World Model,動(dòng)作控制世界模型) 。
相較于傳統(tǒng)的世界模型,GigaWorld-1深度繼承并發(fā)展了極佳視界在去年7月發(fā)布的EmbodieDreamer核心架構(gòu)。
![]()
該方案不僅引入了顯式的動(dòng)作建模機(jī)制,從根本上保證了視頻生成過程中的幾何一致性;更創(chuàng)新性地融入了可微分物理引擎,從而獲取精準(zhǔn)的機(jī)械臂物理參數(shù),以實(shí)現(xiàn)對(duì)復(fù)雜物理交互過程的真實(shí)模擬與嚴(yán)格遵循。
在此前沿架構(gòu)的基礎(chǔ)上,極佳視界進(jìn)一步引入了團(tuán)隊(duì)長(zhǎng)期積累的上萬小時(shí)高質(zhì)量真實(shí)機(jī)器人操作視頻數(shù)據(jù)進(jìn)行訓(xùn)練,極大地增強(qiáng)了模型在開放場(chǎng)景下的泛化能力與高精度的動(dòng)作遵循表現(xiàn)。
目前,GigaWorld-1的核心代碼與部分?jǐn)?shù)據(jù)集已開源。
僅開源后的短短半個(gè)月內(nèi),GigaWorld-1在HuggingFace平臺(tái)的下載量便火速突破16000次,足見學(xué)術(shù)界與工業(yè)界對(duì)其技術(shù)實(shí)力的高度認(rèn)可,以及在開發(fā)者社區(qū)中的巨大影響力。
![]()
同時(shí)GigaWorld-1還將作為官方Baseline,強(qiáng)力支持即將于3個(gè)月后在美國(guó)舉辦的GigaBrain Challenge@CVPR 2026國(guó)際挑戰(zhàn)賽,為全球開發(fā)者積極賦能,共同推動(dòng)具身智能生態(tài)的繁榮發(fā)展。
(比賽官網(wǎng):https://gigaai-research.github.io/GigaBrain-Challenge-2026/)
![]()
于是這就引出了一個(gè)關(guān)鍵問題——
極佳視界是誰?
國(guó)內(nèi)首家專攻世界模型的公司
在業(yè)內(nèi),極佳視界是少有的產(chǎn)投雙棲玩家,一邊悶頭做技術(shù),一邊又能拿下巨額融資。
在本月初,極佳視界剛剛宣布完成近10億元Pre-B輪融資,投資方陣容堪稱豪華——
中芯聚源、上海半導(dǎo)體產(chǎn)投基金、臨芯資本、星源資本、萬林國(guó)際等頂尖芯片和汽車產(chǎn)業(yè)資本領(lǐng)投,中金資本、蘇創(chuàng)投、華強(qiáng)資本等重磅國(guó)資平臺(tái)和知名財(cái)務(wù)機(jī)構(gòu)跟投。
而這,也并非極佳視界首次獲得資本追捧。
早在2025年11月,華為旗下的哈勃投資就已聯(lián)合華控基金,完成了對(duì)極佳視界的億元級(jí)A1輪戰(zhàn)略投資。
其實(shí)華為對(duì)世界模型關(guān)注已久,此前就將世界模型列為未來智能世界2035年十大技術(shù)趨勢(shì)之首。
但它沒有像谷歌、英偉達(dá)、特斯拉這些全球科技巨頭那樣直接布局世界模型,而是通過哈勃投資,先在中國(guó)市場(chǎng)找到了最具潛力的標(biāo)的——極佳視界。
![]()
極佳視界是國(guó)內(nèi)第一家布局世界模型的公司,在世界模型的模型架構(gòu)和數(shù)據(jù)引擎兩方面都擁有行業(yè)領(lǐng)先的深入積累。
公司定位相當(dāng)清晰,就是聚焦物理AI,致力于世界模型驅(qū)動(dòng)的物理世界通用智能。其技術(shù)護(hù)城河建立在“世界模型×具身大腦”的雙輪驅(qū)動(dòng)戰(zhàn)略上,并在世界級(jí)權(quán)威測(cè)評(píng)榜單中,成功拿下具身大腦和世界模型的雙料冠軍。
產(chǎn)品矩陣包括世界模型平臺(tái)GigaWorld、具身基礎(chǔ)模型GigaBrain、通用具身本體Maker等物理AI全棧軟硬件產(chǎn)品。
GigaWorld:物理世界的“數(shù)字沙盒”
GigaWorld是極佳視界自研的世界模型平臺(tái),能模擬物理世界運(yùn)行規(guī)律,生成高保真合成數(shù)據(jù)。
與傳統(tǒng)仿真器相比,GigaWorld能通過幾何一致、物理準(zhǔn)確的世界模型建模,生成高保真、可控、多樣化的具身交互數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)放大。
這使得所訓(xùn)練的VLA模型在新紋理、新視角、新物體位置三大泛化維度上均實(shí)現(xiàn)近300%的性能提升。
更關(guān)鍵的是,GigaWorld能帶來10-100倍的效率提升。
在具身方向,GigaWorld-0是全球首次讓具身世界模型在高水平具身基模上發(fā)揮核心價(jià)值,其GitHub開源代碼斬獲1.5k+ Star,奠定了技術(shù)驗(yàn)證的基礎(chǔ)。
![]()
本次登頂WorldArena的GigaWorld-1,也是當(dāng)前全球最領(lǐng)先的AC-WM。
在駕駛方向,DriveDreamer系列是全球范圍內(nèi)最早將世界模型用在物理世界的系列開創(chuàng)工作。
此外,GigaWorld-Policy也是全球首次實(shí)現(xiàn)世界-動(dòng)作模型WA實(shí)時(shí)性、成功率、訓(xùn)練效率全面突破,實(shí)現(xiàn)了對(duì)主流WAM推理效率和性能的全面碾壓,讓世界-動(dòng)作模型真正開始進(jìn)入大規(guī)模Scaling階段。
實(shí)測(cè)數(shù)據(jù)顯示,GigaWorld-Policy實(shí)現(xiàn)了10倍推理速度與10倍訓(xùn)練效率的跨越式提升,同時(shí)任務(wù)成功率大幅上漲30%,標(biāo)志著具身智能正式邁入由世界模型驅(qū)動(dòng)的新紀(jì)元。
GigaBrain:機(jī)器人的“通用大腦”
GigaBrain是極佳視界開發(fā)的端到端視覺-語言-動(dòng)作基礎(chǔ)模型,在全球目前規(guī)模最大的真機(jī)評(píng)測(cè)比賽中,極佳視界的開源模型GigaBrain-0.1超越Pi0.5等眾多模型,獲得全球第一。
![]()
后續(xù)發(fā)布的GigaBrain-0.5M*則是全球首個(gè)基于世界模型的強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)高效學(xué)習(xí)和自我進(jìn)化的具身基模。
它提出基于世界模型的強(qiáng)化學(xué)習(xí)范式,并采用迭代式四階段閉環(huán)訓(xùn)練流程。
在高難度長(zhǎng)時(shí)程任務(wù)中,面對(duì)折紙盒、咖啡制備、衣物折疊等包含多階段操作、精細(xì)感知與持續(xù)決策的復(fù)雜場(chǎng)景,GigaBrain?0.5M*均實(shí)現(xiàn)接近100%的任務(wù)成功率,并可穩(wěn)定復(fù)現(xiàn),充分彰顯出卓越的策略魯棒性。
![]()
物理AI“夢(mèng)之隊(duì)”集結(jié)
除了技術(shù)和融資,極佳視界更亮眼的莫過于其核心團(tuán)隊(duì):
創(chuàng)始人兼CEO黃冠,清華大學(xué)自動(dòng)化系創(chuàng)新領(lǐng)軍工程博士。
曾擔(dān)任地平線機(jī)器人視覺感知技術(shù)負(fù)責(zé)人、鑒智機(jī)器人合伙人&算法副總裁,并擁有微軟亞洲研究院、三星中國(guó)研究院等頂尖研究機(jī)構(gòu)工作經(jīng)歷。
他完整經(jīng)歷了過去十年物理AI的技術(shù)和產(chǎn)業(yè)發(fā)展歷程,多次帶領(lǐng)團(tuán)隊(duì)獲得全球權(quán)威AI比賽世界冠軍,并發(fā)布多個(gè)全球知名AI成果。
![]()
聯(lián)合創(chuàng)始人兼首席科學(xué)家朱政,智源青年學(xué)者,發(fā)表頂級(jí)論文70余篇,引用近2萬次。
多篇著作影響力巨大,連續(xù)4年入選全球前2%頂尖科學(xué)家榜單,多次獲得吳文俊自然科學(xué)一等獎(jiǎng)、最佳學(xué)生論文獎(jiǎng)、CCF 杰出論文獎(jiǎng)等榮譽(yù),也是多個(gè)頂會(huì)領(lǐng)域主席、多項(xiàng)競(jìng)賽冠軍。
聯(lián)合創(chuàng)始人孫韶言,曾擔(dān)任阿里云總監(jiān),地平線數(shù)據(jù)閉環(huán)產(chǎn)品線總經(jīng)理,在物理世界超大規(guī)模數(shù)據(jù)閉環(huán)產(chǎn)品和架構(gòu)方面擁有行業(yè)領(lǐng)先的經(jīng)驗(yàn)。
他主導(dǎo)了業(yè)內(nèi)首個(gè)智能駕駛數(shù)據(jù)閉環(huán)系統(tǒng)的落地,有效提升了數(shù)據(jù)的處理效率,為智能駕駛技術(shù)的發(fā)展提供了重要的基礎(chǔ)設(shè)施支持。
合伙人兼工程副總裁毛繼明,擁有超過16年的仿真/工程/數(shù)據(jù)/分布式架構(gòu)方向的經(jīng)驗(yàn)。
曾擔(dān)任百度Apollo仿真和工程負(fù)責(zé)人,以及曾擔(dān)任百度、贏徹等T10級(jí)別架構(gòu)師,主導(dǎo)多個(gè)自動(dòng)駕駛與世界模型核心項(xiàng)目的技術(shù)開發(fā)與落地。在高質(zhì)量數(shù)據(jù)生成、端到端自動(dòng)駕駛架構(gòu)設(shè)計(jì)以及分布式系統(tǒng)優(yōu)化領(lǐng)域有著深厚的積累。
另外,極佳視界模型核心團(tuán)隊(duì)還包括博士期間超10篇頂會(huì)一作的世界模型頂尖科學(xué)家、超過10年物理AI全棧量產(chǎn)經(jīng)驗(yàn)的產(chǎn)業(yè)專家、華為天才少年獲得者、萬卡集群線性加速的頂尖算法和infra專家等,是行業(yè)少有的同時(shí)擁有頂尖的新一代物理AI全面技術(shù)前沿創(chuàng)新能力和傳統(tǒng)物理AI全棧系統(tǒng)量產(chǎn)經(jīng)驗(yàn)的全棧團(tuán)隊(duì)。
可以說,這支團(tuán)隊(duì)完整經(jīng)歷了CV、自動(dòng)駕駛、具身基模、世界模型等物理AI過去十年的發(fā)展歷程,并在每個(gè)階段都做出了行業(yè)領(lǐng)先的世界級(jí)成果。
當(dāng)他們聚集在一起,就共同造就了這支始終引領(lǐng)具身世界模型技術(shù)演進(jìn)的“夢(mèng)之隊(duì)”。
![]()
從數(shù)據(jù)引擎(Data Engine),到閉環(huán)仿真器(AC-WM),再到世界動(dòng)作模型(WAM),極佳視界一直走在前列。
無論是當(dāng)前世界模型和具身智能基礎(chǔ)設(shè)施的迭代,還是未來的AGI,極佳視界都將持續(xù)打造最堅(jiān)實(shí)的技術(shù)基石。
比賽官網(wǎng):https://gigaai-research.github.io/GigaBrain-Challenge-2026/
開源代碼:https://github.com/open-gigaai/CVPR-2026-Workshop-WM-Track
開源模型和數(shù)據(jù):https://huggingface.co/collections/open-gigaai/cvpr-2026-worldmodel-track
文章來源:量子位。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.