![]()
作者 | 樊雅婷
郵箱 | fanyating@pingwest.com
世界模型是個(gè)依然模糊和遙遠(yuǎn)的概念。
它被賦予的期待很清楚:賦予AI理解物理世界的能力。
過(guò)去,大語(yǔ)言模型讓AI學(xué)會(huì)了“說(shuō)話(huà)”,它能寫(xiě)出流暢的文章,卻不知道一個(gè)杯子從桌上滑落會(huì)發(fā)生什么。從理解語(yǔ)言到理解物理世界,中間隔著一道巨大的鴻溝——重力、碰撞、物體恒存、因果關(guān)系,這些人類(lèi)憑直覺(jué)就能感知的規(guī)則,對(duì)AI來(lái)說(shuō)全是盲區(qū)。
世界模型試圖填平這道鴻溝,它讓AI在行動(dòng)之前先在“腦海”中預(yù)演后果,就像人類(lèi)閉眼想象推門(mén)后會(huì)看到什么。這讓機(jī)器人不再只是執(zhí)行預(yù)設(shè)指令,而是真正開(kāi)始“理解”自己所處的世界。
在一個(gè)所有要素都在鼓勵(lì)創(chuàng)業(yè)公司更加大膽定位自己的時(shí)期,世界模型方向的創(chuàng)業(yè)公司迎來(lái)又一波集體亮相。
本期推薦的項(xiàng)目,從不同技術(shù)路線(xiàn)切入這場(chǎng)“理解物理世界”的競(jìng)賽。它們都不是簡(jiǎn)單地用AI生成視頻,而是讓AI在生成、預(yù)測(cè)、交互三個(gè)層面逐步逼近物理真實(shí)。像素/視頻生成派先讓AI能“畫(huà)”出世界,潛空間表征派讓AI能“懂”得世界,顯式物理派和狀態(tài)預(yù)測(cè)派讓AI能真正“進(jìn)”入世界。
多線(xiàn)并行,方向未定。以下是我們梳理的5家有代表性的公司,按技術(shù)路線(xiàn)和落地場(chǎng)景逐一介紹。
1
極佳視界
![]()
產(chǎn)品概述
極佳視界是國(guó)內(nèi)最早系統(tǒng)布局世界模型的公司之一,打法是“平臺(tái)+大腦+本體”三條腿走路:世界模型平臺(tái)GigaWorld、通用具身大腦GigaBrain、自研機(jī)器人本體Maker。
GigaWorld系列的核心產(chǎn)品是GigaWorld-Policy,這個(gè)產(chǎn)品把具身策略和世界模型做了深度融合,不是先建個(gè)世界模型再往機(jī)器人上套,而是從一開(kāi)始就綁在一起設(shè)計(jì)。在這基礎(chǔ)上,公司推出了通用機(jī)器人Maker H01,已經(jīng)在汽車(chē)制造、3C電子、倉(cāng)儲(chǔ)物流、家庭服務(wù)等多個(gè)場(chǎng)景實(shí)現(xiàn)了商業(yè)化落地,2026年全年沖刺千臺(tái)交付量。
2026年4月,極佳視界和一汽模具、阿里云一起,完成了具身智能機(jī)器人在真實(shí)工業(yè)制造場(chǎng)景的全流程方案落地。公司計(jì)劃年內(nèi)把“視覺(jué)-動(dòng)作”高質(zhì)量數(shù)據(jù)做到100萬(wàn)小時(shí)以上,世界模型預(yù)訓(xùn)練數(shù)據(jù)超過(guò)1000萬(wàn)小時(shí)。
團(tuán)隊(duì)背景
創(chuàng)始人兼CEO黃冠是清華自動(dòng)化系博士,曾在微軟亞洲研究院做深度學(xué)習(xí)研究,是國(guó)內(nèi)最早一批深度學(xué)習(xí)研究者。先后在地平線(xiàn)、鑒智機(jī)器人任職,同時(shí)有三星中國(guó)研究院的工作經(jīng)歷。在行業(yè)里,同時(shí)具備頂尖科研、量產(chǎn)工程、商業(yè)落地和連續(xù)創(chuàng)業(yè)經(jīng)驗(yàn)的人并不多,黃冠是其中一個(gè)。核心團(tuán)隊(duì)來(lái)自清華、北大、中科院、中科大以及WashU、CMU等院校,還有微軟、三星、地平線(xiàn)、百度、博世等企業(yè)的資深工程師。
為什么值得關(guān)注
極佳視界在短短一個(gè)多月內(nèi)完成25億元融資,估值突破百億,是國(guó)內(nèi)首個(gè)世界模型百億獨(dú)角獸。投資方陣容覆蓋了某知名科技巨頭、多只頂級(jí)國(guó)家隊(duì)基金、伊利集團(tuán)CVC健瓴資本等。極佳視界創(chuàng)始人稱(chēng)華為把世界模型列為“未來(lái)智能世界2035年十大技術(shù)趨勢(shì)”之首,這也是它投資極佳視界的底層邏輯。從全球范圍看,極佳視界的融資規(guī)模和估值水平已經(jīng)進(jìn)入世界模型賽道第一梯隊(duì),是國(guó)內(nèi)這個(gè)方向第一梯隊(duì)公司。
網(wǎng)址:https://gigaai.cc/maker-h01
1
Manifold AI(流形空間)
![]()
產(chǎn)品概述
Manifold AI給自己的定位是“國(guó)內(nèi)第一家自研世界模型作為具身基礎(chǔ)模型落地到機(jī)器人的創(chuàng)業(yè)公司”。公司自研了Worldscape世界模型,公司宣稱(chēng)這是世界范圍內(nèi)第一個(gè)同時(shí)支持移動(dòng)和操作交互的實(shí)時(shí)世界模型,并把它作為機(jī)器人的預(yù)訓(xùn)練基座。
在這個(gè)基座上,Worldscape Policy實(shí)現(xiàn)了具身世界-動(dòng)作模型:用世界模型做時(shí)空狀態(tài)預(yù)測(cè),結(jié)合視覺(jué)輸入進(jìn)行空間內(nèi)生推理并執(zhí)行動(dòng)作,據(jù)其公布的數(shù)據(jù),精度上全面超過(guò)現(xiàn)有VLA模型,具備少樣本和零樣本執(zhí)行能力。
公司堅(jiān)持硬件-數(shù)據(jù)-模型閉環(huán)迭代,自己研發(fā)了從遙操、UMI、ego-centric到采測(cè)一體等多種數(shù)據(jù)采集設(shè)備,搭建了模型驅(qū)動(dòng)的完整數(shù)據(jù)管線(xiàn)。
團(tuán)隊(duì)背景
創(chuàng)始人兼CEO武偉博士是前商湯科技高管,2015年加入商湯初創(chuàng)團(tuán)隊(duì),有數(shù)百人團(tuán)隊(duì)管理經(jīng)驗(yàn),曾主導(dǎo)商湯世界模型的研發(fā)和落地。聯(lián)合發(fā)起人是清華大學(xué)教授、教育部長(zhǎng)江學(xué)者,發(fā)表過(guò)包括十余篇Nature子刊在內(nèi)的數(shù)百篇論文,其所在實(shí)驗(yàn)室是AI模擬和世界模型方向最早做整體布局的實(shí)驗(yàn)室之一。公司成立不到十個(gè)月就累計(jì)完成四輪近5億元融資,在早期融資中獲得了華為哈勃、君聯(lián)資本、同創(chuàng)偉業(yè)等機(jī)構(gòu)的投資。
為什么值得關(guān)注
Manifold AI在具身智能領(lǐng)域?qū)崿F(xiàn)了多個(gè)突破。公司宣稱(chēng)的首個(gè)同時(shí)支持移動(dòng)和操作交互的實(shí)時(shí)世界模型,首家把世界模型作為具身基礎(chǔ)模型落地到機(jī)器人的創(chuàng)業(yè)公司。Worldscape Policy精度超越VLA模型的實(shí)證結(jié)果,證明了世界模型在具身智能中的實(shí)際價(jià)值。華為哈勃的投資加持,進(jìn)一步驗(yàn)證了它在產(chǎn)業(yè)端的戰(zhàn)略?xún)r(jià)值。
網(wǎng)址:https://www.manifoldai.cn
1
Sand.ai
![]()
產(chǎn)品概述
Sand.ai選了和U-ViT、DiT等Diffusion路線(xiàn)完全不同的技術(shù)路徑:自回歸架構(gòu)。2025年4月,Sand.ai開(kāi)源了自回歸視頻生成模型Magi-1,通過(guò)自回歸預(yù)測(cè)視頻塊序列來(lái)生成視頻,生成效果自然流暢,和Diffusion類(lèi)模型有本質(zhì)差異。
在技術(shù)理念上,Magi-1更接近語(yǔ)言模型“預(yù)測(cè)下一個(gè)token”的邏輯,但把它用在了視覺(jué)時(shí)空序列的預(yù)測(cè)上——這本質(zhì)上就是一種世界模型的構(gòu)建方式。公司ARR(年度經(jīng)常性收入)已超千萬(wàn)美元,近期完成約5000萬(wàn)美元新融資。
團(tuán)隊(duì)背景
創(chuàng)始人為曹越,清華大學(xué)特等獎(jiǎng)學(xué)金得主、前光年之外聯(lián)合創(chuàng)始人。曹越在視頻生成和多模態(tài)AI方向有深入研究,團(tuán)隊(duì)的學(xué)術(shù)基因和創(chuàng)新力很強(qiáng)。
為什么值得關(guān)注
Sand.ai代表的是一條“非主流”但有顛覆潛力的技術(shù)路線(xiàn)。Diffusion路線(xiàn)需要多步迭代去噪,推理速度慢、成本高;自回歸路線(xiàn)如果能在生成質(zhì)量和穩(wěn)定性上突破,可能在效率和規(guī)模化上形成代際優(yōu)勢(shì)。
有投資人的評(píng)價(jià)很直接:“Sand.ai的自回歸路線(xiàn)更激進(jìn),如果成功可能是顛覆性的。”
網(wǎng)址:https://sand.ai
1
逆矩陣科技(Inverse Matrix)
產(chǎn)品概述
逆矩陣科技把自己定位為“通用世界基座模型”,目標(biāo)是做一個(gè)能真正“理解”物理規(guī)律、而不是“模仿”物理表象的AI系統(tǒng)。公司聚焦世界基礎(chǔ)模型與強(qiáng)化學(xué)習(xí)的融合研究,技術(shù)路徑被業(yè)界視為繼李飛飛和楊立昆之后的“第三條路”。
和主流視頻生成派不同,逆矩陣科技的模型更強(qiáng)調(diào)因果推理能力。創(chuàng)始人吉嘉銘打過(guò)一個(gè)比方:傳統(tǒng)視頻生成模型只是在“畫(huà)”看起來(lái)像真的畫(huà)面,而世界模型要做的是根據(jù)動(dòng)作指令,推演出物理世界“應(yīng)該如何”響應(yīng)。比如,工業(yè)場(chǎng)景下,它能預(yù)測(cè)傳送帶速度提高10%,產(chǎn)品會(huì)不會(huì)飛出去這類(lèi)需要底層物理理解的問(wèn)題。
公司計(jì)劃2026年內(nèi)發(fā)布旗艦?zāi)P汀DP偷暮诵哪繕?biāo)是能響應(yīng)動(dòng)作指令并做出物理正確的預(yù)測(cè),長(zhǎng)遠(yuǎn)看是構(gòu)建一個(gè)能在任意物理場(chǎng)景中進(jìn)行因果推理與反事實(shí)預(yù)測(cè)的通用模型。
團(tuán)隊(duì)背景
逆矩陣科技的核心團(tuán)隊(duì)極其年輕。創(chuàng)始人吉嘉銘1998年出生,北京大學(xué)人工智能研究院博士生,2025年北大學(xué)生年度人物。他是極少數(shù)同時(shí)拿到蘋(píng)果、騰訊、螞蟻三家頂級(jí)科技企業(yè)認(rèn)可的學(xué)者(Apple Scholar,當(dāng)年大陸僅2位),谷歌學(xué)術(shù)引用超5600次。
聯(lián)合創(chuàng)始人陳博遠(yuǎn)2004年出生,北大元培學(xué)院大四本科生,另一位2025年北大學(xué)生年度人物。他大一就發(fā)表頂會(huì)論文,大四獨(dú)立發(fā)表NeurIPS 2025亮點(diǎn)論文,代表論文獲NeurIPS Oral(接受率僅0.35%),谷歌學(xué)術(shù)引用超2000次。
目前團(tuán)隊(duì)已超過(guò)30人,來(lái)自北大和頭部大廠,覆蓋模型訓(xùn)練、基礎(chǔ)設(shè)施、具身智能等方向。
為什么值得關(guān)注
逆矩陣科技代表的是世界模型的“強(qiáng)化學(xué)習(xí)+世界模型”融合路線(xiàn)。在行業(yè)普遍關(guān)注空間智能(李飛飛路線(xiàn))和聯(lián)合嵌入預(yù)測(cè)架構(gòu)(楊立昆路線(xiàn))時(shí),逆矩陣旗幟鮮明地押注強(qiáng)化學(xué)習(xí),認(rèn)為這將是讓模型在交互中習(xí)得物理因果的關(guān)鍵。
公司成立僅40余天就拿到高瓴創(chuàng)投、燕緣創(chuàng)投等機(jī)構(gòu)的超千萬(wàn)美元融資。這種由年輕學(xué)者主導(dǎo)、從第一性原理出發(fā)探索通用智能的模式,正代表了AI創(chuàng)業(yè)的一種新范式。
1
Liber AI
![]()
產(chǎn)品概述
LiberAI聚焦具身智能模型研發(fā),瞄準(zhǔn)人類(lèi)UMI數(shù)據(jù)與世界模型融合的下一代技術(shù)范式,已跑通UMI硬件—數(shù)據(jù)采集—大模型訓(xùn)練全流程閉環(huán),核心產(chǎn)品包括具身智能大模型及配套UMI硬件、數(shù)據(jù)采集與訓(xùn)練體系。
公司在成立僅4個(gè)月后便發(fā)布首個(gè)技術(shù)Demo,展現(xiàn)了搭載五指靈巧手實(shí)現(xiàn)雙手剝香蕉、雙手?jǐn)Q瓶蓋、持鍋顛勺等精細(xì)操作長(zhǎng)程任務(wù)的具身基礎(chǔ)模型,
在技術(shù)路線(xiàn)上,LiberAI以“Scaling斜率”為指引,引入兩大核心創(chuàng)新點(diǎn):一是模態(tài)對(duì)齊,讓海量視頻數(shù)據(jù)反哺稀缺的物理數(shù)據(jù);二是歸納偏置,把物理規(guī)律作為人類(lèi)先驗(yàn)注入模型,加速模型收斂。
團(tuán)隊(duì)背景
LiberAI成立于2025年12月8號(hào),創(chuàng)始人兼CEO劉松銘是清華大學(xué)00后本科生特等獎(jiǎng)學(xué)金得主(每年僅10人),師從視頻生成模型領(lǐng)域知名專(zhuān)家朱軍教授。RDT系列一作,曾發(fā)表多篇ICML、NeurIPS等頂會(huì)論文。
2024年,劉松銘由AI for Physics領(lǐng)域轉(zhuǎn)向具身智能,主導(dǎo)RDT系列研發(fā),發(fā)布全球首個(gè)使用大規(guī)模預(yù)訓(xùn)練+擴(kuò)散Transformer范式的基座模型RDT-1B,領(lǐng)先硅谷競(jìng)品PI-0模型一個(gè)月;隨后又先于Generalist的GEN-0模型一個(gè)月,發(fā)布首個(gè)使用大規(guī)模UMI無(wú)本體人類(lèi)數(shù)據(jù)預(yù)訓(xùn)練范式的具身模型RDT-2。
聯(lián)合創(chuàng)始人林凡淇師從清華大學(xué)高陽(yáng)老師,其一作論文《Data Scaling Laws》提出了模型泛化性隨數(shù)據(jù)多樣性增加而顯著提升的規(guī)律,斬獲ICLR Oral、CoRL X-Embodiment Workshop Best Paper等頂級(jí)榮譽(yù)。
為什么值得關(guān)注
LiberAI在短短三個(gè)月內(nèi)連續(xù)完成種子輪、天使輪、天使+輪融資,累計(jì)融資金額數(shù)億元,由真格基金、紅杉中國(guó)、美團(tuán)龍珠、順為資本等頭部基金聯(lián)合押注。其成立后三輪估值翻了5倍以上。
劉松銘將LiberAI的愿景定義為“像蘋(píng)果一樣,去定義世界模型的數(shù)采范式、本體及系統(tǒng)”。軟硬協(xié)同的全棧布局、頂級(jí)的年輕團(tuán)隊(duì)和清晰的物理智能路線(xiàn),使其成為觀察世界模型技術(shù)演進(jìn)的一個(gè)重要窗口。
網(wǎng)址:https://www.liberai.com
1
回看這5家公司,能感受到一個(gè)明顯的趨勢(shì)。世界模型在中國(guó)的發(fā)展,帶有強(qiáng)烈的具身智能導(dǎo)向。不同于海外Sora、Genie等在內(nèi)容創(chuàng)作和游戲方向上的探索,國(guó)內(nèi)世界模型的落地場(chǎng)景高度集中在機(jī)器人、自動(dòng)駕駛、工業(yè)仿真等領(lǐng)域。
或許這和中國(guó)AI產(chǎn)業(yè)的結(jié)構(gòu)性需求有關(guān)。人形機(jī)器人、自動(dòng)駕駛被列為戰(zhàn)略方向,而這兩個(gè)領(lǐng)域?qū)κ澜缒P偷男枨笞顬槠惹小悴荒苤竿粋€(gè)只會(huì)“說(shuō)”怎么做、但不懂物理規(guī)律的AI去操控機(jī)械臂倒一杯水。
從技術(shù)路線(xiàn)看,國(guó)內(nèi)世界模型公司呈現(xiàn)明顯的分化。極佳視界走“平臺(tái)+大腦+本體”閉環(huán)路線(xiàn),Sand.ai押注自回歸視頻生成架構(gòu),Manifold AI將自研世界模型作為具身基礎(chǔ)模型,逆矩陣科技押注強(qiáng)化學(xué)習(xí)+因果推理,Liber AI則聚焦UMI數(shù)據(jù)與物理規(guī)律先驗(yàn)的融合。
像素預(yù)測(cè)還是潛空間預(yù)測(cè)?自回歸還是擴(kuò)散?顯式3D建模還是隱式生成?每個(gè)問(wèn)題都沒(méi)有標(biāo)準(zhǔn)答案。LeCun說(shuō)大語(yǔ)言模型的擴(kuò)展不會(huì)帶我們到達(dá)AGI,世界模型是必經(jīng)之路。李飛飛說(shuō)AI的下一個(gè)前沿是空間智能。黃仁勛把世界模型稱(chēng)為“物理AI的核心”。
概念還在演化,路線(xiàn)還沒(méi)統(tǒng)一,但方向已經(jīng)明確:AI必須從理解語(yǔ)言走向理解世界。中國(guó)公司在這場(chǎng)競(jìng)賽中押下了重注,也拿出了自己的路線(xiàn)圖。答案會(huì)是什么樣,接下來(lái)的一到三年,應(yīng)該就能看到分曉。
![]()
點(diǎn)個(gè)“愛(ài)心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.