无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

風口上的世界模型,到底是什么?

Token到底是什么 如何用AI更省錢

0
分享至


想象空間巨大,但仍在早期階段。

AIX財經(AIXcaijing)原創

作者 | 王璐

編輯 | 魏佳

AI圈的新風口又來了。

進入2026年,“世界模型”快速從學術概念站到資本和產業的中心。海外,“AI教母”李飛飛創立的World Labs在年初拿下10億美元融資,估值飆至50億美元,投資方包含a16z、英偉達、AMD、Autodesk等巨頭;另一邊,圖靈獎得主楊立昆,離開Meta另起爐灶創辦的AMI Labs,僅種子輪便獲得超10億美元融資。國內同步跟進,成立于2023年的極佳視界,在今年三個月內連續完成三輪大額融資,累計35億元,成為國內首個世界模型百億獨角獸。

資金涌入的速度、規模以及頭部機構的扎堆程度,讓不少人感慨,好像回到了ChatGPT引爆市場的那一刻。

幾乎人人都在談論世界模型,但很少有人能說清它到底是什么。

其實世界模型并非新概念。它在認知科學和深度學習領域早有討論,但真正走入大眾視野,是2024年前后Sora的橫空出世時,母公司OpenAI將其表述為“world simulator”(世界模擬器),強調其能“生成、預測未來畫面”,由此受到大范圍關注。但很長一段時間里,業內并未全盤接受將像素級視頻生成直接等同于世界模型的說法。

讓這個概念真正脫離視頻生成、走向產業焦點的,是此后具身智能賽道的爆發,其內涵趨向于一種能理解物理因果的底層能力。

由于學術界遲遲未能給世界模型統一定義,目前只要和“預測未來”相關的模型,都開始自稱世界模型。正如李飛飛所言,世界模型既是當下最重要,也是被濫用最嚴重的概念。

對此,「AIX財經」和多位研究世界模型的學者、具身智能創業者聊了聊,試圖回答三個問題:世界模型究竟是什么?資本為何瘋搶?火速催生百億獨角獸的背后,這一賽道是真有潛力,還是又一場泡沫?

01.到底什么是世界模型?

由于目前世界模型缺乏統一標準,市場出現了“萬物皆可世界模型”的亂象。做視頻的、做3D的、做仿真的,紛紛給自己貼上“世界模型”標簽。

斯坦福大學教授李飛飛團隊將相關技術劃分為三個功能層級:渲染器(解決看起來像)、規劃器(輸出動作指令)和模擬器(輸出世界內部狀態)。其中,模擬器被其定義為最接近世界模型的本體。

智源研究院院長王仲遠則將當前的主流世界模型技術路徑分為四類,分別是以語言為中心、以像素為中心、以三維結構為中心、以視覺表征為中心的世界模型。但他坦言,這四類模型距離真正面向物理世界的基座模型有很大的距離。

兩種分類視角不同,但他們都認為世界模型的核心不是生成逼真畫面,而是對物理世界的建模能力。

對照這一標尺,當下市場上的主要三類玩家,都離“世界模型”有一定距離。


第一類是視頻派,以Sora、Runway、可靈等AI視頻生成大模型為代表,本質是把世界“畫”出來。它們本質上只是像素組合的概率分布,停留在渲染器層。畫面再逼真,模型也并不理解物理規律本身。

第二類是3D空間派,代表是李飛飛本人的World Labs,國內的創業公司VAST也押注這一方向。

這類玩家構建出了幾何結構,但缺乏動力學規律,無法觸及物理本質。舉個例子,它知道“杯子在哪兒”,不知道“杯子被推一下會怎樣”,因此仍卡在渲染器與模擬器之間。World Labs于去年年底推出首款空間智能產品Marble,一度被業界視為世界模型的落地代表,但李飛飛本人謹慎地將其稱為“非正式的世界模型”。

最后一類是仿真基建派,代表有英偉達、Waabi、Wayve、極佳視界等,它們提供物理仿真與驗證平臺,但更多是依賴程序員寫好的規則,模型負責按規則生畫面、生數據,缺乏對物理規律的推演與泛化能力。

總之,目前大多數公司都尚未真正觸及“模擬器本體”這一硬核層級。 而且,各家實質上仍是在賣內容生成服務或項目集成方案,距離下一代“底層基礎設施”相差很遠。

但正因為世界模型門檻極高、落地極難,世界模型的不可替代性才更加凸顯,它要解決現有方案無法解決的物理因果問題。

北京靈生科技合伙人王嘉明對此的描述是,世界模型的本質,是根據當前觀測狀態,預測下一個觀測狀態。以機器人做咖啡為例,想要完成這一動作,先得預測咖啡杯從桌面移到咖啡機出口下方這一“世界狀態”的變化,再反向推導其需要執行哪些動作。這種“預測-推導”的能力,正是當下具身智能落地的最大短板。

為了直觀理解,我們將世界模型與大語言模型、視頻生成模型、具身智能模型(VLA)進行橫向對比。

同樣是一個杯子,大語言模型能告訴你杯子是什么、描述杯子長什么樣;視頻生成模型能畫出杯子從桌上掉落的畫面;VLA能根據指令完成“拿起杯子”的動作;而世界模型掌握的是“物理因果”,它知道杯子在多大角度會滑動、多大角度會被傾覆。

可以看出,世界模型既不是視頻大模型的視覺延伸,也不是具身智能大模型的簡單升級,它位于更底層,是那個缺失的“物理地基”。只有當一個模型能真正從原始感官中推演出物理因果,它才能稱之為世界模型。

02.GPT-2時刻的世界模型,卡在數據上

弄清楚了什么是世界模型后,就能理解投資人為什么瘋搶。

世界模型能把物理世界里的突發后果和驗證成本變得可計算,能直接運用到當下大火的具身智能與自動駕駛行業里。

目前具身智能行業仍高度依賴真機數據采集和仿真合成數據來緩解數據短缺難題,但這兩條路都暴露出很大的局限性。真機數據訓練出的,多是對特定動作的模仿,而非基于物理規律的推理能力;仿真合成數據則受限于平臺預設的規則,一旦機器人進入家庭等非標準化場景,就容易失靈。

世界模型不僅能補這兩個短板,對數據的“包容性”也遠高于具身大模型。

王嘉明介紹,VLA的數據必須采集特定機器人的特定動作,而世界模型只需關注物體狀態如何變化,因此只需人穿戴設備采集即可。他打了個比方,機器人在端水過程中把水灑了,對于VLA來說是無用數據,但對于世界模型反而是好數據,因為它從中能學到“手一歪杯子會掉”這一物理規律。

自動駕駛領域感知識別的技術難題已經解決,但難點變成了很難采集到暴雨、結冰、施工等多重變量疊加的極端情況數據。世界模型可以構建高保真的虛擬測試場,大幅降低對高風險路測的依賴。

正如北京交通大學計算機學院、從事世界模型研究的博士生余蕭所言,世界模型相當于給這兩大行業補上了“可驗證性”的拼圖:機器人可以在虛擬世界里摔一萬次再走進現實,車企也可以低成本驗證極限場景。


圖源 / pixabay

然而,世界模型仍處于發展早期。如果用大模型發展史作類比,余蕭認為當前世界模型大致處在“GPT-2 到 GPT-3 之間”的階段,因為它概念很熱、Demo很強,但技術路線極度分散,標準混亂,離真正的通用物理引擎還有很長距離。

綜合多位從業者的說法,世界模型目前還面臨著三大難題。

第一道是數據,這是最大瓶頸。雖然看起來世界模型對數據的要求比具身智能大模型低,但難點是量大。

王嘉明表示,模型所需的訓練數據量和模型大小呈正比,一個能干活的VLA模型大概在30億個參數,而英偉達發布Zero-shot機器人世界模型DreamZero為140億。差距的原因是,具身大模型的數據回答的是“這種畫面該出什么動作”,而世界模型的數據還要額外回答“動了之后會發生什么、為什么”,需要包括大量失敗的交互數據。

這類數據的獲取成本不低。

王嘉明透露,目前主流的采集方式仍為人工采集,行業均價在兩三百元一小時,且任務越復雜、動作精度要求越高,單價越貴。

余蕭則指出了另一重難題,真實交互需頻繁重置場景與校準傳感器,公開數據往往更偏向于采集成功的動作,恰恰缺乏“杯子滑落、碰撞傾覆”這類關鍵的失敗樣本,加之物理變量的組合呈指數級爆炸,導致數據需求幾乎是個無底洞。

他表示,對大語言模型來說,從網上獲取大量文本的邊際成本很低,但對世界模型來說,一條真實機器人交互軌跡往往要算人力時間、機器人時間、場景重置、設備損耗和數據清洗。

至于用合成數據填補缺口,在邏輯上也并不可行。王嘉明解釋,生成精準的合成數據,前提是已經擁有一個靠譜的世界模型,這便陷入了典型的“雞生蛋、蛋生雞”的死循環。

第二道難題在于推理效率與物理認知的缺失。

一方面,龐大的參數量直接導致推理延遲居高不下。市面上的機器人在執行倒咖啡、疊衣服等動作時,響應速度仍遠落后于人類,難以滿足物理世界對實時交互的要求。

更核心的挑戰,是物理認知本身還沒走通。大語言模型的推理能力,建立在人類已將海量因果邏輯、推理步驟編進文本數據的基礎上,它本質上是在學習人類整理好的符號規律。而世界模型試圖跳過這一層,直接從感官信號中逆向推導物理規律。這條“去語言化”的技術路徑比文本路徑更難,目前也缺乏已被驗證的成功路線。

第三道是評測和落地。圖像生成好不好,能拿指標和人眼快速對比,但真實環境中的摩擦、形變、接觸度等參數,不僅很難測全、測準,還常常帶有不確定性,導致很多場景根本不存在唯一的標準答案。這意味著,世界模型即便做出來了,也很難像大語言模型那樣靠基準測試快速迭代,落地節奏天然會慢一拍。

世界模型有望解決具身智能和自動駕駛領域的落地難題,但市場可能高估了世界模型在短期內的能力。

03.是AI基建,還是又一場泡沫?

弄清世界模型的潛力與局限后,這門生意究竟能否賺錢,也就有了一個較為清晰的答案。

綜合多位從業者的判斷,目前市場上能拿出的產品,幾乎都還停留在渲染器和仿真層,沒有誰真正抵達模擬器本體。當下確實有人通過世界模型賺到了錢,但都不是因為“世界模型”本身,是它周邊的幾門生意。

如果按付費模式劃分,主要有三種,且幾乎全在B端。

一是賣“訓練場”,即給機器人公司提供虛擬訓練環境、給車企提供駕駛仿真系統,一般按項目或訂閱收費。比如,Waabi、Wayve的客戶主要是車企,做的是自動駕駛算法的閉環仿真驗證;極佳視界則把同一套邏輯搬到具身智能中,客戶是機器人公司。

這是三條路中與模擬器層最為接近的一條,它賣的是對物理世界的推演能力本身。

二是賣“合成數據”,即用世界模型生成帶物理因果標簽的數據,賣給具身智能和自動駕駛公司,填補真機數據的缺口。這條路位于模擬器與渲染器之間,生成的數據質量越高、物理標簽越準,便越接近真正的世界模型輸出。

但這條路有一個尚未解決的根本問題:合成數據本身的物理保真度,還沒辦法被獨立證偽。一旦生成數據的物理邏輯不準確,下游模型反而會被“污染”。所以目前這門生意的客戶接受度,更多依賴供需雙方的私下校驗,而非行業公認的評測標準。


圖源 / pexels

三是賣“內容生產”,這主要面向游戲、影視、空間設計輸出可交互的3D場景,這條路離C端最近、最容易出爆款Demo,可本質上更接近渲染器層,護城河存疑。

王嘉明坦言,世界模型的商業化仍處在探索期,上述三條路徑僅是雛形,整個行業遠未跑出標準答案。

正是這種不確定性,讓資金瘋狂涌入這一賽道。

“越不明朗越搶投的邏輯,與十年前的自動駕駛如出一轍。”王嘉明認為,今年世界模型的融資熱,更像投資人驅動的提前布局,“當年大家都說自動駕駛馬上要落地,結果到現在已經過去了快10年。但如果你現在才去投自動駕駛,顯然已經太晚了。同理,世界模型正處于想象空間巨大、但尚未規模落地的時間窗口。”

他透露,近期有大量投資人向其咨詢世界模型的技術細節,市場關注度已從概念炒作轉入實質性的押注階段。

而參照大模型“百模大戰”的劇本,世界模型賽道的洗牌可能會來得更猛、更快。隨著英偉達、騰訊、阿里等巨頭下場,那些沒有落地場景、缺乏數據閉環、只靠Demo撐門面的公司,會加速出局。

可以明確的是,世界模型并非偽概念,其對物理世界的理解與預測,是通往更高階智能繞不開的一環,但同樣確定的是,這輪融資熱里確實有不少“偽世界模型”。

*題圖來源于pexels。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
二手平臺出售超高價玩具人偶,標有身高體重性格等,平臺:不涉及兒童販賣

二手平臺出售超高價玩具人偶,標有身高體重性格等,平臺:不涉及兒童販賣

西游日記
2026-07-01 22:30:59
打下臺灣到底有多難?

打下臺灣到底有多難?

野書文
2026-07-02 07:02:04
蘇州一醫院現低矮“丁義珍式”窗口,院方回應

蘇州一醫院現低矮“丁義珍式”窗口,院方回應

界面新聞
2026-07-02 18:46:01
A股:今天午后加速跳水到4046,種種跡象表明,A股牛市已經開始熄火?

A股:今天午后加速跳水到4046,種種跡象表明,A股牛市已經開始熄火?

趨勢清風俠
2026-07-02 14:06:53
山東泰山這樣做,和窮瘋了有什么區別

山東泰山這樣做,和窮瘋了有什么區別

清書先生
2026-07-02 11:23:32
突發!以色列宣布:打死伊斯梅爾·馬斯里

突發!以色列宣布:打死伊斯梅爾·馬斯里

每日經濟新聞
2026-06-30 11:36:05
“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
浙江省紀委省監委:沈午衛,主動投案!

浙江省紀委省監委:沈午衛,主動投案!

都市快報橙柿互動
2026-07-02 19:25:37
從2026年7月1日起,全國將強制執行退休返聘及超齡員工,好事呀!

從2026年7月1日起,全國將強制執行退休返聘及超齡員工,好事呀!

福建睿平
2026-07-02 07:47:57
德布勞內:我和多庫同時被換下確實驚訝,最終證明教練是對的

德布勞內:我和多庫同時被換下確實驚訝,最終證明教練是對的

懂球帝
2026-07-02 11:48:10
安倍晉三“不務正業”的水彩畫,張張封神!

安倍晉三“不務正業”的水彩畫,張張封神!

國際藝術大觀
2026-07-01 20:40:08
當今社會內卷成什么樣了?網友說:5年刑期以下的生意都沒利潤了

當今社會內卷成什么樣了?網友說:5年刑期以下的生意都沒利潤了

燈錦年
2026-07-02 18:05:22
澤連斯基緊急回國!

澤連斯基緊急回國!

每日經濟新聞
2026-07-02 17:59:23
哈國緊急聯手美歐,亮出稀土底牌,以為中方沒辦法?西方高興早了

哈國緊急聯手美歐,亮出稀土底牌,以為中方沒辦法?西方高興早了

策前論
2026-07-02 14:53:42
四處樹敵可不是“蠢貨”能做到的

四處樹敵可不是“蠢貨”能做到的

律法刑道
2026-07-02 09:04:40
湖南省人民政府參事李大劍接受紀律審查和監察調查

湖南省人民政府參事李大劍接受紀律審查和監察調查

環球網資訊
2026-07-02 18:20:08
網曝浙江某工廠聘請很多印度勞工,食堂吃飯照曝光,網友:快舉報

網曝浙江某工廠聘請很多印度勞工,食堂吃飯照曝光,網友:快舉報

小徐講八卦
2026-07-02 11:43:38
賺著中國人錢,毒害中國人身體,日企在華收割萬億,至今仍在售賣

賺著中國人錢,毒害中國人身體,日企在華收割萬億,至今仍在售賣

云舟史策
2026-07-02 07:09:53
她預言了自己的死亡!!

她預言了自己的死亡!!

梳子姐
2026-07-01 20:01:45
京東方A大逆襲!493億天量創歷史記錄,95萬股民迎來股價18年新高,安徽合肥又贏了

京東方A大逆襲!493億天量創歷史記錄,95萬股民迎來股價18年新高,安徽合肥又贏了

金融界
2026-07-02 16:01:29
2026-07-02 19:55:00
AIX財經 incentive-icons
AIX財經
AI新時代,財經新觀察。
73文章數 23223關注度
往期回顧 全部

科技要聞

馬斯克不承認,但SpaceX就該造AI手機

頭條要聞

患罕見病被背進考場男生考出643分 想報考中醫藥專業

頭條要聞

患罕見病被背進考場男生考出643分 想報考中醫藥專業

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

小鵬MONA L03 智能化水平拉滿 還有玩法多樣的巧思大空間

態度原創

教育
本地
手機
游戲
公開課

教育要聞

CD?C=57,求:C+D=?

本地新聞

這場穿越酉陽的光影之旅,張張都是壁紙!

手機要聞

消息稱某廠子系新開6.8英寸1.5K OLED三星直屏,預計為iQOO

《殺毒少女》正式推出 反病毒主題防御射擊新游

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版