網易首頁 > 網易號 > 正文申請入駐

影溯完成數千萬美元融資“物理世界是3D的，世界模型也該是3D的”

2026-06-18 14:06:47　來源: 36氪

北京舉報

分享至

世界模型正從生成“看起來像”的視頻，轉向構建“可計算、可交互的3D世界狀態”。

「暗涌Waves」獨家獲悉，空間智能公司影溯（InSpatio）宣布完成數千萬美元Pre-A輪融資。本輪由光合創投、順為資本、紅杉中國參與投資。

這筆融資背后的大邏輯，正在成為共識：物理世界是3D的，世界模型也該是3D的。AI要進入機器人、自動駕駛、游戲、影視、XR 和工業仿真等真實場景，必須先學會理解動態的3D物理世界。

過去兩年，視頻生成把“看起來真實”推到了新高度，但對物理AI來說，僅基于世界表象生成畫面還遠遠不夠。如果說2D視頻是世界的投影，那3D世界模型則需要捕捉影子背后的動力學狀態。恰似“看遍飛鳥的影子，也拼不出鳥的空間骨架與飛翔力學”。

機器人要在空間里自主行動，自動駕駛需預判復雜環境變化，游戲、XR要構建可交互的場景。這些需要的不是“像”，而是“是”：能理解空間結構、物體關系、運動變化與物理約束的3D原生世界模型。

影溯選擇的正是3D原生路線。

影溯此前發布并開源InSpatio-WorldFM、InSpatio-World 等實時3D/4D世界模型，近期預告了全新世界模擬器Topos 1.0，即將開放Beta測試。

押注動態3D世界模型

大模型已經走到一個分水嶺，世界模型正成為全球AI競爭的新方向。

語言模型教會AI理解和生成文本，視頻模型教會AI生成畫面，但如果AI要進入物理世界，僅有畫面并不夠。它需要理解空間、記住物體、預測變化，并在行動前推演后果。

這正是當下具身智能難以跨越的鴻溝。

一個服務機器人，看視頻學會了抓杯子，換一個角度、換一張桌子，就可能失手。原因在于，視頻記錄了特定視角“看起來發生了什么”，卻無法精確告知物體在哪里、空間如何連接、一次失敗的抓取能否被穩定復現。而對物理AI來說，真正有價值的數據，是行動之后會發生變化、可以反復驗證的動態3D 世界狀態。

因此，世界模型的競爭，正從“誰的視頻更像真的”，轉向“誰能生成可計算、可交互、可推演的世界”。

漂亮的視頻更像渲染器（Renderer），它把既有狀態描摹成畫面；物理AI真正需要的是模擬器（Simulator），它維護世界狀態，推演行動后果，讓智能體在里面大規模試錯。渲染器回答“看起來如何”，模擬器要回答“推一下，會倒嗎”。

要成為模擬器，世界模型必須同時解決兩個問題：效率、一致性。

3D原生路線不必讓模型從冗余像素中艱難學習時空規則，顯著降低訓練和推理成本，讓大規模并行推演成為可能。

一致性方面，2D模型一旦視角變大、時間拉長或出現遮擋，物體位置就可能斷裂；3D模型則維護統一空間狀態，使同一個物體在不同視角和時刻都能保持一致。

影溯的判斷正是由此出發：“物理世界是3D的，世界模型也必須是3D的。”

他們不是把視頻轉成3D，而從空間骨架起步，先建幾何結構，再衍生視角、表征運動、推演變化。巨頭嘗試用更大模型、更多算力在像素迷霧里逼近真實世界時，而影溯用空間幾何大幅壓縮了搜索空間。

InSpatio-WorldFM實現實時3D生成與多視角一致，InSpatio-World走向可漫游的動態4D世界，而Topos直接生成高保真、可編輯、可交互的仿真環境。

這些產品化能力指向一個非共識判斷：3D原?表征可能成為世界模型的效率杠桿。

持續生產動態3D數據

互聯網并不缺視頻，缺的是帶幾何、尺度、材質、運動和交互關系的動態3D數據。

這類數據決定了物理AI能否從“看過”走向“學會”。機器人要適應不同房間、倉庫、街區，實現能力泛化，需要大量可復現、可編輯、可驗證的空間狀態；自動駕駛要在長尾場景游刃有余，也需要可控地生成和重組動態環境。

因此，誰能低成本構建有時間維度的動態3D數據，誰就更接近物理AI的上游。

影溯團隊在空間計算方向積累20余年，長期研究SLAM、三維重建、NeRF、3DGS、圖形學和實時系統。他們可以從圖片、視頻、深度傳感器數據等現實世界觀測中提取空間結構，再將其轉化為可學習、可編輯、可復用的3D 表征。

這套系統還能通過仿真生成有物理標簽數據，形成“真實采集、3D重建、生成式增強、模型訓練迭代”的數據飛輪。

這也是投資人看中影溯的重要原因。世界模型正成為物理AI的基礎設施；影溯具備稀缺的3D技術閉環和動態數據構建能力。這些能力有機會在機器人、自動駕駛、游戲、影視、XR 和工業仿真等方向落地，形成底層平臺價值。

影溯方面認為，世界模型不是一個純粹的算法問題。它需要生成模型，也需要圖形學、三維視覺、物理仿真與實時空間計算系統的緊密鉚合。它處理的不是文本或圖像，而是會隨時間流動的空間。

這也決定了，做這件事的團隊既要懂幾何與重建，也能理解深度學習，并有商業級系統交付能力。

影溯的團隊正好落在這個交叉地帶。創始人章國鋒博士是浙江大學CAD&CG全國重點實驗室教授、國家杰青，在3D視覺與空間計算/智能領域深耕二十余年，曾擔任商湯科技數字空間事業群首席科學家，兼具頂尖學術研究與大規模產業落地雙重實戰積淀。聯合創始人劉浩敏博士曾任商湯研究總監，長期負責3D視覺與空間計算/智能的技術攻關與工程落地。浙江大學長江學者、國家杰青鮑虎軍教授作為首席科學家，所領銜的前沿研究團隊也為影溯的世界模型和空間智能的構建提供了堅實的理論和技術支撐。

影溯不是看到風口后才轉向3D，而是一支長期生長在空間計算/智能和三維視覺領域的團隊，等到了AI叩響物理世界大門的時刻。

過去，3D技術更多服務于三維建模、數字孿生、空間定位和AR/VR。現在，當機器人、自動駕駛和空間智能都渴望一個可交互的世界模型，3D成為世界模型嫁接物理屬性、推演物理變化的基座。

據影溯方面介紹，本輪融資將主要用于模型研發、動態3D數據基礎設施、算力基礎設施、行業合作和人才招聘。隨后其將加速推出Topos 1.0正式版并啟動具身智能、游戲、影視等行業的標桿合作。對影溯來說，這更像是技術路線產品化的第一個信號。

當視頻生成還在爭奪觀感時，世界模型的下一層競爭已經開始：誰能讓AI 學會動態的 3D 物理世界，誰就有機會站在物理 AI 的數據上游。

影溯押注的，正是這層入口。

本文來自微信公眾號“暗涌Waves”，36氪經授權發布。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.