資本與產業界正迅速達成共識:AI正在從虛擬世界邁向物理世界,而世界模型這套讓機器真正理解物理規律、預測狀態轉移的底層認知引擎,是這條路上最關鍵的一塊拼圖。
據 Morgan Stanley 于 2025 年 4 月發布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》報告預測,世界模型所對應的下游產業——從具身智能到自動駕駛到工業仿真——全球總市場規模將在 2050 年達到 5 萬億美元量級。
當整個行業還在爭論世界模型該怎么做的時候,一支從北大走出來的年輕團隊——逆矩陣科技,帶著對于世界模型路線獨特的思考,走進了我們的視野。
”做世界模型,最核心的問題是:模型學到的到底是相關性,還是因果?”
“如何在隱空間里真正學到物理因果,而不只是一個視覺上說得過去、物理上隨時會失效的假設,是我們最想解決的問題。”
“世界模型必須引入主動干預,通過行動驗證因果,而不是從旁觀中擬合相關性。”
“我們不是把物理規律顯性地寫進模型,而是通過物理上可驗證的方法,讓模型自然地涌現出對物理的理解。”
這些觀點正來自于逆矩陣科技的聯合創始人——陳博遠,而他的另一個身份則是北大元培學院22歲的應屆畢業生。
陳博遠在大一時就中稿了AI三大頂會之一的NeurIPS,本科生在此發文本就極為罕見。此后幾年,他又陸續拿下NeurIPS Oral(口頭報告,全球錄取率不足0.5%)和ACL最佳論文(全球僅4篇,國內學術機構首篇獨立完成)。畢業前,他已是北大學生年度人物和北大五四獎章得主,這是北京大學給予學生的兩項最高榮譽。
![]()
他與同出北大的師兄吉嘉銘一起創立了逆矩陣科技,做通用世界基座模型。吉嘉銘同樣是2025北大學生年度人物,也是極少數同時獲得蘋果、騰訊、螞蟻三家頂級科技企業認可的青年研究者——2025年Apple Scholar(蘋果學者,全球遴選,中國大陸僅2位)、首屆騰訊青云獎學金、螞蟻Intech獎學金(全球共10名)。
2026年3月,公司完成超千萬美元天使輪融資,由高瓴創投和北大系基金燕緣創投聯合投資。近期獲悉,他們又將完成新一輪融資。
近日,我們與陳博遠圍繞世界模型和他的成長經歷進行了一次深入的對談。
▎以下為與陳博遠的對話全文,略有刪減:
創投家:世界模型現在非常火,從逆矩陣的角度是怎么理解這件事的?
陳博遠:現在世界模型很火,可以說Anything is world model(一切皆世界模型)。但其實世界模型這個概念最早就是從強化學習和控制理論里來的。
1990年圖靈獎得主、強化學習之父 Richard Sutton 提出 Dyna 架構,指出模型需要預測環境如何響應智能體的行動,再到后來2018年 David Ha 和 Schmidhuber 發表了一篇名為 World Models 的文章,指出智能體使用世界模型學習策略,并且在自己產生的夢世界中利用交互學習世界模型。
回到第一性原理。AI一定會從虛擬世界走向物理世界,而在物理世界里,核心是Interaction——交互。人類是怎么理解世界的?端起一個水杯大概三步:理解世界——什么是水杯,什么是桌面;編碼到腦子里——隱空間;執行策略——不斷嘗試,失敗了更新自己的信念。所以我們最終需要的世界模型,其實是一個狀態轉移模型——基于當下狀態采取什么action(動作),觸發什么next state(下一狀態)。這個東西,強化學習研究了幾十年。
創投家:你們的技術路線與李飛飛和LeCun有什么本質區別?
陳博遠:做世界模型,最核心的問題是:模型學到的到底是相關性,還是因果?
舉個例子。比如我們給模型看一段杯子落在桌上的視頻,它完全可以推斷出"桌子有引力把杯子吸住了",這個假設在統計上說得通,能解釋觀測到的狀態變化,但是是錯的。真實的物理原因只有重力。你沒辦法光靠觀察區分這兩種解釋,得讓模型去干預:把杯子移開,發現它掉地上了,"桌子有引力"就被排除了。這在強化學習里叫Reward Hacking(獎勵破解),也是我們認為世界模型必須引入主動干預的根本原因,通過行動驗證因果,而不是從旁觀中擬合相關性。
拿這個標準去看現有的幾條路線。李飛飛老師那邊是從3D重建進來的,追求極致的空間還原,工程上很扎實。但三維重建解決的是"世界長什么樣",不是"世界怎么運轉"。知道瓶蓋扣在瓶子上,和理解瓶蓋沒擰緊水會灑出來,是兩件事。LeCun的方向是在隱空間里學表征,方向我們覺得是對的,但它有一個工程上很難繞過去的問題:像素生成好不好,人眼能直接判斷,Critic Model(評判模型)容易建;隱空間里學到的表征對不對,怎么評,這個問題到現在沒有公認的解法,也是JEPA(聯合嵌入預測架構)路線從理論走向工程化最難的地方。
如何在隱空間里真正學到物理因果,而不只是一個視覺上說得過去、物理上隨時會失效的假設,是我們最想解決的問題。
創投家:你們說自己做的是"通用世界基座模型",怎么理解這個概念?
陳博遠:可以類比大語言模型的發展路徑。早期也有人做法律大模型、金融大模型,針對垂直場景去訓練。但最后大家發現,真正有效的方式是先訓一個通用基座,讓它把語言的底層規律學透,然后在上面做微調和適配。垂直模型天花板很低,通用模型才有涌現的可能。
世界模型今天也在經歷類似的分岔。我們選擇先做通用基座,有兩個核心判斷。第一,物理規律本身就是跨場景共通的——重力、碰撞、流體、時空一致性,這些東西不會因為你換了個應用場景就失效。一個真正學透了這些底層規律的模型,天然就能遷移到具身智能、工業仿真這些不同場景,不需要為每個領域重新建一套認知。第二,恰恰是這些場景,對世界模型的精確性和物理正確性要求極高,比如嚴肅工業場景里容不得半點物理判斷失誤,機器人抓取也不允許力的估算出錯。所以我們從一開始就把物理正確性作為最核心的指標,而不是先追求視覺上好看、再回頭補物理。
我們選擇先把底層的物理因果學透,做一個通用的基座,基座做好了,上面的應用場景自然能長出來。
創投家:你們是把物理定律寫入模型嗎?
陳博遠:不完全是。物理規律其實是人類對世界做的一個壓縮。拉馬努金不需要公式,也能一眼看出答案。我們不是把物理規律顯性地寫進模型,而是通過物理上可驗證的方法,讓模型自然地涌現出對物理的理解。
就像大模型的進化路徑——大模型能有今天這么強的數學和編程能力,其實靠的也是強化學習——RLVR(基于可驗證獎勵的強化學習),用明確的、可驗證的獎勵信號,讓模型在自我演進中涌現出對底層規律的理解。對物理世界也一樣,我們可以做一些物理一致性的獎勵,激活模型學習過程中的物理規律。
創投家:視頻生成模型也在強調物理理解,這會是捷徑嗎?
陳博遠:視頻生成模型能生成流暢的動畫,但可能出現穿模、不符合物理規律的現象——翻書時憑空出現第三只手。達到了“好看”,但不是“物理正確”。當然我們不是說基于開源視頻模型做強化學習完全不行。
我們只是認為世界模型一定會經歷從架構到數據的整套算法的改變。優先關注物理正確性,才符合Physical AI(物理人工智能)的需求。我們內部已經看到了一些Scaling Law(規模定律)的跡象,所以我們一直說,我們是一家關注通用世界基座模型的公司,不是只做面向具身或游戲的公司。
創投家:要實現物理定律理解的涌現,最大難點在哪?
陳博遠:這是全方位的問題。數據上,第一人稱視角數據很關鍵,因為它代表了主體和世界的交互,游戲引擎里的數據也很重要。人類學物理也不是直接學微積分,是從1+1=2開始的,學物理規律也有“課程學習”的概念。
架構上,記憶性問題、長時序問題,現在大家都解決不了。這些都是方興未艾的問題,無論初創還是大廠都在探索。正是這樣的土壤,給了我們機會。
創投家:逆矩陣的組織形式很特別,更像一個實驗室?
陳博遠:世界模型今天面對的核心問題還不是工程問題,是科學問題:怎么讓模型真正學到物理因果。這件事沒有現成的技術棧可以復用,需要的是對底層問題的深度思考和快速試錯,是研究導向的組織最擅長的事情。
因此我們確實不太像一家傳統意義上的公司,更像早期的DeepMind或者OpenAI剛成立的時候,一幫人聚在一起,就是想把一個技術問題搞明白。我們沒有KPI,沒有部門劃分,甚至沒有明確分工,只有分工偏好。內部叫這個文化"NO WALLS(沒有部門墻)"。
為什么這么做?因為我們觀察到,真正的創新往往就是兩三個人做出核心突破,然后再傾注資源去放大。你提前畫好部門和KPI,反而會把這種可能性堵死。
團隊現在20到30人,一半是年輕的研究者,一半是從大廠出來的工程人才。我們很重視Infra(基礎設施)這一塊,好的算法一定是建立在好的基建和數據上的。
還有一點,我們是一個真正的AI native(AI原生)團隊,這對我們來說不是一個口號,而是日常工作方式。新人入職第一件事,就是教他用好AI工具。我們內部測算過,每個人配合自己的agent(智能體),處理大量基礎工程任務的效率是以前的好幾倍,某種程度上一個人可以干原來一支小團隊的活兒。這也是我們三十個人覺得夠用的原因,這批高密度的人,每個人又能最大化地發揮AI的乘數效應,三十個AI原生的人,實際的戰斗力能當幾百人用。
當然核心的洞察和判斷,代碼風格的把控、工程架構的設計,這些還是得靠人來把關,AI替代不了。
外部叫我們"NEO Lab(新生代實驗室)",我們自己也覺得還挺貼切的。團隊里每個人都是帶著好奇心來的,做自己覺得有價值的事。我們珍視每一個人,每個人都很重要。
創投家:這種純研發導向的周期,會受到資本挑戰嗎?
陳博遠:其實我們的速度比自己預期的快很多了,內部看到了一些Scale up(規模化提升)的跡象。我們認為半年到一年內能產生一些有意思的成果。投資人對我們的長期主義十分理解和支持。
我們現在解決的是底層的科學問題——世界模型怎么真正學到物理因果,這件事目前全世界沒有人做出來。但歷史反復證明,一旦核心科學問題被突破,后面的工程化和商業化反而是水到渠成的事。OpenAI花了好幾年解決語言模型的Scaling Law(規模定律)問題,Anthropic花大量時間研究對齊和安全,當時外界也覺得太慢、太學術,但科學問題一旦解決,產品和商業價值是爆發式的。我們相信世界模型也是同樣的邏輯。
創投家:上一輪融資主要花在哪?
陳博遠:主要花在算力和數據上。基模訓練、預訓練、強化學習,都很吃算力。同時也在廣納賢才。
創投家:年初說四季度發布旗艦模型,進度如何?
陳博遠:進度還不錯,我們希望今年發布一個旗艦世界基座模型,真正關注物理正確性本身,給世界模型領域帶來一些不一樣的東西。
創投家:在你心中,逆矩陣的終極形態是怎樣的?
陳博遠:我在讀Google的Deepmind創始人,Demis Hassabis自傳時,有一段很有意思的對話——當別人問DeepMind想成為什么樣的公司時,他說:“想成為獲得最多諾貝爾獎的公司。”
整個世界模型還有很多問題需要解決,架構、算法、數據。我們之后會發布技術報告,把前期探索的東西展現給外界。核心關鍵就是把真正通用的世界基礎模型帶給大家,帶給整個AI,讓人工智能真正從數字世界走進物理世界,為具身智能、工業仿真、游戲這些產業提供底層的通用物理認知引擎。
創投家:再聊聊你的成長經歷吧,你是怎么一步步走到今天這條路上的?
陳博遠:我出生在山東的一個普通家庭,高考到北大元培學院。父母從小對我放養,所以我小時候經常自己泡書店,研究一些奇怪的東西。我特別喜歡動手,比如自己做小發電機什么的。
后來中學時代我開始對數學特別感興趣,越級學習成為一種習慣。高中開始打數學競賽,但很快感覺我更想做一些探索新規律的事情。數學本身就是AI的底層語言,我們現在可以看到,Hinton學的是心理學和數學,LeCun是信號處理出身,Ilya本科就是數學,其實從數學走向AI是一條很自然的路,而世界模型要做的事情,本質上也是用數理邏輯去逼近物理世界的規律。
創投家:什么時候對AI產生了興趣?
陳博遠:2021年,高二的時候,偶然聽到北大的一位學長在線上介紹人工智能這個專業。當時AI還沒現在這么火,沒有大模型的概念。但我記得很清楚,當時腦子里閃過一個想法——這就是我想做的事情,我就是為這個學科而生的。
我一直覺得數學研究必須要有一個能落地、產生社會變革意義的方向,現在看起來,那就是AGI(通用人工智能)。到了高三,我的書桌上有一個小紙條,寫著三個詞:北京大學、元培學院、人工智能。
創投家:應該有很多選擇吧?為什么選擇北大元培?
陳博遠:高考結束后,清華招辦也聯系過我。但我還是比較堅定想去北大元培。元培對我來說意味著自由的土壤。北大強調“思想自由,兼容并包”,元培的院訓是“尚自然展個性,化孤獨為共同”。人工智能本身就是跨學科的結合,這里給我更大的空間。
創投家:大一就開始發頂會論文,當時是什么想法?
陳博遠:我在大一寒假確定做強化學習,去聽了楊耀東老師一門大三的《多智能體系統》,楊老師驚訝課堂里來了個大一的學生,我們聊得很投機,后來就加入了課題組。也是在那時候認識了嘉銘。至于發頂會論文、北大年度人物,對我來說都算是比較幸運的事情。我更多還是一個興趣驅動、熱情驅動的人,這些頭銜對我是一種意外之喜,但不是出發的目的。
創投家:為什么本科畢業就選擇創業,而不是讀博或者去大廠?
陳博遠:之前也有一些不錯的去處,DeepSeek、Google的研究團隊都聯系過我,我們幾位聯創都能在大廠拿到很好的offer。但大家核心還是想自己組建一個組織,做底層創新。
我們算過一個數:從第一次工業革命到現在,技術革新間隔從100年變成50年、25年。2025到2035年是AI原始創新的關鍵窗口,這個窗口會慢慢閉合。既然當下有想做的事和志同道合的團隊,為什么不現在就出來?
創投家:作為北大走出來的AI新生代,北大這個背景對你們意味著什么?
陳博遠:北大給我們最大的東西不是光環,是土壤。元培學院的院訓是"尚自然展個性,化孤獨為共同",這種氛圍讓我大一就可以跑去聽大三的課,再到和大家一同凝聚一個團隊做前沿的探索。如果是一個按部就班的培養體系,這件事不會發生。
團隊里有很多北大的人,但不只是北大。我們的工程團隊來自各個大廠,也有浙大、中科大的同學。北大給我們的不是一個封閉的圈子,而是一種做事的方式——鼓勵你去碰最難的問題,允許你走一條沒人走過的路。我們第一輪融資的投資方之一就是北大校友基金燕緣創投,學校和校友體系在背后給了我們很實在的支持。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.