允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
2026年,世界模型成了AI圈最硬通的“社交貨幣”。
Yann LeCun離開Meta后創(chuàng)辦的AMI Labs,一舉拿下10.3億美元融資,投前估值為35億美元
李飛飛的World Labs持續(xù)押注空間智能,成為一級(jí)市場(chǎng)最搶手的標(biāo)的之一;英偉達(dá)在GTC上拋出Physical AI,直言工業(yè)與機(jī)器人市場(chǎng)的潛在規(guī)模將達(dá)到50萬(wàn)億美元
資本、人才、頂尖頭腦,都在往同一個(gè)方向匯聚——讓AI真正理解物理世界
紅杉AI峰會(huì)上,英偉達(dá)機(jī)器人負(fù)責(zé)人Jim Fan更是直接放話:行業(yè)的重心,正從VLA(視覺-語(yǔ)言-動(dòng)作模型)轉(zhuǎn)向世界動(dòng)作模型(World Action Models)。
這句話的沖擊力在于,把過去兩年具身智能行業(yè)最熱的技術(shù)路線,推到了一個(gè)新問題面前:機(jī)器人會(huì)看、會(huì)聽、會(huì)執(zhí)行動(dòng)作之后,下一步該是什么?
答案越來越清晰,它需要一個(gè)能理解物理世界、能預(yù)測(cè)行動(dòng)后果、能持續(xù)修正經(jīng)驗(yàn)的、真正貼近人腦運(yùn)作模式的機(jī)器人“大腦”
剛剛完成新一輪億元融資具腦磐石,從成立之初押注的正是這個(gè)方向。
具腦磐石由朱森華創(chuàng)立。他曾任華為云AI算法創(chuàng)新Lab主任,主導(dǎo)過AI腦科學(xué)云平臺(tái)、盤古具身大模型、全球具身智能產(chǎn)業(yè)創(chuàng)新中心等系統(tǒng)級(jí)項(xiàng)目。在業(yè)內(nèi),他被稱為“華為具身大腦一號(hào)位”
![]()
現(xiàn)在,他把創(chuàng)業(yè)方向押在了一個(gè)更具挑戰(zhàn)性的交叉點(diǎn)上:用認(rèn)知神經(jīng)科學(xué),重做機(jī)器人的大腦模型。
具腦磐石給這套系統(tǒng)起了一個(gè)名字:認(rèn)知世界模型,Cognitive World Model。
說得更直白一點(diǎn),它想讓機(jī)器人擁有一顆會(huì)推演、會(huì)記憶、會(huì)自我更新的類腦認(rèn)知中樞。
VLA觸頂,世界模型站上C位
過去兩年,VLA是具身智能行業(yè)里的主流敘事。
這一技術(shù)的邏輯很直接:將視覺、語(yǔ)言和動(dòng)作統(tǒng)一進(jìn)一個(gè)端到端模型,機(jī)器人能看懂環(huán)境、理解指令,并直接輸出行動(dòng)。
這條路線已經(jīng)在一些場(chǎng)景里已經(jīng)驗(yàn)證了價(jià)值。比如分揀、上下料、簡(jiǎn)單裝配、倉(cāng)儲(chǔ)搬運(yùn)、零售后臺(tái)整理等任務(wù),環(huán)境相對(duì)可控,動(dòng)作鏈條相對(duì)明確,VLA能夠讓機(jī)器人從“能動(dòng)”進(jìn)一步走向“能按指令動(dòng)”。
但隨著真實(shí)場(chǎng)景變復(fù)雜,VLA的能力邊界也開始顯現(xiàn)。
![]()
首先是數(shù)據(jù)
換一批物體、換一個(gè)光照、換一種桌面布局,模型往往要補(bǔ)充新的示范數(shù)據(jù)。機(jī)器人看起來在學(xué)習(xí),很多時(shí)候仍然依賴人類提前喂給它的數(shù)據(jù)樣本。
其次是泛化
VLA更擅長(zhǎng)從數(shù)據(jù)中學(xué)習(xí)統(tǒng)計(jì)相關(guān)性。它能知道“看到這個(gè)東西,大概率要做這個(gè)動(dòng)作”,但面對(duì)物理因果、長(zhǎng)期后果和開放環(huán)境變化,穩(wěn)定性仍然不足。
再就是記憶
今天很多機(jī)器人完成一次任務(wù)后,很難像人一樣把經(jīng)驗(yàn)沉淀下來。下一次面對(duì)相似任務(wù),仍然容易從頭開始。
這也是行業(yè)里那句老話的來處:有多少人工,才有多少智能。
世界模型的價(jià)值,正在這里顯現(xiàn)。
它試圖讓機(jī)器人在行動(dòng)之前,先在內(nèi)部完成一次“推演”:
如果我這樣抓,杯子會(huì)不會(huì)倒?如果我往前走,這條路是不是會(huì)被障礙物擋住?如果我先打開柜門,再拿東西,任務(wù)鏈條是否更穩(wěn)?
人類每天都在做類似的事。
過馬路時(shí),人并不會(huì)精確計(jì)算每輛車的速度、距離和軌跡,但只要掃一眼,就能判斷什么時(shí)候能過、什么時(shí)候該停。
這背后依靠的不是單一感知能力,也不是動(dòng)作庫(kù),而是一套關(guān)于世界如何運(yùn)轉(zhuǎn)的心智模型。
具腦磐石要做的,就是把這套能力工程化,裝進(jìn)機(jī)器人系統(tǒng)里。
五層地圖,把世界模型講明白
世界模型很熱,但麻煩也在這里:大家口中的“世界模型”,常常指向不同的技術(shù)層級(jí)。
有人說的是3D空間建模,有人說的是視頻生成,有人說的是仿真和強(qiáng)化學(xué)習(xí),有人說的是JEPA,還有人說的是主動(dòng)推理。
朱森華把當(dāng)前世界模型的路線,自下而上拆成五層
![]()
第一層,是視覺真實(shí)
核心是從2D圖像走向3D空間理解。以李飛飛的World Labs為代表,解決的是“機(jī)器人怎么看世界”的基礎(chǔ)問題。
沒有這一層,后續(xù)的智能處理無(wú)從談起。
第二層,是物理真實(shí)
聚焦重力、摩擦、碰撞等物理規(guī)律的建模。以Sora等視頻生成模型為代表,模型試圖從海量視頻中學(xué)習(xí)物理直覺。
可問題在于,畫面逼真并不等于因果可靠。一個(gè)視頻可以非常像真實(shí)世界,但里面的物理邏輯未必穩(wěn)定。
第三層,是交互真實(shí)
這一層更接近仿真、強(qiáng)化學(xué)習(xí)和機(jī)器人試錯(cuò)。
它強(qiáng)調(diào)智能體通過“行動(dòng)—反饋”積累經(jīng)驗(yàn),DeepMind、英偉達(dá)等公司都在這一方向持續(xù)投入。
第四層,是抽象表征
這是Yann LeCun的JEPA架構(gòu)的領(lǐng)地。它讓模型在隱空間里學(xué)習(xí)狀態(tài)如何變化,減少對(duì)像素級(jí)重建和token級(jí)預(yù)測(cè)的依賴。
舉個(gè)例子,模型無(wú)需逐幀預(yù)測(cè)一個(gè)杯子未來每個(gè)像素會(huì)變成什么樣,而是學(xué)習(xí)“杯子被推了一下,大概率會(huì)往哪個(gè)方向移動(dòng),是否會(huì)倒下”。
第五層:主動(dòng)推理
這是具腦磐石最看重的一層。它來自認(rèn)知神經(jīng)科學(xué),背后包括自由能最小化、預(yù)測(cè)編碼、貝葉斯大腦等理論,是目前最接近人類智能本質(zhì)的理論框架。
翻譯成人話是:智能體會(huì)主動(dòng)形成假設(shè),預(yù)測(cè)結(jié)果,執(zhí)行動(dòng)作,再根據(jù)環(huán)境反饋修正自己的內(nèi)部模型。
也就是,邊想邊做,邊做邊學(xué)。
在具腦磐石看來,前三層更多解決“看見世界、模擬世界、訓(xùn)練世界”的問題;第四層開始進(jìn)入抽象表征;第五層則真正觸及機(jī)器人認(rèn)知能力的上限
也正因此,具腦磐石把自己定位為類腦智能驅(qū)動(dòng)的具身智能2.0公司
這個(gè)判斷帶有明確的技術(shù)立場(chǎng):機(jī)器人下一階段的競(jìng)爭(zhēng),不會(huì)只停留在動(dòng)作生成和遙操作數(shù)據(jù)規(guī)模上,而會(huì)進(jìn)入認(rèn)知世界模型、主動(dòng)推理、長(zhǎng)期記憶和持續(xù)學(xué)習(xí)的整合競(jìng)爭(zhēng)。
對(duì)標(biāo)JEPA,但多走一步
具腦磐石的技術(shù)路線,與Yann LeCun推動(dòng)的JEPA有著明顯關(guān)聯(lián)。
JEPA,全稱Joint Embedding Predictive Architecture,聯(lián)合嵌入預(yù)測(cè)架構(gòu)
它的核心價(jià)值,是讓模型在抽象表征空間里學(xué)習(xí)世界狀態(tài)的變化。相比逐像素預(yù)測(cè)、逐token擬合,這種方法更接近人類對(duì)世界的理解方式,也更適合處理復(fù)雜環(huán)境中的泛化問題。
但對(duì)機(jī)器人來說,只有“表征—預(yù)測(cè)”還不夠。
機(jī)器人最終要進(jìn)入真實(shí)物理世界。它需要感知環(huán)境、理解任務(wù)、預(yù)測(cè)后果、規(guī)劃動(dòng)作、執(zhí)行任務(wù),還要從失敗和反饋中繼續(xù)學(xué)習(xí)。
因此,具腦磐石提出的認(rèn)知世界模型,更像是一個(gè)面向具身落地的JEPA增強(qiáng)版
它要把JEPA的世界表征能力,推進(jìn)到一條完整鏈路里:感知,認(rèn)知,預(yù)測(cè),規(guī)劃,行動(dòng),反饋,學(xué)習(xí)。
這也讓具腦磐石與“世界模擬器”路線拉開差異。
具腦磐石追求的重點(diǎn),不是生成一個(gè)看起來足夠真實(shí)的視頻世界,而是為機(jī)器人提供一個(gè)可以參與真實(shí)任務(wù)閉環(huán)的認(rèn)知計(jì)算推理引擎。
圍繞這套目標(biāo),具腦磐石把技術(shù)攻關(guān)拆成四個(gè)方向。
第一,類腦感知編解碼機(jī)制。這對(duì)應(yīng)視覺、聽覺、力觸覺等多模態(tài)信息的融合,讓機(jī)器人更高效地理解真實(shí)環(huán)境。
第二,認(rèn)知?jiǎng)討B(tài)預(yù)測(cè)機(jī)制。這對(duì)應(yīng)物體交互、空間變化、重力、碰撞等物理規(guī)律的理解,讓機(jī)器人具備推演行動(dòng)后果的能力。
第三,終身學(xué)習(xí)記憶機(jī)制。這對(duì)應(yīng)經(jīng)驗(yàn)沉淀和持續(xù)學(xué)習(xí),讓機(jī)器人減少“學(xué)新忘舊”,逐步形成可遷移的任務(wù)經(jīng)驗(yàn)。
第四,低功耗稀疏計(jì)算架構(gòu)。這對(duì)應(yīng)未來機(jī)器人端側(cè)部署需求。真正進(jìn)入家庭、工廠、門店的機(jī)器人,不能長(zhǎng)期依賴高功耗云端推理。
這四個(gè)方向最終指向四個(gè)結(jié)果:低數(shù)據(jù)、高泛化、終身學(xué)習(xí)、低功耗。
這也是具身智能落地最難繞開的四道關(guān):數(shù)據(jù)成本、跨場(chǎng)景適應(yīng)、長(zhǎng)期運(yùn)行和算力約束。
具腦磐石的野心也在這里:它想把類腦智能從一個(gè)學(xué)術(shù)概念,推成可驗(yàn)證、可部署、可商業(yè)化的具身智能大腦架構(gòu)。
![]()
“華為具身大腦一號(hào)位”帶隊(duì),團(tuán)隊(duì)不止會(huì)做模型
融資落地后,具腦磐石也進(jìn)入了一個(gè)更具體的階段。
具腦磐石,這家成立于2025年的類腦世界模型公司,近日完成了新一輪億元級(jí)融資,本輪融資由具備深厚類腦與具身產(chǎn)業(yè)背景的頂尖產(chǎn)業(yè)資本領(lǐng)投,老股東及多家頂尖基金復(fù)投和跟投。
同時(shí),更新一輪融資也在同步交割中。多維資本擔(dān)任獨(dú)家財(cái)務(wù)顧問。
本輪融資后,具腦磐石將繼續(xù)投入核心技術(shù)研發(fā)、團(tuán)隊(duì)擴(kuò)充與全球市場(chǎng)拓展,重點(diǎn)推進(jìn)Cognitive World Model的研發(fā)、工程化落地和真實(shí)場(chǎng)景驗(yàn)證。
投資人愿意下注具腦磐石,除了世界模型這個(gè)方向足夠熱,也因?yàn)檫@支團(tuán)隊(duì)的配置相對(duì)少見。
有投資人將其評(píng)價(jià)為“國(guó)內(nèi)唯一兼具AI×腦科學(xué)交叉深度與產(chǎn)業(yè)落地廣度的組合”。
創(chuàng)始人朱森華是賓夕法尼亞大學(xué)認(rèn)知神經(jīng)科學(xué)博士、中科院博士后,長(zhǎng)期從事AI與腦認(rèn)知交叉研究。
進(jìn)入華為后,他曾任華為云AI算法創(chuàng)新Lab主任,主導(dǎo)過AI腦科學(xué)云平臺(tái)、盤古具身大模型、全球具身智能產(chǎn)業(yè)創(chuàng)新中心等項(xiàng)目,也曾擔(dān)任華為“天才少年”面試官。
在業(yè)內(nèi),他也因此被稱為“華為具身大腦一號(hào)位”。
聯(lián)合創(chuàng)始人劉晉宇則補(bǔ)上了產(chǎn)品化和全球商業(yè)化能力。
他長(zhǎng)期深耕AI機(jī)器人產(chǎn)品落地與全球化拓展,曾參與多個(gè)產(chǎn)品線從0到1孵化和規(guī)模化落地,在工業(yè)與商用場(chǎng)景中積累了豐富的產(chǎn)品定義、市場(chǎng)拓展和客戶交付經(jīng)驗(yàn)。
再往下看,具腦磐石核心團(tuán)隊(duì)覆蓋清華、北大、復(fù)旦、中科院等頂尖院所,也有華為、聯(lián)想、曠視、極智嘉等一線企業(yè)背景,形成了從前沿技術(shù)研究、軟硬件研發(fā)、工程化到商業(yè)化落地的全鏈路配置。
這對(duì)一家做“具身大腦”的公司來說很關(guān)鍵。
因?yàn)檎J(rèn)知世界模型最終要落到機(jī)器人系統(tǒng)里,既要處理模型架構(gòu)和主動(dòng)推理,也要面對(duì)本體差異、傳感器接入、動(dòng)作執(zhí)行、現(xiàn)場(chǎng)部署和客戶交付。
具腦磐石的團(tuán)隊(duì)結(jié)構(gòu),恰好覆蓋了從理論到工程、從算法到商業(yè)化的關(guān)鍵環(huán)節(jié)。
在商業(yè)化上,具腦磐石選擇了一條相對(duì)務(wù)實(shí)的路線。
公司不會(huì)等待通用機(jī)器人大腦完全成熟,再去談落地。
而是優(yōu)先沉淀具身技能學(xué)習(xí)、認(rèn)知地圖移動(dòng)導(dǎo)航、一腦多機(jī)協(xié)同等可復(fù)用模塊,在真實(shí)場(chǎng)景中形成數(shù)據(jù)與現(xiàn)金流閉環(huán),再反哺核心研發(fā)。
場(chǎng)景選擇上,具腦磐石也有明確標(biāo)準(zhǔn):客戶真實(shí)付費(fèi)、方案具備跨場(chǎng)景復(fù)制性、技術(shù)挑戰(zhàn)能夠倒逼核心模型迭代。
目前,該公司已在國(guó)內(nèi)外同步推進(jìn)多個(gè)行業(yè)客戶PoC,并簽約多家海內(nèi)外行業(yè)戰(zhàn)略合作伙伴。
產(chǎn)品路徑上,具腦磐石提出了“一腦多機(jī)、一腦多形”。
短期看,是用類腦智能驅(qū)動(dòng)的Agent框架支持多機(jī)協(xié)作;中期看,是探索單一認(rèn)知世界模型適配不同機(jī)器人本體;長(zhǎng)期看,則是向行業(yè)開放通用具身大腦模型。
對(duì)具腦磐石來說,此輪融資之后最重要的答卷,就是讓認(rèn)知世界模型在真實(shí)機(jī)器人任務(wù)中跑起來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.