![]()
撰文 | 青竹 編輯|周長賢
你能想象,掃地機、割草機、具身智能……一切需要自己移動的載體,都跟乘用車、商用車和物流小車一樣,用同一套移動物理AI大模型嗎?
有的公司,還真這么想。這么想的,還不止一家。
而且,他們還覺得,這不是一個戰略判斷,而是一個生存問題。
入局物理AI和世界模型,在智能輔助駕駛圈,就像劇場效應,前排的人站起來了,后排就都沒得坐。
別管賺錢沒賺,有錢沒有,想留在牌桌,就必須跟牌。
“范式都差不多,差別無非是誰真的在做,誰做得好。”
“差距大概就是兩三個月、三四個月的技術迭代周期,沒有誰形成巨大的、難以逾越的代差。大家都在進步,你不進步,就會被淘汰。”
所以,有了當下車圈的物理AI集結號。
“做移動物理AI,一年不投入20個億,根本做不出來。從這個維度看,很多公司其實已經被篩選掉了。”
![]()
在卓馭會客廳,卓馭科技CTO馬陸給出一種判斷思路。
這個思路顯然與大模型的scalling law一致。
如此燒錢,為什么非要做?
不但經費不友好,也對車端算力有要求,對于原本就難賺的他們來說,難道不是自己給自己上強度?
要理解卓馭的「移動物理AI」,即「原生多模態基礎模型」,除了不卷生就卷死的競速(參數丨圖片)焦慮,還有技術范式和商業邏輯的考量。
說白了,求一條長遠生路。
20億的賬,「大」模型的必要性?
“中模型本身并不能自動泛化到完全沒覆蓋過的場景。”
馬陸這句話,直接給中模型下了判斷。但大模型的代價是驚人的。
“訓練一個中模型,一年花10個億;訓練一個大模型,起碼20到30億。做一家物理AI公司,一年總支出很容易就達到30億-50億量級。”
他說,行業現狀是,“智能駕駛軟件單套價值空間有限,需靠海量出貨才能撐起可觀營收。但目前行業尚無企業達到這般裝機規模,且單品收益還在持續走低。”
也就意味著:“你投入海量資源訓練出一個能力極強的、具備駕駛能力的大模型,在乘用車駕駛場景已經做得很好,但回報可能不足以收回成本。”
怎么辦?卓馭的回答是:讓這套大模型去服務一切能移動的東西。走出車廂,覆蓋全域移動場景。
![]()
同一個大模型,可以跑在乘用車、重卡、商用客車、無人物流車,甚至后裝車載無人機上。多業務板塊協同發力,用規模打開盈利空間,釋放最大商業價值。
于是,大模型和跨垂類似乎互為因果。
模型夠大,能力才夠跨垂類強泛化,才能減少適配的成本;而能跨垂類復用,才能養活大模型。
難道就不能各退一步,小而美嗎?
卓馭的回答是,不能。
答案來自判斷,也來自體驗。
“跟語言模型的發展非常相似,規模會越來越大。”
馬陸說,“智能輔助駕駛也一樣,目前大家最多只能算中模型,模型一定會變強,一定會全面超越舊的小模型或中模型。”
體驗上,他認為,“反應非常快。基本上做到了‘看見就有反應’。駕駛行為非常流暢和絲滑。很多曾經根本做不到的事情,一下子就能做到。”
![]()
所以,大模型的投入,本質是技術范式與競爭的必然要求。大模型所帶來的泛化能力、涌現能力、跨載體通用能力,中模型無法通過迭代達到。
大模型對應端側大算力,據馬陸透露,跑完整版至少需要700T以上的算力,但即使未來有200T的小版本,效果也會優于上一代。
理解世界,終將比適配世界,更值錢
除了「大」,卓馭這套基于移動物理AI的「原生多模態通用基礎模型」的詞匯也值得拆開說。
什么是原生?
馬陸解釋說,早年間用VLM,沒有動作能力,不是為了駕駛而設計。后來VLA 1.0時,喜歡用VLM做場景識別,「外掛式」的能力,并非模型原生具備。
而模型的「原生」能力,是指預訓練時就獲取理解、識別和預測能力,而不是外掛一個語言推理來輔助。
“核心還是要理解世界,不理解世界去做物理AI是不現實的。”
所以,物理AI以視覺為基礎來構建模型,而不是文本。
最終實現理解過去狀態的能力,并能基于此預測未來狀態。實際上就是理解環境和移動自己兩件事。
為什么強調「多模態」?
因為預訓練階段就實現對視頻、文本、動作、語音、地圖等多種信息的統一處理和表征。
“具備了理解能力之后,同時采集大量的駕駛數據。給模型30秒的視頻片段,告訴它這是一個駕駛場景,看到很多傳感器信息,包括圖像、激光雷達等數據,同時也看到了人類駕駛的軌跡。”
模型的「通用」,可以理解為一種升維。
不止學會開車和認路,而是理解移動和物理世界。正是基于理解的推理本質的遷移,讓卓馭可以在泛化上大作文章。
![]()
過去通用基礎能力不足,代價是每一次跨地域、跨車型、跨垂類部署,都會帶來效率損失和成本。嚴重依靠在后期泛化中打補丁。
而原生多模態基礎模型的強泛化能力,則會帶來商業邏輯的變遷。帶來跨場景、跨城市、跨垂類的Zero-shot知識遷移,做到“開箱即用”。
![]()
在傳統模式下,一套方案從乘用車遷移到商用重卡,幾乎等同于重新開發一次。
一臺重卡的電架構、轉向響應、制動距離、轉彎半徑和家用車完全不同;不能急剎車的開車模式也不同。靠后期,意味著巨大工作量。
這也為出海提供了“一套模型打天下”的支撐。無需逐城適配,無需大量本地數據喂養。
把成本砸到模型中,縮短后期驗證周期和成本;盡量多的復用,用軟件的邊際效應優勢來跑通商業邏輯,攤薄基座大模型的固定成本。
結語
移動物理AI的大模型是多模態、多垂類、多場景的命題式需求,也是頭部企業商業求生求發展的范式升級。
美好的一面是,會給智駕帶來N倍的效率、安全提升和智能普惠。
現實的一面是,模型越大,成本越高,玩家越少。
更遠的暢想是,“最終都是要實現AGI。”
—THE END—
出行百人會 | AutocarMax
追蹤出行與智能產業鏈進化,關注新產品、新科技、商業邏輯與人物,影響有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.