網易首頁 > 網易號 > 正文申請入駐

具身智能，跟造車到底有什么關系？

2026-06-16 11:38:01　來源: TechWeb

北京舉報

分享至

具身智能，跟造車到底有什么關系？這是理想汽車CEO李想在Livis Day上自己拋出的問題。

過去一年，“具身智能”這個詞被反復提起，但一家造車公司，為什么也要湊這個熱鬧？

李想的回答很直接：今天的傳統智能汽車，并不是真的智能。

如果你用過任何一輛號稱“智能”的電動車，你會明白他在說什么。那些車本質上是“功能驅動”——自動泊車是一個功能，高速領航是一個功能，語音打開車窗是一個功能。它們是被動調用的工具，不是有自主意識的個體。遇到系統沒見過的場景，你必須接管；它的反應比你慢，它的判斷比你弱。

這算什么智能？

所以理想汽車給出了一套完整的定義：真正的具身智能汽車，是一輛能夠保護人類安全、獨立完成任務、比人類更高效的汽車。

而造車，恰好是具身智能最合理、也最迫切的落地場景。

為什么是車？車就是最好的“身體”

具身智能的核心，是智能體必須有一個物理身體，能夠在真實世界里感知、行動、交互。而汽車，是人類社會中規模最大、最復雜、最需要智能體能力的物理設備之一。

更重要的是，車每天都在參與人的生活。上班、旅行、接送家人——車是最親密的出行伙伴。如果能讓這輛車真正“智能”起來，不是彈出一個菜單，而是像一個職業司機那樣替你開車，像一個生活助手那樣幫你處理事務，那才是具身智能真正的價值。

理想汽車把這一定義拆解成了四個角色：電動車、職業司機、AI計算機、生活助手。四個角色集于一身，才是具身智能汽車。

這不是功能的堆砌，而是角色的融合。當你坐進這樣一輛車，你不需要“操作”它，你只需要“告訴”它。它會自己思考、自己行動、自己學習。

大腦怎么造？語言智能+機器智能，缺一不可

如果說車是身體，那什么才是大腦？

人腦從來不是單一中樞統管一切，它依靠四個獨立功能區并行運轉。理想汽車在設計具身智能大腦時，也采用了類似的分體式架構：語言智能負責理解指令、推演行動方案，機器智能負責三維視覺感知與軀體動作控制。

語言智能：兩個“馬赫”，各司其職

在語言智能方面，理想汽車推出了兩個模型：馬赫Mind-Pro和馬赫Mind-Edge。

馬赫Mind-Pro是一個云端Agent大模型。它采用了無損Token壓縮技術，整體Token平均消耗降低38%，任務完成率和推理準確率零衰減。它的TPS（每秒Token生成量）峰值達到208 token/s，是主流Agent模型推理效率的兩倍以上。

馬赫Mind-Edge則是端側原生具身智能體。它基于車載芯片和車輛硬件原生設計，采用多模態流式時序建模，具備全天候主動感知、人車交互、自主控車能力，而且全部在車端本地完成——低延遲、高可靠、數據不上傳。它就像一個時刻在車里的私人助理，不需要聯網也能實時照看你的家人。

機器智能：從“看見”到“看懂”

機器智能的核心，是今年5月隨全新理想L9首發的馬赫VLA。

它不是傳統的模塊化輔助駕駛。傳統架構中，感知、預測、規劃三個模塊各做各的，效率低、結果錯。而馬赫VLA是一個原生多模態MoE大模型——讓看見、理解、思考和行動從一開始就在同一個框架里徹底對齊。

最直觀的變化是：3D ViT行業首次上車。以前智能駕駛系統只能處理2D圖像，現在它能實時構建每個人在三維空間里的精確位置、姿態和動作。系統不再是“看見”物理世界，而是“看懂”物理世界。

數據也能說明問題。馬赫VLA背后，算力、數據、模型規模同時躍升：算力方面，雙馬赫M100提供2560TOPS算力；模仿學習數據量增加50%，強化學習數據量增加15倍；行泊一體模型參數量增加10倍，TPS增大15倍。

至于效果方面，截至2026年6月14日，理想全系車型智能輔助駕駛系統主動避險累計超過1727萬次，重大避險達55671次。馬赫VLA的綜合反應速度達到0.28秒，比普通人類駕駛員0.45秒的平均反應速度快約40%，接近頂級F1車手0.25秒的人類生理極限。在120km/h的速度下，這0.17秒的差距意味著提前6米完成剎停。

這種反應速度不是靠堆硬件堆出來的。理想汽車對全鏈路進行了深度重構：視覺輸入時延優化47%，模型推理鏈路縮短43%，線控底盤響應時延降低38%，操作系統調度編排時延降低28%。最終實現端到端時延優化40%。

更值得關注的是能力涌現。馬赫VLA已經可以實現自主倒車讓路、識別交警手勢、應對低矮不規則障礙物、穿越無車道線的雨夜窄路——這些場景靠傳統規則邏輯幾乎不可能實現，但它在大規模模仿學習和強化學習的混合訓練下，自己學會了。

自研芯片馬赫M100：不是為了造芯片而造芯片

馬赫VLA能實現0.28秒的反應速度，靠的不只是算法，還有一個關鍵基礎：一顆為AI而生的芯片。通用計算時代，馮·諾依曼架構（指令驅動計算）統治了七十年。但AI計算天然是數據驅動的——數據并行流動，計算隨數據而動。用舊架構硬跑AI模型，效率低、浪費大。

理想汽車從2022年立項，歷經三年半，設計了一種全新的數據流架構芯片——馬赫M100，全球首款量產的動態數據流AI芯片。它讓數據的流動驅動計算的發生，架構圍繞AI的計算形態來設計。參數上：5納米車規級工藝，單芯片算力1280TOPS，是目前全球量產性能最強的車規級推理芯片。更重要的是，因為數據流架構，它的實際運行效率超過82%——很多標稱算力很高的芯片，實際效率往往只有一半。

馬赫M100的能力遠不止于輔助駕駛。今天它已經跑通車上所有智能化場景：運行大語言模型、支撐Agent、驅動具身智能。運行35B參數大語言模型時，prefill速度達到頂尖桌面級AI超級計算機的2.7倍。

基于馬赫M100，理想汽車構建了完整的具身智能系統：芯片是“心臟”，感知系統是“眼睛”，馬赫模型是“大腦”，線控底盤和能源系統是“手腳”，星環OS是“神經系統”，實現“感知-決策-執行”全鏈路融合。

今年，理想汽車的OTA有三個重要節點；

7月：輔助駕駛的整體效率提升30%，以及利用主動懸架的便捷換胎能力和地圖出行Agent。

9月：學習人類的能力，獨立處理復雜場景，包括全場景自主倒車、路面學習能力。此外，Agent可以連接你的電腦和手機，CarPlay及其他手車互聯功能將一同上線。

12月：讓Livis的安全和效率，超越人類，實現反應速度比人快56%。同時還將實現艙外識別切換賬號，識別交警手勢等能力。

回到那個問題：具身智能，跟造車到底有什么關系？

造車，是具身智能最理想的落地場景。因為車是人類社會中最復雜、最普遍、最需要智能體能力的物理平臺。而具身智能，是讓這輛車從“功能驅動”進化為“自主智能體”的唯一路徑。

過去十年，理想汽車創造了一個移動的家——大空間、多屏幕、舒適的座椅、智能座艙。下一個十年，他們要做的，是給這個家賦予生命。

正如李想在發布會結尾說：“這就是我們這家公司存在的意義，也希望可以和所有人一起見證這個全新的時代。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.