具身智能,跟造車到底有什么關系?這是理想汽車CEO李想在Livis Day上自己拋出的問題。
![]()
過去一年,“具身智能”這個詞被反復提起,但一家造車公司,為什么也要湊這個熱鬧?
李想的回答很直接:今天的傳統智能汽車,并不是真的智能。
如果你用過任何一輛號稱“智能”的電動車,你會明白他在說什么。那些車本質上是“功能驅動”——自動泊車是一個功能,高速領航是一個功能,語音打開車窗是一個功能。它們是被動調用的工具,不是有自主意識的個體。遇到系統沒見過的場景,你必須接管;它的反應比你慢,它的判斷比你弱。
這算什么智能?
所以理想汽車給出了一套完整的定義:真正的具身智能汽車,是一輛能夠保護人類安全、獨立完成任務、比人類更高效的汽車。
而造車,恰好是具身智能最合理、也最迫切的落地場景。
為什么是車?車就是最好的“身體”
具身智能的核心,是智能體必須有一個物理身體,能夠在真實世界里感知、行動、交互。而汽車,是人類社會中規模最大、最復雜、最需要智能體能力的物理設備之一。
更重要的是,車每天都在參與人的生活。上班、旅行、接送家人——車是最親密的出行伙伴。如果能讓這輛車真正“智能”起來,不是彈出一個菜單,而是像一個職業司機那樣替你開車,像一個生活助手那樣幫你處理事務,那才是具身智能真正的價值。
理想汽車把這一定義拆解成了四個角色:電動車、職業司機、AI計算機、生活助手。四個角色集于一身,才是具身智能汽車。
這不是功能的堆砌,而是角色的融合。當你坐進這樣一輛車,你不需要“操作”它,你只需要“告訴”它。它會自己思考、自己行動、自己學習。
大腦怎么造?語言智能+機器智能,缺一不可
如果說車是身體,那什么才是大腦?
人腦從來不是單一中樞統管一切,它依靠四個獨立功能區并行運轉。理想汽車在設計具身智能大腦時,也采用了類似的分體式架構:語言智能負責理解指令、推演行動方案,機器智能負責三維視覺感知與軀體動作控制。
語言智能:兩個“馬赫”,各司其職
在語言智能方面,理想汽車推出了兩個模型:馬赫Mind-Pro和馬赫Mind-Edge。
馬赫Mind-Pro是一個云端Agent大模型。它采用了無損Token壓縮技術,整體Token平均消耗降低38%,任務完成率和推理準確率零衰減。它的TPS(每秒Token生成量)峰值達到208 token/s,是主流Agent模型推理效率的兩倍以上。
馬赫Mind-Edge則是端側原生具身智能體。它基于車載芯片和車輛硬件原生設計,采用多模態流式時序建模,具備全天候主動感知、人車交互、自主控車能力,而且全部在車端本地完成——低延遲、高可靠、數據不上傳。它就像一個時刻在車里的私人助理,不需要聯網也能實時照看你的家人。
機器智能:從“看見”到“看懂”
機器智能的核心,是今年5月隨全新理想L9首發的馬赫VLA。
它不是傳統的模塊化輔助駕駛。傳統架構中,感知、預測、規劃三個模塊各做各的,效率低、結果錯。而馬赫VLA是一個原生多模態MoE大模型——讓看見、理解、思考和行動從一開始就在同一個框架里徹底對齊。
最直觀的變化是:3D ViT行業首次上車。以前智能駕駛系統只能處理2D圖像,現在它能實時構建每個人在三維空間里的精確位置、姿態和動作。系統不再是“看見”物理世界,而是“看懂”物理世界。
數據也能說明問題。馬赫VLA背后,算力、數據、模型規模同時躍升:算力方面,雙馬赫M100提供2560TOPS算力;模仿學習數據量增加50%,強化學習數據量增加15倍;行泊一體模型參數量增加10倍,TPS增大15倍。
至于效果方面,截至2026年6月14日,理想全系車型智能輔助駕駛系統主動避險累計超過1727萬次,重大避險達55671次。馬赫VLA的綜合反應速度達到0.28秒,比普通人類駕駛員0.45秒的平均反應速度快約40%,接近頂級F1車手0.25秒的人類生理極限。在120km/h的速度下,這0.17秒的差距意味著提前6米完成剎停。
這種反應速度不是靠堆硬件堆出來的。理想汽車對全鏈路進行了深度重構:視覺輸入時延優化47%,模型推理鏈路縮短43%,線控底盤響應時延降低38%,操作系統調度編排時延降低28%。最終實現端到端時延優化40%。
更值得關注的是能力涌現。馬赫VLA已經可以實現自主倒車讓路、識別交警手勢、應對低矮不規則障礙物、穿越無車道線的雨夜窄路——這些場景靠傳統規則邏輯幾乎不可能實現,但它在大規模模仿學習和強化學習的混合訓練下,自己學會了。
自研芯片馬赫M100:不是為了造芯片而造芯片
馬赫VLA能實現0.28秒的反應速度,靠的不只是算法,還有一個關鍵基礎:一顆為AI而生的芯片。通用計算時代,馮·諾依曼架構(指令驅動計算)統治了七十年。但AI計算天然是數據驅動的——數據并行流動,計算隨數據而動。用舊架構硬跑AI模型,效率低、浪費大。
理想汽車從2022年立項,歷經三年半,設計了一種全新的數據流架構芯片——馬赫M100,全球首款量產的動態數據流AI芯片。它讓數據的流動驅動計算的發生,架構圍繞AI的計算形態來設計。參數上:5納米車規級工藝,單芯片算力1280TOPS,是目前全球量產性能最強的車規級推理芯片。更重要的是,因為數據流架構,它的實際運行效率超過82%——很多標稱算力很高的芯片,實際效率往往只有一半。
馬赫M100的能力遠不止于輔助駕駛。今天它已經跑通車上所有智能化場景:運行大語言模型、支撐Agent、驅動具身智能。運行35B參數大語言模型時,prefill速度達到頂尖桌面級AI超級計算機的2.7倍。
基于馬赫M100,理想汽車構建了完整的具身智能系統:芯片是“心臟”,感知系統是“眼睛”,馬赫模型是“大腦”,線控底盤和能源系統是“手腳”,星環OS是“神經系統”,實現“感知-決策-執行”全鏈路融合。
今年,理想汽車的OTA有三個重要節點;
7月:輔助駕駛的整體效率提升30%,以及利用主動懸架的便捷換胎能力和地圖出行Agent。
9月:學習人類的能力,獨立處理復雜場景,包括全場景自主倒車、路面學習能力。此外,Agent可以連接你的電腦和手機,CarPlay及其他手車互聯功能將一同上線。
12月:讓Livis的安全和效率,超越人類,實現反應速度比人快56%。同時還將實現艙外識別切換賬號,識別交警手勢等能力。
回到那個問題:具身智能,跟造車到底有什么關系?
造車,是具身智能最理想的落地場景。因為車是人類社會中最復雜、最普遍、最需要智能體能力的物理平臺。而具身智能,是讓這輛車從“功能驅動”進化為“自主智能體”的唯一路徑。
過去十年,理想汽車創造了一個移動的家——大空間、多屏幕、舒適的座椅、智能座艙。下一個十年,他們要做的,是給這個家賦予生命。
正如李想在發布會結尾說:“這就是我們這家公司存在的意義,也希望可以和所有人一起見證這個全新的時代。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.