作者 |德新
編輯 |王博
![]()
去年上海車展,「全民智駕」是最熱的關鍵詞,當時車企爭先量產是端到端城區輔助駕駛,誰先把高階智駕推向更廣泛的用戶,誰就更容易抓到市場的注意力。轉眼到了 2026 年北京車展,汽車行業再次被 AI 的風暴裹挾,但注意力的焦點來到了座艙智能體。
這波座艙智能體上車,背后至少有兩層直接刺激。 第一是特斯拉在2025年推動 Grok 上車,讓汽車行業第一次較為完整地感受到,座艙大模型不只是一個更聰明的語音助手,它可以帶來新的交互、信息獲取方式,以及更強的陪伴感和情緒價值。
第二,則是2026年初智能體熱潮的迅速爆發。OpenClaw 的走紅,讓整個行業進一步意識到,AI 不應該只停留在“聊天”層,而是要進入“執行”層,真正變成一個能理解目標、調用工具、完成任務的系統。
也正因此,圍繞「車載智能體」,中國汽車行業正在展開新一輪競爭。4月21日,榮威宣布與火山引擎深度合作在行業內第一家打造「AI原生汽車」,算是拉開了這輪新角逐的序幕。
如果說去年的關鍵詞是“端到端智駕”,那今年北京車展的隱藏關鍵詞就是“AI 智能體”。 座艙智能體,正在成為車企打造 AI 汽車的一道新分水嶺。
一、學習Grok,超越Grok
座艙智能體要大熱,其實早有先兆。
HiEV 獲悉,在幾個月前的美國 CES 期間,多家國內車企的 CTO 帶隊在當地試駕特斯拉,重點體驗當時最新的 FSD V14.2,以及剛上車不久的 Grok。
期間,不少車企中層甚至專門從洛杉磯、舊金山等地驅車前往拉斯維加斯,完整體驗數百甚至上千英里的「FSD + Grok」。
特斯拉對 Grok 的接入其實還很克制,它的車端能力有限,更多是與導航結合,沒有深入車控。但即便如此,Grok 所展現出來的大模型能力,仍然給很多業內人士留下了很深的印象:更自然的對話、更強的檢索能力以及情緒。它展示出一種明顯不同于傳統車機語音助手的交互質感。 這讓行業內意識到,車內的交互入口,正在被大模型重新定義。
過去,車內語音系統解決的更多是“命令識別”問題:用戶一句相對標準的指令,語音助手將其映射為車控操作。但大模型帶來的變化是,系統開始嘗試理解更自然、更模糊的表達,并進一步接手信息獲取、任務拆解乃至行動執行。
在這之后,追趕特斯拉「FSD + Grok」的組合,迅速成為國內激進派車企和供應鏈玩家的共識。 到了北京車展上,圍繞「中國版 Grok」和更廣義的車載智能體,已經至少出現了三類玩家。
![]()
第一類,是頭部模型公司與云服務商。
火山引擎發布基于AI智能體架構的新一代解決方案,目標是幫助車企打造AI大腦,通過聯通車控、導航、智駕等關鍵功能域,實現 "感知 - 推理 - 執行 - 記憶 - 學習" 一體化閉環。
這個AI大腦,支持以完整產品(豆包座艙助手)交付或者靈活選配(AI座艙套件)的方式與車企開展合作。
第二類,是芯片與基礎平臺公司。比如地平線,除了推出艙駕融合平臺星空,也發布了座艙智能體平臺「KakaClaw」,希望把智能體做成下一代平臺的核心能力。
第三類,則是開始自研或者半自研智能體能力的主機廠,它們的目標不是接入一個助手,而是把智能體本身,變成品牌體驗的一部分。
準確地說,北京車展上扎堆出現的,已經不是“中國版 Grok”,而是一個更深度接入車輛、能在真實物理世界中為用戶服務的車載智能體。人們不再滿足于 AI 只是能說會道,而是開始被要求真正“做事”。
而中國市場恰恰為這個變化提供了很好的土壤。
過去幾年,新能源汽車快速發展,車內電子電氣架構不斷演進,SOA 軟件架構也逐漸成熟,這使得大模型不再只是停留在屏幕里,而是開始真正接入車控、接入服務、接入車輛狀態系統,新一代助手,開始第一次真正進入車里的物理世界。
二、為什么汽車成為AI落地最快的終端?
一個有意思的問題是:為什么 AI 手機還沒有普及,汽車卻成為第一批被 AI 深度改造的硬件終端?
汽車是天然是一個非常適合智能體落地的場景。手機端的人機交互體驗已經非常成熟、絲滑,火山引擎副總裁、火山引擎汽車業務負責人楊立偉認為,相比之下,汽車的人機交互還有很大的挖掘空間,如果能從50分提升到80分,用戶感知會非常明顯。
其次,AI 模型的效果,很大程度上依賴上下文。汽車恰恰是一個高上下文、高感知密度、同時又擁有明確可調用能力的終端。它知道用戶在哪、要去哪里、車里有誰、當前時間、車外環境、車端硬件設備狀態等等,這些信息都能成為 AI 理解用戶需求的上下文輸入。
最后,汽車又不是一個純粹信息終端。它擁有大量可以被調用的能力:空調、車窗、座椅、導航、娛樂系統、車輛狀態,未來甚至可以進一步連接泊車、行車以及外部服務。這意味著 AI 上車以后,不僅能“理解”,還更容易“執行”。 用戶的一句話,最終可以變成空調調節、路線規劃、音樂切換、座椅聯動,甚至進一步變成一個個復雜任務的自動編排。
以這屆車展上發布的新一代豆包座艙助手為例,它所展示出來的,已經不是傳統語音助手那種“聽清楚一句命令,再執行一個動作”的邏輯,而更接近一個成形的智能體。
在技術架構上,它包含了對話推理引擎、目標驅動引擎、學習成長引擎三大引擎:
對話推理引擎,可以實現像真人一樣自然交流,而不需要人像過去一樣以相對固定、機械的方反倒適應車端語音。通過端側的大模型拒識、VLM識別和豆包輸入法同款的ASR能力,豆包在車端的對話可以做到全時免喚醒詞和多人對話,每次交流都會在該出現的時候自然加入對話,也可以隨時打斷、隨時插話。
目標驅動引擎,基于任務目標和環境反饋自主調用車載的工具,讓車機能像真人一樣處理事務。它可以把復雜、多步驟、跨場景的任務,從頭到尾幫你辦完,不用你反復交代。例如,根據后排孩子的狀態和車端記憶,選用合適的多種方式:唱歌、放動畫片、講故事、做游戲、哄睡等,陪伴孩子整個旅途。
學習成長引擎,像人一樣不斷在過程中總結經驗,持續改進。這個學習的范圍不限于偏好、話題、場景類等基礎記憶能力,還能在任務執行過程里沉淀經驗,形成可復用的Skill。
這三大引擎支持豆包的模型上車之后,能像人一樣自由交流、辦事高效有智商,并且伴隨著使用越來越好用,從而成為一個真正可以成長的AI大腦。
在北京車展之前,榮威已經與火山引擎宣布深度戰略合作。榮威新的家越序列,將與火山引擎聯合開發的AI大腦,榮威將其定義為新一代「AI 原生汽車」。家越序列首批一口氣規劃了三款車型09/07/06,其中第一款車07將在6月的火山引擎Force大會上展示能力預覽。
這種深度合作背后反映出,主機廠對于下一代座艙入口的判斷:誰先把 AI 內化為核心能力,誰就更有機會在下一輪競爭中占據主動。
三、座艙智能體真正的分水嶺,是能不能做事
今天大模型上車,和過去傳統車內語音助手最大的差別,到底是什么? 表面上看,似乎是對話更自然、情緒價值更高,但本質上是能不能做事。
過去車內的語音助手,更加像一個基于規則的自然語言處理系統(NLU),因此它一般只能處理相對固定、明確的命令——比如“把空調調到22度”、“打開主駕座椅加熱”等等,這樣的系統在面對模糊表達、復雜上下文、多輪任務以及跨功能調度時,往往會迅速暴露出局限。
有車企軟件工程師對 HiEV 形容,過去很多車內語音系統,某種程度上就是「分詞器」。而今天大模型帶來的變化是,語言模型開始被接到車端的 function call(函數調用) 以及狀態系統上。
簡單來說,就是讓模型不僅理解用戶說了什么,還能進一步調用車上的具體能力,把語言真正翻譯成執行動作。狀態系統的接入則意味著,AI 在執行動作時,不是盲目地下發命令,而是會參考當前車輛和座艙的實際狀態:車窗是否已經打開、座椅加熱是否開啟、用戶是否處于疲勞狀態、車輛當前是否處于安全可執行的場景。這兩者結合在一起,才讓 AI 在車上恰到好處地「提供服務」。
以火山引擎的思路為例,內部團隊大約從2023年開始就將一部分研究重心放在了用AI模型來生成 function call,而當時汽車行業大部分其他的團隊還熱衷于讓AI閑聊或者畫畫。
在能夠利用大模型進行穩定的車端原子能力的控制之后,他們又進一步引入了環境變量和端狀態(車內的設備狀態),這樣讓模型在決策時能夠理解上下文、降低誤判,并盡量降低“幻覺”。
某種程度上,這跟輔助駕駛的端到端類似,也是一種座艙大模型的「端到端」。
四、AI上車,真正改變的是什么?
這輪車載智能體升級帶來什么變化?
首先,用戶視角下,車端的對話體驗會從聊天走向任務閉環。 過去,車機是一問一答;今天,新的車載智能體更重要的能力,是把一個目標拆解成若干動作,并推動任務走向完成。用戶一句模糊的意圖,系統就能夠理解、規劃、執行,并在必要時繼續追問或調整。
功能開發的視角,類似豆包座艙助手這樣的AI大腦把智駕、座艙、車控、導航、環境感知等整車功能域打通,它越來越像一個調度中樞,那未來車機比拼的也是誰有更多、更好用的完整skill。
第三層,技術部署上,從云端智能走向端云混合。 車里的很多能力,不可能完全依賴云端,涉及實時響應、隱私和安全決策等能力,更多會放在端側;而更復雜的知識推理、長鏈條規劃和外部信息獲取,則仍然適合由云端提供支持。
未來的車載智能體,大概率不會是一個純粹的云端AI,而是一套端云協同的系統工程。 譬如火山引擎這次也跟與英偉達深度合作推出端側AI產品“火山聆眸”,基于英偉達的計算平臺,豆包端側模型具備視覺理解能力,能在保障用戶隱私、本地處理的前提下,提供多模態的交互體驗。
到2026年北京車展,汽車行業已經開始更普遍意識到:AI 不只是給車增加了一個助手,它更可能重寫的是車內的入口、交互方式,甚至品牌差異化的邏輯。
過去幾年,汽車行業先卷尺寸,再卷舒適配置,也卷過了輔助駕駛,從這屆車展開始,競爭正在進入一個新的階段:誰能把車載智能體做成真正的入口,誰就有機會在下一輪 AI 汽車競爭中掌握更大的主動權。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.