![]()
昨天,全新理想L9 Livis發(fā)布會開完之后,如果只盯著新車參數(shù)看,很容易把它理解成一場旗艦SUV的常規(guī)升級:更強(qiáng)的算力、更先進(jìn)的底盤、更聰明的智駕、更豪華的家庭空間。
但這是理想要表達(dá)的核心嗎?
過去幾年,科技行業(yè)最熱鬧的地方在大模型。人們討論Chatbot,討論Agent,討論AI會不會寫代碼、做PPT、生成視頻,討論機(jī)器人什么時候能進(jìn)工廠、進(jìn)家庭。可所有這些討論最后都會落到一個問題上:AI如果只能停留在屏幕里,它再聰明,也只是一個答案機(jī)器。AI只有進(jìn)入物理世界,能感知、決策、行動,才真正開始改變生活和生產(chǎn)。
這也是“具身智能”突然變成熱門詞的原因。問題是,具身智能的第一臺大規(guī)模商業(yè)化設(shè)備會是什么?每個人有不同的想象和答案。
李想在與羅永浩的對談中,給了一個很有判斷力的定義:自動駕駛是具身智能的上半場,通用人形機(jī)器人是具身智能的下半場。此外,李想還系統(tǒng)化將上下半場分成共六個階段,并分別對應(yīng)具體落地時間節(jié)點,時間線從輔助駕駛初期的2018年,貫穿至2040年的通用人工智能(AGI)。
這句話的價值在于,它沒有把自動駕駛繼續(xù)放在汽車功能的小框里討論,而把車放進(jìn)了整個AI產(chǎn)業(yè)的下一階段里。汽車除了是交通工具和移動終端,更是一個在真實世界中高速移動、持續(xù)感知、實時決策并承擔(dān)安全責(zé)任的機(jī)器人。
昨天發(fā)布的全新理想L9 Livis,正是理想把這套判斷落到現(xiàn)實產(chǎn)品里的第一步。
AI的下一站,不求更會聊天,要長出肉身
過去兩年,AI產(chǎn)業(yè)的一個明顯變化是:人們不再滿足于它能回答什么,而開始追問它能替我做什么。
Chatbot時代,AI的核心能力是理解語言、生成內(nèi)容。它可以幫人搜索信息、寫文案、做分析、出主意。但從Chatbot到Agent,行業(yè)真正想完成的躍遷,是讓AI具備任務(wù)能力:理解目標(biāo)、調(diào)用工具、拆解步驟、執(zhí)行動作、反饋結(jié)果。
再往前一步,Agent如果要離開屏幕,進(jìn)入家庭、道路、工廠、商場這些真實空間,它就必須擁有身體。它要看見世界,理解空間,判斷風(fēng)險,控制動作,還要在不確定環(huán)境中持續(xù)學(xué)習(xí)。這就是具身智能的本質(zhì)。
從這個角度看,汽車其實天然就是具身智能最早成熟的形態(tài)之一。
一輛智能汽車要面對的物理世界,遠(yuǎn)比手機(jī)或電腦復(fù)雜得多。它每天都要處理天氣、光照、行人、車輛、施工、突發(fā)障礙物、道路博弈和用戶情緒。它不能只給出建議,而必須在毫秒級時間里做出動作。它的每一次判斷,都會直接影響人的安全和體驗。
所以,自動駕駛幾乎是具身智能最現(xiàn)實、最嚴(yán)苛、也最有商業(yè)規(guī)模的第一戰(zhàn)場。
李想提出“具身智能上下半場”論的背后,某種意義上是在給行業(yè)重新劃邊界。過去,自動駕駛、機(jī)器人、大模型、智能硬件經(jīng)常被分成不同賽道,各有各的估值邏輯和技術(shù)路線。但從具身智能的視角看,它們其實在共享同一組底層能力:感知、模型、芯片、操作系統(tǒng)、執(zhí)行器,以及真實場景中的數(shù)據(jù)閉環(huán)。
這也是汽車企業(yè)切入具身智能的特殊優(yōu)勢。
汽車企業(yè)沒有從0開始造一個“會動的AI”。它們原本就在制造一個復(fù)雜的移動機(jī)器,擁有大規(guī)模硬件交付能力、供應(yīng)鏈能力、安全驗證體系和真實用戶場景。智能駕駛積累的感知、規(guī)劃、仿真、模型訓(xùn)練能力,也可以遷移到更廣義的機(jī)器人系統(tǒng)中。
更重要的是,汽車是一個足夠大的商業(yè)場景。具身智能最難的地方是讓它在真實世界里持續(xù)運(yùn)行、迭代、創(chuàng)造價值,自動駕駛恰恰提供了這樣一個入口。
這也解釋了為什么理想此時要把自己從“新能源車企”重新定義為“具身智能企業(yè)”。
并非換一個更時髦的標(biāo)簽,產(chǎn)業(yè)邏輯推到了這里:當(dāng)汽車的競爭從電動化進(jìn)入智能化深水區(qū),真正決定上限的,不光靠電池、電機(jī)、電控,也不靠座艙屏幕和語音助手,靠誰能把AI真正接入物理世界。
中高端汽車未來3到5年的競爭,本質(zhì)上會越來越像具身智能系統(tǒng)的競爭。
誰能讓車看得更遠(yuǎn)、理解得更深、反應(yīng)得更快、動作更精確,誰就能在下一輪汽車產(chǎn)業(yè)格局里拿到主動權(quán)。
理想的“逆共識”,本質(zhì)是提前把車看成機(jī)器人
理想這家公司有一個很鮮明的特征:它并不總是站在行業(yè)共識最熱鬧的地方,但經(jīng)常站在用戶需求最終會抵達(dá)的地方。
第一次是增程。
在新能源行業(yè)早期,純電是更容易被資本、媒體和技術(shù)敘事認(rèn)可的方向。增程一度被看作不夠先進(jìn)的過渡路線。但理想判斷的是另一個更樸素的問題:對家庭用戶來說,補(bǔ)能焦慮、長途出行、全家乘坐的確定性,是不是比路線純粹性更重要?
后來市場證明,這個判斷并不浪漫,卻足夠有效。理想并非用增程對抗純電,而用增程解決當(dāng)時純電尚未完全解決的真實生活問題。
第二次是家庭SUV。
當(dāng)很多車企仍在強(qiáng)調(diào)性能、操控、品牌個性時,理想把家庭放在產(chǎn)品定義的中心。外界曾經(jīng)用“冰箱彩電大沙發(fā)”調(diào)侃它,但這套表達(dá)背后,其實是對汽車空間價值的一次重新理解。
車不只是駕駛機(jī)器,也不只是從A點到B點的交通工具。對很多中國家庭來說,它是周末出游的客廳,是孩子休息的第二空間,是一家人在路上的生活容器。理想把這個需求做得非常具體,也因此在中高端家庭SUV市場建立了清晰坐標(biāo)。
第三次,就是具身智能。
這一次的“逆共識”更大。因為它沒有選擇某一種動力路線,也沒有重新定義一個座艙場景,而是重新定義汽車本身。
在理想的說法里,全新理想L9 Livis被裝上了具身智能的五個關(guān)鍵部件:芯片是心臟,模型是大腦,感知系統(tǒng)是眼睛,底盤是手腳,操作系統(tǒng)是神經(jīng)系統(tǒng)。
這套比喻聽起來很直觀,理想確實開始按這個邏輯重構(gòu)技術(shù)和組織。
從時間線上看,這不是昨天才有的概念。理想從2021年立項自研操作系統(tǒng),2022年立項自研800V主動懸架和自研芯片,2023年立項自研大模型,隨后MindGPT、星環(huán)OS、端到端+VLM、VLA司機(jī)大模型陸續(xù)交付。到全新理想L9 Livis,芯片、模型、感知、底盤、操作系統(tǒng)第一次在一輛旗艦SUV上形成相對完整的閉環(huán)。
這條線索說明,理想不是湊具身智能的熱鬧,才把自動駕駛包裝成機(jī)器人概念。更準(zhǔn)確地說,它過去幾年做的很多“重投入”,現(xiàn)在開始被一個更大的戰(zhàn)略框架解釋清楚。
芯片和模型,是這套框架的核心。
李想把未來汽車競爭壁壘類比為手機(jī)行業(yè):手機(jī)時代,蘋果的壁壘來自芯片和操作系統(tǒng),高通芯片和安卓系統(tǒng)則支撐了另一套產(chǎn)業(yè)生態(tài)。到了具身智能時代,技術(shù)制高點會落到芯片和模型的聯(lián)合設(shè)計上。
這很關(guān)鍵。
過去行業(yè)喜歡談算力,動輒幾百上千TOPS。但進(jìn)入大模型和具身智能時代,僅有算力并不夠。芯片架構(gòu)要適配模型,模型訓(xùn)練要理解芯片約束,感知、規(guī)劃和控制要在端側(cè)穩(wěn)定運(yùn)行。未來真正的差距,只來自芯片和模型能否co-design。
這也是理想從2022年開始自研芯片、從2023年開始做基座模型的原因。
做這件事很貴,也很慢。理想2025年研發(fā)投入達(dá)到113億元,其中AI相關(guān)投入占比約50%。2026年研發(fā)投入計劃仍保持在120億元左右,AI相關(guān)投入繼續(xù)占約一半。這樣的投入是在為下一階段競爭建立底層能力。
更有意思的是組織變化。
理想在2026年1月進(jìn)行研發(fā)體系調(diào)整,從過去按軟硬件功能劃分部門,轉(zhuǎn)向按照“數(shù)字人”和“硅基人”的方式組織研發(fā)。它把芯片、數(shù)據(jù)集、操作系統(tǒng)放入“臟器系統(tǒng)”,把感知、預(yù)訓(xùn)練、后訓(xùn)練、強(qiáng)化學(xué)習(xí)和基礎(chǔ)設(shè)施放入“腦系統(tǒng)”,再把軟件Agent和硬件執(zhí)行體系分別作為“軟件本體”和“硬件本體”。
這聽起來有點像科幻,但背后是一個很現(xiàn)實的管理問題:當(dāng)汽車變成具身智能體,傳統(tǒng)車企按控制器、部門、零部件劃分的研發(fā)方式,會越來越難支撐系統(tǒng)級智能。
如果團(tuán)隊們分別只負(fù)責(zé)眼睛、大腦、手腳,但彼此之間沒有共同目標(biāo),那么最后很容易出現(xiàn)大腦很強(qiáng)、身體很遲鈍,或者硬件很先進(jìn)、軟件調(diào)不動的情況。具身智能需要系統(tǒng)協(xié)同,而非功能堆疊。
所以,理想這次真正值得行業(yè)關(guān)注的除了一輛新L9,還有它把一家車企的研發(fā)組織,開始改造成一個面向具身智能的系統(tǒng)工程組織。
![]()
這件事的行業(yè)意義在于:汽車公司未來的核心能力,可能不再局限于“造車能力+軟件能力”的簡單相加,更在于像造一個智能生命體一樣,同時具備心臟、大腦、眼睛、神經(jīng)和手腳。
這也是為什么“理想做AI不是冒險,不做才是冒險”這句話成立。因為如果汽車未來會成為具身智能的上半場,那么車企繼續(xù)只把自己理解為制造商,才是最大的戰(zhàn)略風(fēng)險。
L9 Livis是理想具身智能的第一具“肉身”
回到昨天發(fā)布的全新理想L9 Livis,它最值得討論的,就是它第一次把理想對具身智能的理解,裝進(jìn)了一輛可交付的量產(chǎn)車。
所謂具身,不能只有大腦。它必須有感知、計算、動作、系統(tǒng)調(diào)度,也有真實環(huán)境中的反饋。L9 Livis的意義在于,把五個關(guān)鍵系統(tǒng)放到了一起。
先看“心臟”。
全新理想L9 Livis搭載兩顆自研5納米馬赫M100芯片,有效算力達(dá)到2560 TOPS。這顆芯片是全球率先基于數(shù)據(jù)流架構(gòu)研發(fā)的大算力端側(cè)推理芯片,面向AI原生設(shè)計。它的重點不只是算力數(shù)字,而在于架構(gòu)可以服務(wù)模型。
這對于具身智能很重要。因為車在路上行駛時,智能不能完全依賴云端。它必須在端側(cè)完成大量實時推理,在極短時間內(nèi)處理復(fù)雜傳感器數(shù)據(jù),并把判斷轉(zhuǎn)化為動作。芯片就是這個系統(tǒng)的能量與計算供給。沒有足夠強(qiáng)、足夠匹配模型的端側(cè)推理能力,再先進(jìn)的模型也很難真正進(jìn)入物理世界。
再看“眼睛”和“大腦”。
L9 Livis搭載3D ViT感知模型和馬赫VLA模型。理想之所以說這代車“首次敢講具身智能”,關(guān)鍵就在于感知方式發(fā)生了變化。
過去很多智能駕駛系統(tǒng)對世界的理解,仍然帶有二維圖像識別的影子。它可以識別車道線、行人、車輛、紅綠燈,但對真實三維空間的理解還不夠充分。人類司機(jī)開車時,不只是看到物體,而是天然理解距離、速度、遮擋、空間關(guān)系和潛在意圖。
3D ViT的技術(shù)本身,就是讓車輛更接近這種三維空間理解。這一技術(shù)的意義,不僅僅是將車輛的感知能力大幅提升,而是下一階段,進(jìn)入到L4無人駕駛以及通用人形機(jī)器人下半場,一個AI具身機(jī)器人必備的感知能力。
馬赫VLA模型則對應(yīng)“會思考的司機(jī)”。它要處理的不止“前方有車所以減速”這種單一規(guī)則,還有更復(fù)雜的道路語境:施工路段如何繞行,前車爆胎如何防御性減速,遇到倒車車輛如何禮讓。具身智能的關(guān)鍵就在這里,它不能只識別物體,還要理解情境。不能只輸出答案,還要形成動作。
然后是“手腳”。
一輛車再聰明,如果底盤仍然停留在傳統(tǒng)機(jī)械邏輯里,智能就會被身體限制。L9 Livis搭載的“完全體”線控底盤和800V主動懸架,解決的是AI如何高效控制車輛身體的問題。
線控底盤包括線控轉(zhuǎn)向、后輪轉(zhuǎn)向和EMB線控機(jī)械制動。轉(zhuǎn)向和制動由電信號取代傳統(tǒng)機(jī)械或液壓路徑,意味著系統(tǒng)從發(fā)出指令到完成動作的鏈路更短、響應(yīng)更快。據(jù)理想介紹,線控機(jī)械制動相比傳統(tǒng)液壓制動縮短約0.1秒響應(yīng)時間,120公里/小時高速制動距離縮短3米以上。
800V主動懸架則讓四個車輪真正實現(xiàn)獨立解耦。它由4個800V液壓泵、4支雙閥CDC減振器與空氣彈簧組成,單輪主動支撐力超過1萬牛,并取消傳統(tǒng)防傾桿。遇到坑洼可以主動伸長,遇到凸起可以主動收縮,轉(zhuǎn)彎時主動抵消側(cè)傾,急加速不抬頭,急剎車不點頭。
這些技術(shù)聽起來像高端底盤配置,但放到具身智能語境里,它們的意義更深:汽車的“肉身”開始具備更高自由度、更快反應(yīng)速度和更強(qiáng)可控性。自動駕駛越往高階走,車輛越需要一個能被AI精確調(diào)用的身體。
最后是“神經(jīng)系統(tǒng)”。
星環(huán)OS承擔(dān)的角色,是把芯片、模型、傳感器、底盤、座艙和整車控制串聯(lián)起來。沒有操作系統(tǒng),硬件和軟件容易變成一堆孤島。有了自研操作系統(tǒng),車才能成為一個統(tǒng)一調(diào)度的智能體。
據(jù)介紹,星環(huán)OS配合全線控底盤,可以把端到端延遲壓縮到300毫秒左右,反應(yīng)速度比人類更快。這個指標(biāo)的重要性在于,具身智能不是靜態(tài)推理,它要在現(xiàn)實世界里連續(xù)感知、連續(xù)判斷、連續(xù)動作。延遲越低,系統(tǒng)越像一個協(xié)調(diào)的身體。
所以,全新理想L9 Livis的真正角色是它的第一個現(xiàn)實載體。
它先把“司機(jī)+生活助理”這件事放進(jìn)車?yán)铩N磥淼淖詣玉{駛不應(yīng)該只是把人從A點送到B點。一個真正的智能司機(jī),應(yīng)該能接孩子父母、洗車、充電、保養(yǎng),甚至在家庭生活中承擔(dān)一部分時間管理和任務(wù)執(zhí)行。車從交通工具變成家庭智能體,這是具身智能上半場最有可能率先落地的場景。
李想認(rèn)為,具身智能的上下半場的邊界銜接得非常緊密。未來買L4自動駕駛車的人和購買家政機(jī)器人的人,90%可能是同一撥人。這句話背后是一個很現(xiàn)實的判斷:對家庭來說,司機(jī)、保姆、家政都是時間和精力的再分配。
過去,這些服務(wù)只屬于極少數(shù)人,只有超級富豪可以同時擁有。科技進(jìn)步真正有公共價值的地方,是把原來少數(shù)人才能享受的服務(wù),通過規(guī)模化技術(shù)變成更多家庭負(fù)擔(dān)得起的能力。
這也是具身智能不同于上一輪移動互聯(lián)網(wǎng)的地方。
移動互聯(lián)網(wǎng)改變的是信息分發(fā)、社交關(guān)系和消費(fèi)方式。具身智能要改變的,是物理世界中的勞動、照護(hù)、出行和家庭服務(wù)。它影響的不只是屏幕上的內(nèi)容,而是人每天如何移動、生活、照顧家庭、把時間從重復(fù)事務(wù)中釋放出來。
理想的行動值得放在這個大背景下理解。
它不是唯一一家在做具身智能的公司,也不可能憑一輛車定義整個產(chǎn)業(yè)。但它的特殊性在于,它試圖用汽車這個已經(jīng)成熟的大規(guī)模商業(yè)載體,率先跑通具身智能的上半場:先讓車擁有更完整的身體,再讓車成為一個能夠感知、理解、行動、服務(wù)的智能體。
這件事如果成立,汽車產(chǎn)業(yè)和機(jī)器人產(chǎn)業(yè)之間的邊界會被重新劃定。車企不再只是車企,機(jī)器人公司也不再只是機(jī)器人公司,未來真正的競爭者,可能都是那些能同時掌握芯片、模型、系統(tǒng)、硬件和場景的具身智能公司。
結(jié)語
很多時候,行業(yè)喜歡把未來想象成一個突然降臨的東西:某一天,人形機(jī)器人走進(jìn)千家萬戶,L4自動駕駛?cè)嫫占埃珹I從屏幕里走出來,開始替人干活。
但真正的產(chǎn)業(yè)變化,往往不這樣發(fā)生。
它通常先偽裝成一次產(chǎn)品升級、一次系統(tǒng)迭代、一次組織調(diào)整,甚至一場看起來還在講車的發(fā)布會。直到幾年后回頭看,人們才發(fā)現(xiàn),新的行業(yè)邊界已經(jīng)被悄悄推開。
昨天的全新理想L9 Livis發(fā)布會,表面上還是一場新車發(fā)布會,但它背后的問題已經(jīng)超出了汽車行業(yè):AI如何擁有身體?具身智能如何商業(yè)化?機(jī)器人產(chǎn)業(yè)的第一階段會在哪里出現(xiàn)?一家車企怎樣從制造交通工具,走向制造能夠行動的智能體?
李想給出的“上下半場”答案已經(jīng)非常清晰,它提供了一個足夠清晰的跨行業(yè)觀察坐標(biāo)。這讓自動駕駛不再只是智駕功能的迭代,讓機(jī)器人不再只是遙遠(yuǎn)的科幻想象,也讓汽車重新獲得了一種更大的技術(shù)敘事。
過去十年,理想證明的是,一家車企可以通過理解家庭用戶,把被低估的需求做成一個市場。接下來十年,它要面對的問題更難:一家汽車公司能否把車真正做成具身智能時代的第一類大眾機(jī)器人。
這不是一個可以靠發(fā)布會完成的答案。但全新理想L9 Livis,至少讓這個問題第一次有了一具清晰的肉身。
本內(nèi)容由作者授權(quán)發(fā)布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4858911.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.