无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

端到端之后,AI 智駕進入“造世界”階段

0
分享至


圖片系 AI 生產(chǎn)

近日,CVPR 2026 在美國丹佛開幕。作為計算機視覺領域最重要的學術(shù)會議之一,CVPR 一直被視為 AI 技術(shù)演進的風向標。今年,一個明顯變化是,AI 的焦點正在從“識別世界”進一步轉(zhuǎn)向“理解世界、預測世界并與世界互動”。

這一趨勢在自動駕駛領域表現(xiàn)得尤為直接。今年 CVPR 首次開設具身智能基座模型部署研討會,特斯拉 AI 軟件副總裁 Ashok Elluswamy、小鵬集團通用智能中心負責人劉先明等來自產(chǎn)業(yè)一線的技術(shù)負責人,分享了各自團隊在具身智能和自動駕駛基座模型上的進展。

Ashok Elluswamy 重點討論的是特斯拉如何構(gòu)建面向機器人的基座模型,包括大規(guī)模多模態(tài)模型的架構(gòu)、數(shù)據(jù)與訓練,以及從像素輸入到執(zhí)行控制的端到端 “pixels-to-actuation” 方法,同時也涉及評測協(xié)議、安全考量和真實世界可靠部署。

相比學術(shù)概念本身,更值得關(guān)注的是車企對 AI 智駕底層能力的重新定義。當模型不再只是識別車輛、行人和車道線,而是直接從視頻流、導航指令等輸入中輸出駕駛動作,車企該如何判斷它真的懂得開車?又該如何在低成本、可復現(xiàn)、可控的環(huán)境中驗證它的安全邊界?

這也是世界模型在這次 CVPR 上被推到前臺的背景。

VLA 之后,AI需要理解“世界的變化”

過去一年,VLA 是自動駕駛領域最熱的技術(shù)關(guān)鍵詞之一。它試圖把視覺、語言和動作統(tǒng)一到同一個模型框架中,讓系統(tǒng)直接從視頻流、導航指令等輸入中生成駕駛動作。簡單說,VLA 就像是在學習人類司機會怎么開車。

劉先明去年曾在 CVPR 介紹正在研發(fā)中的第二代 VLA 模型;不到一年后,基于該模型的輔助駕駛軟件已經(jīng)進入量產(chǎn),并在推送首月實現(xiàn)輔助駕駛里程占比超過 50%。

但端到端智駕越往前走,另一個問題越突出:模型可以模仿人類駕駛,卻未必真正理解每個動作之后的物理后果。比如此刻選擇變道,旁車會不會逼近?前車突然減速時,系統(tǒng)是否還能平穩(wěn)處理?

世界模型要補上的,正是這層能力。

劉先明在演講中提到,小鵬物理世界基座模型既包括第二代 VLA,也包括世界模型。二者不是路線之爭:VLA 學習“如何行動”,世界模型學習“行動之后世界會如何變化”。

這背后是自動駕駛 AI 范式的變化。過去模型主要依賴人類駕駛數(shù)據(jù)進行行為學習,但人類動作信號相對稀疏,只能告訴模型“最后怎么做”。世界模型則通過預測下一幀、下一狀態(tài)或未來表征,從海量視頻中學習交通環(huán)境的運動規(guī)律、空間關(guān)系和因果結(jié)構(gòu)。

X-World:讓 AI 在視頻空間里模擬未來

小鵬此次重點展示的 X-World,是其世界模型體系中的代表性技術(shù)。根據(jù)論文描述,X-World 是一個可控的多攝像頭生成式世界模型。它的輸入包括歷史多視角攝像頭視頻、未來自車動作,以及可選的動態(tài)交通參與者、靜態(tài)道路元素、天氣和時間等條件;輸出則是未來一段時間內(nèi)車輛多路攝像頭可能看到的視頻畫面。

更直白地說,它不是簡單生成一段“像道路”的視頻,而是在回答一個駕駛問題,如果車輛接下來執(zhí)行某個動作,周圍世界會變成什么樣?

X-World 使用七路環(huán)視攝像頭,包括前窄角、前魚眼、前左、前右、后左、后右和后視攝像頭,形成 360 度環(huán)繞視野,這決定了它要解決的是多攝像頭一致的視頻仿真。

論文顯示,自動駕駛世界模型的難點在于,畫面看起來真實遠遠不夠。它至少要滿足三個要求:動作可控、場景可編輯、多視角一致。

首先是動作可控。同一個初始場景下,如果輸入右轉(zhuǎn)、左轉(zhuǎn)、變道或直行,模型生成的未來畫面必須嚴格反映不同駕駛動作的結(jié)果。X-World 展示了這種能力:模型可以根據(jù)不同自車軌跡,生成右轉(zhuǎn)、左轉(zhuǎn)、車道保持和變道等不同未來視頻。

這對智駕評測非常重要。真實道路上,一輛車在一個路口只能做出一次選擇;但在世界模型里,同一個場景可以反復測試多種策略,例如等待、繞行、變道或剎停,從而觀察不同決策帶來的后果。

其次是場景可編輯。X-World 不只控制自車動作,還能控制動態(tài)交通參與者和靜態(tài)道路元素。動態(tài)對象包括車輛、行人、自行車,靜態(tài)元素包括車道線、道路邊界和交通標志。

這意味著,研發(fā)團隊可以主動制造長尾場景。比如在原本正常通行的道路視頻中,插入一個從遮擋車輛后方突然出現(xiàn)的騎行者,再測試自動駕駛系統(tǒng)是否能夠及時剎停。

第三是多視角一致和長時序穩(wěn)定。自動駕駛仿真不能只是前視畫面流暢,還要保證前視、側(cè)視、后視中的車輛、道路、邊界關(guān)系彼此一致。為此,X-World 在架構(gòu)上引入 view-temporal self-attention,同時建模時間維度和多攝像頭視角之間的關(guān)系,以保持跨視角幾何一致性、目標身份一致性和運動連續(xù)性。

小鵬的論文中,還展示了 24 秒多攝像頭長序列生成,強調(diào)模型可以在較長時間內(nèi)保持畫面穩(wěn)定,避免生成式模型常見的漂移問題。

AI 智駕的新分水嶺:路測之外,還要有仿真閉環(huán)

從行業(yè)角度看,世界模型的價值并不在于“視頻生成得多逼真”,而在于它可能成為端到端智駕的訓練場和考場。

這種趨勢并非小鵬一家車企的獨立判斷,特斯拉 AI 軟件副總裁 Ashok Elluswamy 也討論了特斯拉構(gòu)建機器人基座模型的原則和方法。這說明,全球頭部玩家正在形成類似共識:自動駕駛不再只是車輛功能競爭,而是具身 AI 在真實物理世界中感知、決策、行動和持續(xù)學習的問題。

差異在于路徑不同。特斯拉更強調(diào)以大規(guī)模車隊數(shù)據(jù)、端到端控制和機器人平臺打通能力;小鵬則試圖通過 VLA 與世界模型結(jié)合,補齊可控仿真、長時序推演和反事實測試這一層能力。

真實道路測試成本高、風險大、復現(xiàn)難,尤其難以覆蓋低頻危險場景。世界模型則可以通過反事實推演和場景編輯,讓同一場景被重復測試,罕見風險被主動構(gòu)造,模型在虛擬環(huán)境中暴露問題。

這說明,AI 智駕競爭已經(jīng)不只是單點算法比拼,而是模型、數(shù)據(jù)、算力、芯片、編譯器和工程效率的系統(tǒng)競爭。小鵬披露的數(shù)據(jù)顯示,其第二代 VLA 模型擁有數(shù)十億參數(shù),使用上億視頻片段訓練,每版模型訓練量超過 4 萬億 Token;在截至今年 3 月的一年間,小鵬集群單 GPU 訓練效率提升 1010%,單任務訓練效率提升 4360%,GPU 硬件利用率從 40%提升到 90%。

當然,世界模型還不能被簡單等同于真實世界。生成視頻穩(wěn)定,不代表物理規(guī)律完全準確,尤其在極端天氣、復雜博弈、施工改道和非理性駕駛場景中,世界模型仍需要大量真實數(shù)據(jù)校準。

因此,它短期內(nèi)更像是真實路測之外的一層高效補充,用于構(gòu)造長尾場景、做反事實推演、開展閉環(huán)評測和強化學習訓練。未來的智駕競爭,不只看誰在路上跑得更多,也看誰能在云端造出更多真實、復雜、可復現(xiàn)的虛擬世界。(本文首發(fā)于鈦媒體APP,作者|李玉鵬,編輯|楊林)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
荷蘭軍艦敗退南海,更多細節(jié)披露,中方動用致盲武器,首次立大功

荷蘭軍艦敗退南海,更多細節(jié)披露,中方動用致盲武器,首次立大功

井普獨白
2026-06-09 14:17:21
開封2小時,細菌數(shù)量暴漲!很多人天天在喝,有人甚至進急診……

開封2小時,細菌數(shù)量暴漲!很多人天天在喝,有人甚至進急診……

大象新聞
2026-06-08 09:35:08
荒唐!5位頂刊主編、大學教授,因分發(fā)學術(shù)文章,被趕出會議會場

荒唐!5位頂刊主編、大學教授,因分發(fā)學術(shù)文章,被趕出會議會場

雙一流高校
2026-06-09 22:09:02
消失的國家錫金,流亡國王竟是中國少將的后代?它到底經(jīng)歷了什么

消失的國家錫金,流亡國王竟是中國少將的后代?它到底經(jīng)歷了什么

瓦倫西亞月亮
2026-06-09 00:45:56
用了一天iOS 27后,我選擇原諒蘋果。

用了一天iOS 27后,我選擇原諒蘋果。

差評XPIN
2026-06-10 00:08:30
老婆出軌后,我去找對方老婆,誰料他老婆:給你套房,但有個條件

老婆出軌后,我去找對方老婆,誰料他老婆:給你套房,但有個條件

千秋文化
2026-05-29 19:56:40
長春技師學院一女生校內(nèi)廁所遭霸凌,連同兩名霸凌者一并被開除;校方:已恢復學籍,但家長不滿意賠償方案

長春技師學院一女生校內(nèi)廁所遭霸凌,連同兩名霸凌者一并被開除;校方:已恢復學籍,但家長不滿意賠償方案

大風新聞
2026-06-09 14:13:03
名記:聯(lián)盟將復查文班對布倫森的動作,以確定是否追加處罰

名記:聯(lián)盟將復查文班對布倫森的動作,以確定是否追加處罰

懂球帝
2026-06-10 01:54:13
楊元慶“秒批”世界杯員工“補覺卡”福利

楊元慶“秒批”世界杯員工“補覺卡”福利

中國日報網(wǎng)
2026-06-09 18:09:03
奧西里奧殺瘋了:首談盧卡庫+解讀恰20謠言+回應歐冠決賽慘敗

奧西里奧殺瘋了:首談盧卡庫+解讀恰20謠言+回應歐冠決賽慘敗

狗哥是一名內(nèi)拉
2026-06-09 20:15:40
直播間的嘉年華是誰在刷?業(yè)內(nèi)人:除了真土豪,更多的是這四類人

直播間的嘉年華是誰在刷?業(yè)內(nèi)人:除了真土豪,更多的是這四類人

喜歡歷史的阿繁
2026-06-09 11:13:38
繼父養(yǎng)了我們兄弟仨,他走后本家長輩不讓我們披麻戴孝,大哥怒了

繼父養(yǎng)了我們兄弟仨,他走后本家長輩不讓我們披麻戴孝,大哥怒了

人間百態(tài)大全
2026-06-09 06:35:03
誰說中國女排不行?波蘭1∶3慘敗中國,波蘭主帥賽后直言被打服!

誰說中國女排不行?波蘭1∶3慘敗中國,波蘭主帥賽后直言被打服!

北緯的咖啡豆
2026-06-10 09:31:26
菲律賓與廣東同是1億多人口,菲律賓創(chuàng)造3.3萬億,廣東是多少呢?

菲律賓與廣東同是1億多人口,菲律賓創(chuàng)造3.3萬億,廣東是多少呢?

混沌錄
2026-06-03 23:37:06
“1499飛天茅臺”不再成為引流神器,6·18白酒價格戰(zhàn)降溫

“1499飛天茅臺”不再成為引流神器,6·18白酒價格戰(zhàn)降溫

新京報
2026-06-09 10:25:10
人大附中女生高考“壓軸”出場,神態(tài)如同領導,家長自愧不如

人大附中女生高考“壓軸”出場,神態(tài)如同領導,家長自愧不如

熙熙說教
2026-06-08 19:20:13
精神小妹的生活原來是這樣的!網(wǎng)友:終于知道她們?yōu)樯抖歼@么瘦了

精神小妹的生活原來是這樣的!網(wǎng)友:終于知道她們?yōu)樯抖歼@么瘦了

深度報
2026-02-11 23:35:03
普京45分鐘講話震撼全球,揭穿四年謊言,歐洲成最大輸家

普京45分鐘講話震撼全球,揭穿四年謊言,歐洲成最大輸家

越過海面
2026-06-10 05:09:55
83年飛行員王學成叛逃臺灣,鄧麗君慰問時耳語一句后被強行支走

83年飛行員王學成叛逃臺灣,鄧麗君慰問時耳語一句后被強行支走

鑒史錄
2026-05-24 15:48:49
大反轉(zhuǎn)?美國揮關(guān)稅大棒,談好的大豆波音全變卦!中方早留了后手

大反轉(zhuǎn)?美國揮關(guān)稅大棒,談好的大豆波音全變卦!中方早留了后手

古史青云啊
2026-06-09 09:31:55
2026-06-10 10:27:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
134838文章數(shù) 862240關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!Anthropic神級模型向你開放

頭條要聞

牛彈琴:先進的戰(zhàn)機被伊朗干掉 美國惱羞成怒猛烈報復

頭條要聞

牛彈琴:先進的戰(zhàn)機被伊朗干掉 美國惱羞成怒猛烈報復

體育要聞

誰會花400萬,去看一場尼克斯的比賽?

娛樂要聞

吳文忻因癌癥惡化離世,女兒哭泣不舍

財經(jīng)要聞

大盤股IPO終結(jié)行情盛宴?背后真相來了

汽車要聞

賽豆科技AIVA品牌發(fā)布 全系產(chǎn)品覆蓋20萬級市場/量產(chǎn)車年內(nèi)亮相

態(tài)度原創(chuàng)

房產(chǎn)
時尚
本地
健康
公開課

房產(chǎn)要聞

海南樓市最新榜單出爐,TOP10房企賣房已超260億!

頂流愛豆,怎么集體瘦成皮包骨了?

本地新聞

用楊柳青年畫的方式,打開天津

粽子、湯圓……常見粘食大盤點!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版