无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

理想汽車發布下一代自動駕駛基礎模型MindVLA-o1

0
分享至

2026年3月17日,理想汽車基座模型負責人詹錕出席NVIDIA GTC 2026,發表主題演講《MindVLA-o1:開啟全能范式——下一代統一視覺-語言-動作自動駕駛大模型探索》,發布下一代自動駕駛基礎模型MindVLA-o1。MindVLA-o1通過五大技術創新,構建了面向物理世界智能的自動駕駛基礎模型,讓自動駕駛看得更遠、想得更深、行得更穩、進化更快、部署更高效。

詹錕表示:“當我們把視覺、語言和行動統一到一個模型中時,它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體。基于同一套VLA模型,不僅可以控制車輛,也能夠擴展到機器人。因此,自動駕駛只是物理AI的起點,未來這類基礎模型將驅動新的具身智能范式。”

從規則時代到AI時代 理想輔助駕駛持續演進

自2021年啟動輔助駕駛自研以來,理想輔助駕駛技術架構經歷了多輪關鍵迭代,持續的技術探索與工程實踐,為理想汽車在軟硬件一體化研發領域積累了深厚的基礎研究能力與研發實力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺語言模型)雙系統架構量產交付,輔助駕駛首次真正具備了跨場景、跨任務的統一理解能力。2025年,理想汽車進一步將空間理解、語言理解與行動決策統一到同一模型框架,構建了基于VLA、世界模型與強化學習三大技術棧的VLA司機大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機大模型月使用率達到80%,VLA指令累計使用1225.4萬次;春節期間理想輔助駕駛總里程達2.5億公里,VLA指令使用次數達130.3萬次。規模化的用戶驗證與持續積累的真實場景數據,為理想汽車推進下一代自動駕駛技術演進提供了堅實基礎。

MindVLA-o1五大技術創新:看得更遠、想得更深、行得更穩、進化更快、部署更高效

理想汽車提出下一代統一架構——MindVLA-o1。該架構以原生多模態MoE Transformer為核心,通過五大技術創新——3D空間理解、多模態思考、統一行為生成、閉環強化學習(Closed-loop RL)和軟硬件協同設計(Hardware–Software Co-Design),構建了面向物理世界智能的自動駕駛基礎模型。


在感知層面,理想汽車采用以視覺為核心的 3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達點云作為三維幾何提示,引導模型理解真實空間結構,使其在單一表示中同時具備語義理解與三維感知能力。同時引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態環境與動態物體分別建模,并通過下一幀預測(Next-state prediction)作為自監督信號,使模型同時學習深度信息、語義結構與物體運動,最終形成融合空間結構與時間上下文的高質量3D表示。具備3D空間理解能力,使模型看得更遠。


在思考層面,自動駕駛既要理解當前環境,也要預測未來幾秒的場景演化。在語言模型承擔語義理解、常識知識和交互能力的基礎上,理想汽車還引入了預測式隱世界模型,在隱空間中高效模擬未來。訓練分三階段:第一,用海量視頻數據預訓練Latent World Token(隱世界詞元),構建未來表征;第二,在MindVLA-o1中持續世界模型的推演,形成隱空間的未來推理能力;第三,將世界模型、多模態推理能力及駕駛行為進行聯合訓練與對齊。由此,模型不僅能理解當前場景并進行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態思考(Generative Multimodal Thinking)。擁有多模態思考能力,讓模型想得更深。


在行為層面,理想汽車構建了統一行為生成(Unified Action Generation)機制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構,并引入專門的Action Expert(動作專家),從3D場景特征、導航目標、駕駛指令等多維輸入中提取信息,并結合多模態思考生成高精度駕駛軌跡。其次,為滿足實時性要求,系統采用并行解碼(Parallel Decoding),同時生成所有軌跡點,大幅提升效率。最后,引入Discrete Diffusion(離散擴散)進行多輪迭代優化,類似逐步去噪,確保軌跡空間連續、時間穩定,并符合車輛動力學約束。形成統一行為生成機制,使模型行得更穩。


在模型迭代層面,理想汽車構建了閉環強化學習框架,讓模型不僅能從真實數據學習,還能在世界模擬器(World Simulator)中持續探索和優化策略。為此,理想汽車將傳統逐步優化式重建升級為Feed-forward(前饋)場景重建,使系統能夠瞬時生成大規模、高保真駕駛場景,支持大規模并行訓練。同時,結合生成式模型(Generative Models),模擬環境可擴展、編輯并生成全新場景。為支持大規模模擬與訓練,理想汽車開發了統一的3D Gaussian Splatting(3D高斯潑濺)渲染引擎和分布式訓練框架,渲染速度提升近2倍,整體訓練成本降低約75%,實現低成本、高效率的強化學習閉環。在閉環強化學習框架下,模型實現更快進化。


為解決傳統端側大模型部署耗時長、調試頻繁的問題,理想汽車提出面向端側大模型的軟硬件協同設計定律,將模型結構與驗證損失建模,并結合Roofline模型刻畫硬件計算能力與內存帶寬限制,在模型性能與硬件約束之間建立統一的分析框架。理想汽車基座模型團隊評估了近2000種模型架構配置,在英偉達Orin與Thor平臺上完成驗證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構探索時間從數月縮短至數天,大幅提升端側VLA模型的設計與部署效率。在軟硬件協同設計定律下,模型部署更高效。


自動駕駛只是起點,為具身智能構建“數字大腦”

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統一的VLA數據引擎,負責大規模數據的采集、清洗和自動標注;MindVLA-o1,統一的原生多模態VLA模型,可以理解環境、進行推理,并生成駕駛行為;MindSim,可控的多模態世界模型,用于生成復雜駕駛場景并支持大規模閉環訓練;RL Infra(強化學習基礎設施),通過獎勵模型和策略學習,使系統在仿真與真實環境中自我進化。

四部分協同形成完整閉環,使AI能夠感知、理解并在物理世界中自主行動,并持續學習。從結構上看,這套系統如同一個“數字大腦”:感知層對應視覺皮層,推理與規劃如前額葉,場景生成似運動皮層,強化學習則類似多巴胺反饋,實現了感知、理解、行動和持續優化的完整閉環。

該框架不僅服務于汽車,也可擴展至機器人及各種物理系統。對理想汽車而言,車是最大號的機器人,其本質是在構建硅基生命體的軀干與大腦。


理想汽車在持續推進技術創新的同時,在人工智能領域頂級學術會議和期刊發表了大量研究成果,其中MindVLA-o1相關的多篇論文已在CVPR、ICLR、ICRA、AAAI等國際頂會上發表。未來,理想汽車將繼續以用戶價值為導向,投入前沿研究以及核心技術自研,持續構建面向物理世界智能的完整AI系統,堅定邁向全球領先的具身智能企業。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
散戶熱情空前高漲!SpaceX夜盤大漲市值突破3萬億美元,超越微軟

散戶熱情空前高漲!SpaceX夜盤大漲市值突破3萬億美元,超越微軟

華爾街見聞官方
2026-06-16 13:37:47
想約女人出來,一開口說這2句話,你就成功一半了

想約女人出來,一開口說這2句話,你就成功一半了

新時代的兩性情感
2026-06-16 20:26:36
菲律賓50億水電站被強制停工,市長公開抗命:我無權執行!

菲律賓50億水電站被強制停工,市長公開抗命:我無權執行!

攜手游人間a
2026-06-16 02:06:48
央視發文,高調官宣鄧亞萍新身份,涉嫌貪腐被帶走傳聞早水落石出

央視發文,高調官宣鄧亞萍新身份,涉嫌貪腐被帶走傳聞早水落石出

阿廢冷眼觀察所
2026-06-16 20:21:33
廣東批準同意建立一個新校區,這里已經聚集了多少大學?

廣東批準同意建立一個新校區,這里已經聚集了多少大學?

高等教育數字局
2026-06-16 15:40:06
由中國起草,安理會一致通過決議,將聯阿援助團授權延長一年

由中國起草,安理會一致通過決議,將聯阿援助團授權延長一年

每日經濟新聞
2026-06-16 17:45:13
上海大師賽簽表出爐!丁俊暉奧沙利文陷死亡半區,世界第一簽運佳

上海大師賽簽表出爐!丁俊暉奧沙利文陷死亡半區,世界第一簽運佳

世界體壇觀察家
2026-06-16 16:25:21
劉濱已經擔任扇子藝術協會會長,從毛新宇妻子蛻變成女強人

劉濱已經擔任扇子藝術協會會長,從毛新宇妻子蛻變成女強人

李昕言溫度空間
2026-06-15 20:54:42
史詩級三方交易!字母哥搭塔圖姆,布朗去快船,聯盟格局要變天了

史詩級三方交易!字母哥搭塔圖姆,布朗去快船,聯盟格局要變天了

夜溟聊體育
2026-06-16 11:20:21
《教父》柯里昂告訴兒子:和周圍人搞好關系的最高級方式,不是請客吃飯,也不是阿諛奉承,而是做到這兩點

《教父》柯里昂告訴兒子:和周圍人搞好關系的最高級方式,不是請客吃飯,也不是阿諛奉承,而是做到這兩點

心理觀察局
2026-06-14 10:38:25
售價10980 元?春風x雅馬哈的首款125復古踏板來了

售價10980 元?春風x雅馬哈的首款125復古踏板來了

機車網
2026-06-16 20:50:32
澤連斯基:贊成冬季前與俄舉行“和平談判會議”

澤連斯基:贊成冬季前與俄舉行“和平談判會議”

財聯社
2026-06-16 20:54:31
千億龍頭,兩連板!

千億龍頭,兩連板!

證券時報
2026-06-16 14:34:01
天皇當著全世界的面給高市早苗上了一課:你再狂,能狂得過天皇?

天皇當著全世界的面給高市早苗上了一課:你再狂,能狂得過天皇?

曉帝愛八卦
2026-06-15 11:32:28
創新藥,還能“解套”嗎?

創新藥,還能“解套”嗎?

中國新聞周刊
2026-06-16 18:29:40
Google Earth飛行模擬器上線網頁版 瀏覽器即可“翱翔全球”

Google Earth飛行模擬器上線網頁版 瀏覽器即可“翱翔全球”

cnBeta.COM
2026-06-15 23:03:02
“一看就是爭家產的面相”,大家庭過生日,讓所有人看清了家教

“一看就是爭家產的面相”,大家庭過生日,讓所有人看清了家教

熙熙說教
2026-06-16 19:42:39
日本F-2戰機圍攻遼寧艦,64枚導彈誰尷尬?

日本F-2戰機圍攻遼寧艦,64枚導彈誰尷尬?

可樂愛微笑
2026-06-14 19:22:28
巴西重大噩耗!內馬爾二級拉傷恢復緩慢,將缺席全部的小組賽

巴西重大噩耗!內馬爾二級拉傷恢復緩慢,將缺席全部的小組賽

夜白侃球
2026-06-16 10:20:17
烏克蘭摧毀莫斯科最大煉油廠!供應俄首都40%的能源

烏克蘭摧毀莫斯科最大煉油廠!供應俄首都40%的能源

項鵬飛
2026-06-16 20:57:43
2026-06-16 21:59:00
旭車評 incentive-icons
旭車評
網絡飛速 放慢腳步做車評
842文章數 63關注度
往期回顧 全部

科技要聞

DeepSeek融資500億,梁文鋒牢牢握住控制權

頭條要聞

歐盟稱已核實"中方訓練俄軍人員在烏作戰" 外交部回應

頭條要聞

歐盟稱已核實"中方訓練俄軍人員在烏作戰" 外交部回應

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內茫然失措

財經要聞

2萬億存款去哪兒了?

汽車要聞

smart #6上市后 竟然很少被討論參數

態度原創

手機
本地
游戲
時尚
公開課

手機要聞

iOS 27將Siri動畫設計為藥丸狀以掩蓋靈動島 iPhone 18或改用圓形圖標

本地新聞

這屆年輕人為什么都在找心流時刻?

《弧光獵人》游先看訪談:你好,凍樹

專訪丨重排版《青蛇》:“戀愛腦”還是“完美主義”?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版