網易首頁 > 網易號 > 正文 申請入駐

元戎啟行周光:VLA的下限,已超過端到端1.0的上限

0
分享至

2024年6月,元戎啟行CEO周光乘坐測試車經過一處紅綠燈,看到了一個不起眼的交通牌——「車輛左轉不受燈控」,但測試車依舊停下等待紅燈轉綠。

在后方不斷傳來的鳴笛催促聲中,周光意識到:即便是當時的端到端模型,也無法充分理解道路環境與通行條件。而且,許多人類能輕易察覺的潛在風險,系統卻無法感知。

同年9月,周光公開表示:“現在的VLM(端到端1.0),就相當于一個帶著學員的教練,通過語言的形式,告訴學員左轉、減速…而VLA,則是換成教練親自開車。”

也是從這時起,元戎啟行將VLA模型提升為公司級研發項目。并在反復的測試中,驗證了VLA「讓機器讀懂物理世界」的神奇能力,認定它會是Corner case泥潭中的一條新航道。

到了昨日(8月26日),元戎啟行發布全新一代輔助駕駛平臺——DeepRoute IO 2.0,該平臺搭載自研的VLA(Vision-Language-Action)模型,融合視覺感知、語義理解與動作決策三大核心能力,對比傳統端到端模型,VLA模型更擅長應對復雜路況,可謂實現了斷代式突破。

如何讓AI懂得「害怕」?

盡管如今的AI技術路線仍沒有標準答案,但是在包括汽車在內的整個具身智能行業中,VLA已經成為了代表技術能力和落地可行性的關鍵路徑。

今年,小鵬、理想相繼宣布VLA的量產消息。而元戎啟行也表示,在基于DeepRoute IO 2.0平臺的5個定點合作項目中,首批量產車即將進入市場。

據了解,DeepRoute IO 2.0可以支持激光雷達與純視覺雙版本,率先適配英偉達Drive Thor芯片,后續將拓展至更多平臺。

“在DeepRoute IO 2.0中,我們讓AI學會了‘害怕’——害怕是生物進化出的保護機制,AI也應當具備對風險的敬畏之心。”周光表示,防御性駕駛是VLA的核心目標。只有讓AI學會害怕,才是對安全真正的重視。

之所以反復強調「防御性駕駛」,是因為他深知CNN或BEV端到端系統的瓶頸所在——看不見等于不存在。

他表示,人類司機會憑借對空間遮擋關系的理解,采取謹慎策略通過復雜場景。例如,當看到人車混行的橋洞、無信號燈的路口,或者視線被遮擋嚴重時,人類是一定會減速的。

這意味著,輔助駕駛系統必須提升對高級語義和空間關系的理解能力,而上一代端到端無法做到這一點,因為BEV是難以學習空間理解的。

“VLA的下限,就已經是端到端1.0的上限了”。在發布會上,他總結了VLA模型的4大功能:空間語義理解、異形障礙物識別、文字類引導牌理解、記憶語音控車。

比起許多用戶認為非常炫酷的「語音交互」功能,周光認為VLA主動預判、規避風險的作用更為重要。

“語音控車功能甚至通過Rule-based就能實現,而VLA架構真正的難點,是對場景的高級語義推理,這也是其核心進化方向——CoT思維鏈。”

長時序分析,深層次推理

自去年開始,周光就已指出,VLA的關鍵特性就是思維鏈:“你需要通過多重信息來決定如何通過復雜場景,也需要不斷地與其他車輛博弈、交互,這種復雜度是規則庫無法應對的。”

他表示,短期記憶依靠視頻幀,長期記憶則借助關鍵幀與語言描述——正如人類通過文字記錄歷史,語言是對現實的高效壓縮。而VLA就是因為能夠進行長時序上下文分析,所以能處理更復雜的路況,完成更深層次的推理。

“現實駕駛環境中存在大量文字信息,例如交通標志、臨時路牌等。有些是印刷在道路上的靜態文字,可借助地圖數據;但還有很多是臨時設置,必須通過實時感知和理解才能正確處理。語言理解能力可讓車輛更好地與現實世界交互,為用戶帶來更多便利。”

例如, VLA模型能通過文本等看懂潮汐車道、公交車道、臨時限行區域等道路標志,并從多重信息中確認通行規則。

基于此,DeepRoute IO 2.0也將擁有更高階的思考能力,能夠理解交通場景中復雜的交互事件、隱藏的語義信息和邏輯推理。

除了上述功能外,VLA還具備更高的異形障礙物識別水平,并擁有記憶語音控車功能。其中,后者不僅能支持「快一點/慢一點」等基礎指令,還能記憶用戶偏好,實現個性化體驗。

通過實際體驗,我們可以發現DeepRoute IO 2.0在道路兩側停滿車輛、存在「鬼探頭」風險時,降速緩行;并在經過存在盲區的橋洞時,同樣比較嚴謹。另外,對于多種載貨兩輪/三輪車輛,系統也能夠較好地識別。

周光認為,盡管目前的VLA模型仍處于「幼年期」,但其上限遠高于端到端方案:“新一代架構需要新一代芯片支持,這不是CNN時代可比的。”

算力枷鎖終將瓦解

目前,「成本」經常被認為是VLA上車的阻礙之一。而周光卻表示,DeepRoute IO 2.0不僅可面向多種主流乘用車平臺開展定制化部署,可適配的車型更是低至15萬元級別,甚至10萬元級別的車型通過優化也有機會搭載。

“從傳感器方面來看,11個攝像頭正成為主流配置;同時行業整體都在提升算力,下一代芯片將達到5000TOPS,甚至10000TOPS級別也不遠了。”

他表示,VLA與端到端1.0的主要成本差異在于芯片,其余部分基本一致。而芯片成本取決于制程工藝,目前千T級芯片算力時代已經到來,例如特斯拉2500TOPS芯片,雙芯片即可實現5000TOPS。

如今,元戎啟行的量產車輛已接近10萬臺,獲得超過10款車型的定點合作,預計第四季度的交付量還將進一步提升。

交付量的擴大,往往意味著要面臨更嚴格的市場監督,任何問題都會被放大。在這一節點,元戎啟行正式步入「2.0階段」,打通上一代端到端的瓶頸,讓輔助駕駛系統更加可靠,體驗感更強。

周光預計, Thor+VLA能帶來的直觀效果,是絕大多數人都會認為這樣的系統「是好用的」,城市接管可能達到百公里起步的水平。

“真正的智能駕駛必須依賴大模型,未來必將全面轉向基于GPT架構的端到端系統。回顧大模型的發展,它經歷了從通才到專家系統的演進:GPT-4屬于‘通才’,如今進入強化學習階段,模型正變得更專業、更可靠。”

他認為,雖然技術發展沒有標準答案,但實際上每個關鍵階段都無法跳過:從有圖、無圖、端到端到VLA模型,整個發展過程必不可少,不可能完全繞過。同時,他也呼吁行業應關注大模型整體發展,避免局限在自動駕駛領域。

“技術發展需要時間,時間將驗證一切。”

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
震驚!洛陽某職業學院高調官宣10名畢業生入職肯德基,引發爭議

震驚!洛陽某職業學院高調官宣10名畢業生入職肯德基,引發爭議

火山詩話
2026-04-24 16:29:11
女子20元買一舊肚兜,幾年后去鑒寶,專家聞了聞,一句話讓她傻眼

女子20元買一舊肚兜,幾年后去鑒寶,專家聞了聞,一句話讓她傻眼

燦爛夏天
2025-03-12 22:44:55
中紀委整治隱形違規,體制內3類灰色福利全面取消無例外

中紀委整治隱形違規,體制內3類灰色福利全面取消無例外

細說職場
2026-04-25 13:58:00
老同學離婚后,從外地過來投奔我,借住在我家時,與她發生一段情

老同學離婚后,從外地過來投奔我,借住在我家時,與她發生一段情

秀秀情感課堂
2026-04-25 13:35:03
北控告別發文:從頭再來!但張慶鵬自斷優勢,攻守全崩,該走了?

北控告別發文:從頭再來!但張慶鵬自斷優勢,攻守全崩,該走了?

籃球資訊達人
2026-04-25 16:27:59
中國國安部:稀土公司副總向境外泄露7項國家秘密受嚴懲

中國國安部:稀土公司副總向境外泄露7項國家秘密受嚴懲

俄羅斯衛星通訊社
2026-04-24 15:07:08
最新發布:2026年第一季度全國31省GDP排名!

最新發布:2026年第一季度全國31省GDP排名!

葉初七
2026-04-25 11:51:04
女子乘高鐵被26寸行李箱砸到頭:索賠600元無果,列車長個人“補償”了400元;箱子主人:已付CT檢查費,索賠額已超過我應承擔的責任范圍

女子乘高鐵被26寸行李箱砸到頭:索賠600元無果,列車長個人“補償”了400元;箱子主人:已付CT檢查費,索賠額已超過我應承擔的責任范圍

臺州交通廣播
2026-04-25 00:39:45
26歲女子因常年腳冷,習慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

26歲女子因常年腳冷,習慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

觀威海
2026-04-24 09:12:16
清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

抽象派大師
2026-04-24 12:23:42
強震猛砸日本!海底震出360顆原子彈當量!核電站徹底瞞不住了!

強震猛砸日本!海底震出360顆原子彈當量!核電站徹底瞞不住了!

安珈使者啊
2026-04-25 08:52:16
阿斯:巴薩全隊在酒店看皇馬比賽,貝萊林進絕平球后陷入狂歡

阿斯:巴薩全隊在酒店看皇馬比賽,貝萊林進絕平球后陷入狂歡

懂球帝
2026-04-25 10:11:10
伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

墨印齋
2026-04-23 15:42:00
連續6個跌停板!股民:一切都結束了!

連續6個跌停板!股民:一切都結束了!

數據挖掘分析
2026-04-25 14:41:44
下課倒計時!火箭3連敗+烏杜卡遭完爆,拒絕哈登加盟,你后悔嗎?

下課倒計時!火箭3連敗+烏杜卡遭完爆,拒絕哈登加盟,你后悔嗎?

兵哥籃球故事
2026-04-25 15:57:34
單程決死突擊!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機

單程決死突擊!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機

你是我心中最美星空
2026-04-13 00:24:31
又奪冠了!霍思燕的蒙古獒爆火,狠狠給中國犬種爭了口氣

又奪冠了!霍思燕的蒙古獒爆火,狠狠給中國犬種爭了口氣

超人強動物俱樂部
2026-04-25 13:16:54
刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

抽象派大師
2026-04-24 12:06:13
韓媒:下賽季英超大概率沒韓國球員;韓國足球在走下坡路

韓媒:下賽季英超大概率沒韓國球員;韓國足球在走下坡路

懂球帝
2026-04-25 12:07:11
剛給伊朗塞了200萬,轉頭就進美軍死局?這條海路到底誰說了算?

剛給伊朗塞了200萬,轉頭就進美軍死局?這條海路到底誰說了算?

寰球經緯所
2026-04-24 13:44:46
2026-04-25 21:28:49
RoboX
RoboX
關注智能汽車、機器人在內的具身智能前沿科技
246文章數 2關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

男童7歲18斤被當腦癱治多年 父母查其出生病歷發現問題

頭條要聞

男童7歲18斤被當腦癱治多年 父母查其出生病歷發現問題

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

時尚
游戲
本地
親子
手機

這9種特別的顏色,太適合春夏交替的五月了!

LCK第二賽段:Faker冰鳥救世,T1橫掃BRO

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

親子要聞

我國兒童腫瘤生存率首次納入年報體系!5年達76%,不同癌種差異顯著

手機要聞

iPhone18ProMax再爆料!厚度近 14mm,堪稱史上最厚蘋果手機!

無障礙瀏覽 進入關懷版