最近智能輔助駕駛賽道的討論一直沒斷,從技術(shù)路線到宣傳口徑,各種聲音吵得熱鬧,也值得停下來捋捋邏輯。現(xiàn)在不少玩家押注純視覺路線,推出新一代VLA模型后,對外放出“綜合體驗領(lǐng)先行業(yè)數(shù)倍”的說法,也引發(fā)了行業(yè)內(nèi)外的不少討論。Momenta CEO曹旭東直言VLA只是錦上添花,世界模型是雪中送炭,這句話戳中了當前不少路線爭議的核心。
![]()
說白了,當前主流的VLA本質(zhì)還是基于已有數(shù)據(jù)訓練的視覺-語言-動作匹配模型,能把日常常見路段的體驗優(yōu)化得更絲滑,減少不必要的接管和突兀的制動,讓日常出行的感受更穩(wěn)定,這確實是體驗層面看得見的進步,但也只是優(yōu)化層面的錦上添花,并沒有解決純視覺路線最核心的痛點:對從未見過的罕見場景,依然缺乏足夠的推理和應(yīng)對能力。技術(shù)進步從來不是靠營銷口號堆出來的,是靠一個個未知場景啃出來的,不少人拿特定場景的測試數(shù)據(jù)說話,卻始終沒有公開統(tǒng)一的測試標準,也還沒經(jīng)過大規(guī)模真實用戶的長期驗證,這樣的結(jié)論難免站不住腳。
![]()
此前也有馬路上出現(xiàn)罕見的“長尾場景”流出,模型識別到障礙物后僅完成減速,最終還是依靠人工介入才化解風險,這也給行業(yè)提了醒:再好的體驗優(yōu)化,也抵不過安全層面的一次疏漏。
![]()
![]()
現(xiàn)在整個智能輔助駕駛行業(yè)都在拼體驗升級,不少人忙著搶宣傳的熱度,卻少有人沉下心啃極端場景的硬骨頭,大家都在比體驗提升的倍數(shù),卻忘了安全才是一切體驗的前提。你覺得純視覺路線靠VLA的持續(xù)優(yōu)化,還能走通接下來的發(fā)展之路嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.