關注、點贊、轉發!更多科技資訊,持續為你帶來!
中國科技企業小米公司正式發布并開源其最新研發的Xiaomi OneVL框架。該系統旨在提升自動駕駛模型對道路場景的理解、推理與預測能力。
行業首個多技術融合框架
據小米官方介紹,Xiaomi OneVL是行業內首個將多項核心技術整合至單一系統的框架。這些技術包括視覺-語言-行動模型、世界模型以及潛在空間推理。小米表示,該框架建立在XLA模型的推理能力基礎之上,同時顯著提升了推理速度與準確率。
在自動駕駛研究領域,視覺-語言-行動模型與世界模型通常被視為兩種獨立的處理方式。前者主要專注于理解交通場景并生成駕駛動作,后者則用于預測場景的演變趨勢。小米稱,OneVL是首個通過潛在空間推理將兩種方法統一起來的框架。
性能表現與技術創新
小米方面聲稱,該框架在多個主流感知、推理與規劃基準測試中均展現出強勁性能。OneVL進一步拓展了潛在推理方法的邊界,在保持與僅預測最終答案的潛在空間思維鏈系統相近速度的同時,實現了比顯式思維鏈推理更高的準確率。
該框架的另一大技術亮點在于可解釋性。小米表示,OneVL能夠通過語言和視覺兩種形式解釋其決策過程。在實際應用中,這意味著系統不僅可以描述車輛應采取特定駕駛動作的原因,還能同步展示對道路后續可能情況的預測結果。
戰略布局與行業影響
此次發布距離小米開源其音頻生成模型Omnivoice僅相隔不久。通過開源OneVL,小米正進一步加大在人工智能與智能出行領域的布局力度,該領域已成為全球主要科技企業之間競爭日益激烈的賽道。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.