无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

復旦可信具身智能研究院&上海交大:給自動駕駛裝上可檢索的「空間記憶」丨CVPR 2026

0
分享至


從街景到仿真,離線地理信息正在成為車輛理解復雜道路的新線索。

作者丨鄭佳美

編輯丨馬曉寧

大模型的發展表明,智能體不能只依賴一次性的上下文輸入,還需要能夠檢索、利用和管理長期記憶。自動駕駛也正在走向類似的路徑:車輛不應只是根據當前攝像頭和傳感器看到的內容做即時判斷,而應具備一種可檢索的空間記憶,能夠調取當前位置長期積累的道路結構信息。對于自動駕駛來說,這種記憶可以來自街景圖、衛星圖、歷史地圖和車隊經驗,從而當傳感器“看不清、看不全、看不遠”時,車輛仍然能理解自己所在的道路空間。

在真實道路上,這類問題幾乎無處不在。夜間經過一個沒有路燈的路口,攝像頭里車道線被陰影吞沒,雨天行駛在城區主干道,玻璃反光和水霧讓路沿、人行橫道變得模糊,駛入復雜立交或多岔路口時,車端傳感器看到的只是當前一小段畫面,卻需要對完整道路結構做出判斷。

人類司機在這種情況下,往往不會只依賴眼前一幀畫面。我們會調動對道路的記憶:這里原本有幾條車道,路口在哪里分叉,人行橫道大概在什么位置,前方是不是高架匝道。

也就是說,人類駕駛天然具備一種“空間記憶”。但長期以來,自動駕駛模型大多仍被限制在實時傳感器輸入之內,車輛只能根據當前攝像頭、激光雷達或 IMU 看到的信息進行判斷。一旦遇到遮擋、低光、雨霧和長尾場景,模型就容易失去穩定的空間參考。

正是在這一背景下,由復旦大學可信具身智能研究院&上海交大團隊提出了論文《Spatial Retrieval Augmented Autonomous Driving》。這項工作的關鍵思路不是再給車輛增加一種昂貴傳感器,而是讓自動駕駛系統學會“回憶”當前位置的地理信息:根據車輛 GPS 和位姿,檢索對應位置的街景圖、衛星圖等歷史地理圖像,再將這些 Geo 信息與車載相機特征融合,為模型提供額外的道路結構參考。

更重要的是,這篇論文并沒有把 Geo 圖像包裝成萬能答案。研究結果反而清楚地表明:地理圖像最擅長補充的是穩定、長期存在的道路結構信息,例如車道線、道路邊界、人行道、建筑和可行駛區域,而對于車輛、行人等實時變化的動態目標,它的幫助十分有限。

這一結論讓這項研究的意義更加明確——Geo 不是要替代實時感知,而是要成為自動駕駛系統中的一種空間先驗,讓車輛在看不清當前世界時,仍然能夠參考“這條路原本是什么樣子”。

因此,這項工作真正打開的不是某個單一指標的提升,而是一種新的自動駕駛范式:從“只依賴當前傳感器”走向“實時感知 + 歷史地理記憶”。在自動駕駛進入長尾場景、安全冗余和世界模型競爭的新階段后,這種檢索增強式思路,可能會成為下一代自動駕駛系統理解道路空間的重要補充。


論文地址:https://arxiv.org/pdf/2512.06865

01


Geo 的適用邊界

整體來看,研究團隊發現不同任務對地理圖像的受益程度差異明顯。靜態道路結構相關任務提升較大,比如在線建圖、占用預測和世界模型,而動態目標相關任務提升較小,例如 3D 目標檢測。

研究人員認為,這是因為地理圖像能夠提供道路、車道、人行道和建筑等穩定背景信息,但無法反映當前時刻道路上的車輛和行人等動態目標,因此它更適合作為空間結構參考。

在線建圖是提升最明顯的任務。因為這類任務主要識別車道線、道路邊界和人行橫道等靜態元素,所以 Geo 圖像能夠有效補充道路結構信息。

研究中,MapTR 的 mAP 從 50.3 提升到 61.2,MapTRv2 的 mAP 從 61.5 提升到 73.4。研究人員發現,在低曝光、雨天和遮擋場景下,加入 Geo 后模型能夠恢復更多道路細節,說明地理圖像相當于為模型提供了當前位置原本的道路結構參考。

占用預測同樣獲得提升,但幅度沒有在線建圖那么明顯。Geo 的作用主要集中在可行駛區域、人行道和地形等靜態區域。實驗中,FBOcc 的整體 mIoU 從 39.11 提升到 39.74,其中可行駛區域從 80.07 提升到 82.47。研究人員認為,這說明 Geo 更適合幫助模型理解道路空間結構,而不是實時動態物體信息。

相比之下,目標檢測提升非常有限。BEVFormer 的 mAP 僅從 41.60 提升到 41.64。研究團隊指出,目標檢測主要關注當前車輛和行人,而 Geo 圖像屬于離線地圖或街景信息,無法反映實時動態場景,因此幫助較小。


端到端規劃中,Geo 對軌跡誤差影響不大,但能夠提升安全性。實驗結果顯示,Night 場景下碰撞率從 0.55% 降到 0.48%。研究人員認為,這說明 Geo 不一定讓軌跡預測更接近真實軌跡,但在夜間、雨霧和復雜路口等低能見度環境中,能夠提供更穩定的道路參考,從而降低碰撞風險。

世界模型也是受益較明顯的任務。研究人員發現,長時間生成駕駛視頻時,模型容易出現道路漂移和背景不一致問題,而 Geo 圖像能夠提供真實道路結構約束。實驗中,UVG 的 FVD 從 36.10 降到 29.97,說明生成結果更加穩定,幻覺現象也更少。

最后,消融實驗進一步驗證了方法有效性。沒有 Geo 時,靜態 mIoU 為 46.66,加入 Geo 后提升到 47.86。研究團隊認為,這說明性能提升并不是偶然結果,Geo 圖像、位置編碼以及可靠性估計模塊都對整體性能提升起到了重要作用。


02


從地理檢索到可靠融合

研究團隊首先基于 nuScenes 構建了一個新的擴展數據集 nuScenes-Geography,希望讓自動駕駛模型除了使用車載攝像頭信息外,還能夠利用當前位置對應的地理圖像信息。

研究人員先根據 nuScenes 中提供的車輛位姿數據,計算每一幀對應的經緯度坐標,再通過 Google Maps API 獲取對應位置的街景圖和衛星圖。得到地理圖像后,研究人員進一步將這些圖像與車載相機畫面進行空間對齊,使模型能夠同時看到“當前車載視角”和“當前位置對應的歷史地理視角”。

實驗結果顯示,train split 中可用地理圖像占 94.32%,val split 中占 92.41%,說明大部分場景都能夠成功獲取 Geo 信息,數據覆蓋率較高,實驗并不是只在少量理想樣本中進行。


在構建數據集過程中,研究團隊發現街景圖并不是按車輛每一幀單獨采集的,很多連續車載幀實際上會對應同一個街景位置。如果按照每一幀單獨下載街景圖,不僅會產生大量重復數據,也會造成很高的存儲和計算成本。

因此研究人員沒有采用逐幀下載方式,而是讓每個街景位置只下載一次數據。為了盡可能覆蓋不同方向的視角,研究團隊會在同一個街景位置下載 18 個不同方向的街景視角,并將這些視角合成為全景圖。

之后,系統再根據當前車載相機的方向、位置和視角參數,從全景圖中重新投影得到與當前駕駛視角更接近的 Geo 圖像。研究結果顯示,這種方法相比逐幀下載街景裁剪圖節省超過 70% 的存儲空間,同時還能減少重復數據,提高系統實際部署時的可行性。


研究人員還發現,Geo 圖像并不一定始終可靠?,F實場景中可能出現街景缺失、街景數據過時、GPS 定位誤差、高架道路與地面道路混淆以及道路施工導致環境變化等問題。例如,街景圖可能拍攝于數月甚至數年前,而當前道路結構已經發生變化。如果模型完全依賴這些 Geo 信息,就可能出現錯誤判斷。

因此研究團隊專門設計了可靠性估計模塊 REG,用來判斷當前檢索到的 Geo 圖像是否可信。研究人員會同時考慮 Geo 圖像與當前車載圖像之間的視覺相似性,以及地理位置之間的匹配程度,從而決定模型應該多大程度使用 Geo 信息。


為了訓練這個模塊,研究團隊人工標注了 1800 個錯位樣本。實驗中,train split 的錯位圖像占 4.93%,缺失圖像占 0.75%,val split 的錯位圖像占 6.88%,缺失圖像占 0.71%。這些結果說明研究并沒有默認 Geo 永遠正確,而是讓模型在 Geo 信息可信時增強使用,在 Geo 不可靠時降低影響,從而提高整體系統穩定性。

完成數據處理后,研究團隊開始把 Geo 接入不同自動駕駛任務中進行驗證。對于車端任務,研究人員首先從車載圖像中提取 BEV 特征,再把檢索到的 Geo 圖像編碼成另一組特征,隨后通過適配模塊將兩種特征融合到同一個空間表示中。

研究團隊希望讓模型不僅能夠利用當前傳感器看到的信息,還能夠利用當前位置對應的歷史道路結構信息。研究覆蓋了多個任務,包括 3D 目標檢測、在線建圖、占用預測以及端到端規劃。對于世界模型任務,研究人員采用了不同策略。

由于世界模型需要生成未來駕駛視頻,因此系統會根據未來軌跡提前檢索對應位置的地理圖像,再利用這些 Geo 信息約束未來場景生成過程。研究團隊希望通過這種方式減少長時間視頻生成中的道路漂移、背景變化和場景幻覺問題。

整個實驗流程的核心目標,是驗證 Geo 是否能夠成為自動駕駛系統中的一種“空間記憶”。研究團隊并不是只想證明某一個模型在指標上略有提升,而是希望說明自動駕駛模型除了依賴當前傳感器外,還能夠通過檢索當前位置的歷史地理圖像獲得額外空間參考信息。

因此,研究人員把 Geo 接入多個不同任務和模型中,希望驗證這種方法是否具備通用性,以及它究竟更適合哪些類型的自動駕駛任務。


03


從感知增強到仿真約束 Geo

研究團隊最重要的貢獻,并不只是提升了幾個實驗指標,而是提出了一種新的自動駕駛思路。過去的自動駕駛系統主要依賴實時傳感器輸入,也就是車輛只能根據“當前看到的內容”進行判斷,而這項研究證明,自動駕駛還可以主動檢索當前位置對應的歷史地理圖像,從而獲得一種類似“空間記憶”的能力。這意味著自動駕駛模型開始從單純的實時感知,轉向“實時感知 + 歷史空間記憶”結合的方式。

研究團隊認為,這項研究真正的重要性,在于打開了“檢索增強自動駕駛”這一新方向。過去自動駕駛研究更多關注傳感器、模型結構和端到端學習,而這項研究開始嘗試把外部地理信息引入自動駕駛系統。

未來還可以繼續擴展,例如利用車隊歷史數據替代公開地圖,或者同時檢索多個附近視角,從而進一步提升自動駕駛系統的空間理解能力。

04


成果背后的科研團隊

賈蕭松,復旦大學可信具身智能研究院助理教授,研究院是復旦面向下一代人工智能設立的校級實體化科研機構,重點研究 AI 如何從數字空間走向物理世界。它不只關注具身智能體“能不能感知、能不能行動”,也關注它們在真實環境中是否安全、可靠、可控。研究院圍繞具身基礎模型、數據引擎、具身交互、本體研制和可信機制五大方向展開布局,試圖打通從模型、數據、硬件到安全評估的全鏈條,為工業生產、智能制造等場景提供底層技術支撐。

官網主頁:https://teai.fudan.edu.cn/

賈蕭松本博畢業于上海交通大學,導師為嚴駿馳教授,其研究主要圍繞自動駕駛與具身智能展開,覆蓋端到端自動駕駛、閉環評測、世界模型、強化學習、軌跡預測、多傳感器融合等方向,同時也關注利用生成式模型和重建式模型構建更真實的世界模擬器,并結合模仿學習與強化學習訓練端到端決策智能體。在學術成果方面,他已在 IEEE TPAMI、IJCV、RSS、CVPR、ICCV、ECCV、NeurIPS、ICLR 等國際頂級會議和期刊發表論文 40余篇,其參與研究曾獲得 ICCV 2021 Mair2 Workshop 最佳學生論文獎和 CVPR 2023 最佳論文獎,另有研究成果獲得 2025年 Waymo 仿真智能體世界模型挑戰賽冠軍。谷歌學術引用 4000 余次。此外,他還擔任 NeurIPS與ICLR的Area Chair和TPAMI、TRO等期刊的審稿人。


參考鏈接:https://jiaxiaosong1002.github.io/

這次去 CVPR 現場,一定不要錯過

【認識大牛+賺外快】的機會

需要你做什么:把你最關注的10個大會報告,每頁PPT都拍下來

你能獲得什么?

認識大牛:你將可以進入CVPR名師博士社群;

錢多活少:提供豐厚獎金,任務量精簡;

聽會自由:你的行程你做主,順手就把外快賺。拍下你最感興趣的10個報告PPT即可。

如果你即將前往CVPR,想邊聽會邊賺錢,還能順便為AI學術社區做貢獻、認識更多大牛,歡迎聯系我們:[添加微信號:MS_Yahei]

【限額5位,先到先得】

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
何云偉的相聲專場,票價賣到480一張,你猜臺下坐了多少人?

何云偉的相聲專場,票價賣到480一張,你猜臺下坐了多少人?

手工制作阿殲
2026-06-11 19:43:28
悲哀!高考女生兩天花光母親3個月工資2萬元,質問“我錯了嗎?”

悲哀!高考女生兩天花光母親3個月工資2萬元,質問“我錯了嗎?”

火山詩話
2026-06-12 11:46:38
澳大利亞4-1漁翁得利,世界杯穩出線,南美最弱隊浮現

澳大利亞4-1漁翁得利,世界杯穩出線,南美最弱隊浮現

精彩瞬間回顧
2026-06-13 22:05:28
“鵝腿阿姨”:一個時代有一個時代的笑話

“鵝腿阿姨”:一個時代有一個時代的笑話

天水人李成義
2026-06-13 11:00:23
接送初中生?老教師坦言:小學接安全,初中接的是孩子的整個人生

接送初中生?老教師坦言:小學接安全,初中接的是孩子的整個人生

金哥說新能源車
2026-06-13 06:40:40
尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

詭譎怪談
2025-04-30 22:17:42
青島鬼樓奇案:德國富商蓋洋樓死于非命,20年后,解放軍查出真相

青島鬼樓奇案:德國富商蓋洋樓死于非命,20年后,解放軍查出真相

歷來都很現實
2025-02-23 02:50:42
葬禮上吵翻!親家母非要女婿端骨灰,湖南媽媽當場拒絕:外姓不行

葬禮上吵翻!親家母非要女婿端骨灰,湖南媽媽當場拒絕:外姓不行

火山詩話
2026-06-13 11:39:12
普京向不友好國家提出建議:永遠不要與俄羅斯作戰

普京向不友好國家提出建議:永遠不要與俄羅斯作戰

俄羅斯衛星通訊社
2026-06-13 16:08:03
巴拉圭一對球迷姐弟因高顏值走紅,被譽為世界杯女友/男友

巴拉圭一對球迷姐弟因高顏值走紅,被譽為世界杯女友/男友

可樂談情感
2026-06-13 19:28:40
我與父親斷絕關系10年,他去世我沒去他葬禮,三天后他戰友找上門

我與父親斷絕關系10年,他去世我沒去他葬禮,三天后他戰友找上門

千秋文化
2026-06-10 20:43:44
震驚!武漢某大學食堂貼出提示稱“燒鵝飯為廣東俗稱,實為烤鴨”

震驚!武漢某大學食堂貼出提示稱“燒鵝飯為廣東俗稱,實為烤鴨”

火山詩話
2026-06-13 08:00:03
把瑜伽褲穿成日常的松弛感美女

把瑜伽褲穿成日常的松弛感美女

只要高興就好
2026-04-13 14:30:30
罕見,房貸連續兩個月負增長了

罕見,房貸連續兩個月負增長了

城市財經
2026-06-13 11:34:46
藏不住了!人民日報言辭犀利評董路,范志毅早把真相說透了

藏不住了!人民日報言辭犀利評董路,范志毅早把真相說透了

阿訊說天下
2026-06-10 12:28:31
你吃過公司最大的瓜是什么?網友: 這是我吃過最大的瓜

你吃過公司最大的瓜是什么?網友: 這是我吃過最大的瓜

夜深愛雜談
2026-06-13 23:33:10
丘天和嬌妻近照,最成功混血球員,打了9年CBA,妻子是中國人

丘天和嬌妻近照,最成功混血球員,打了9年CBA,妻子是中國人

大西體育
2026-06-13 08:38:12
大水沖了沙漠!災禍變喜事?50,萬畝胡楊命保住了

大水沖了沙漠!災禍變喜事?50,萬畝胡楊命保住了

完善法
2026-06-13 20:58:57
膽子太大了!俄議員公開批評克宮,烏克蘭將俄語從保護語言中剔除

膽子太大了!俄議員公開批評克宮,烏克蘭將俄語從保護語言中剔除

史政先鋒
2026-06-13 20:41:18
1981年喬清陸不滿黎筍,攜九人投奔我國,他們后來境遇如何

1981年喬清陸不滿黎筍,攜九人投奔我國,他們后來境遇如何

嘮叨說歷史
2026-06-10 15:52:08
2026-06-14 07:40:49
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7372文章數 20757關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

伊朗官員:目前版本伊美諒解備忘錄“比之前的更好”

頭條要聞

伊朗官員:目前版本伊美諒解備忘錄“比之前的更好”

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

教育
藝術
游戲
親子
房產

教育要聞

整體思想求值,一個視頻學會!

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

LPL淘汰賽:就差一點,今天無奇跡!BLG五局戰勝WE,決賽見

親子要聞

真正覺醒的家庭

房產要聞

海南最賺錢行業曝光!最快4年半,??谌钯I三房!

無障礙瀏覽 進入關懷版