无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

波恩大學 Maren Bennewitz 教授:讓機器人在遮擋世界中主動獲取信息 | ICRA 2026

0
分享至


機器人不能只會“看見”。

作者丨鄭佳美

編輯丨馬曉寧

2026 年 6 月 4 日,在 ICRA 2026 “Robot perception and spatial AI” Keynote Session 上,波恩大學教授 Maren Bennewitz 發表了關于主動感知機器人的演講,直指真實機器人部署中的一個基本困境:機器人面對的世界往往是雜亂、持續變化且只能部分觀測的,僅靠被動觀察無法完成可靠理解。

Bennewitz 的核心判斷是:機器人要真正進入家庭、農業和服務場景,不能只把感知當作“看一眼”的過程,而必須把感知、預測、先驗知識和動作規劃放到同一個閉環里。機器人需要主動移動視角、推動或抓取遮擋物,用最少的動作獲得最多的信息。

她在演講中給出了三類典型場景:

其一,在貨架或桌面等遮擋環境中,機器人通過不確定性感知的語義地圖,決定哪些物體值得移動;

其二,在家庭物體搜索中,機器人利用 3D 場景圖、LLM 語義先驗、幾何約束和物體重定位規律,在不重新探索全屋的情況下按需尋找物體;

其三,在農業監測與果實采摘中,機器人借助上一時刻的地圖先驗、非剛性配準和葉片形變模型,規劃更高效的觀測與操作動作。

這場演講的關鍵洞察在于:主動感知并不是“多看幾眼”,而是把“看哪里、動什么、何時停止”變成信息增益最大化問題。對于機器人而言,世界不是一張靜態照片,而是一組可以通過行動逐步揭開的信念分布。

1、真實環境的核心難點不是沒有圖像,而是不確定性和遮擋:機器人必須知道自己不知道什么。

2、主動感知的價值在于把動作變成信息采集工具:換視角、推開物體、移動葉片,都是為了降低地圖和語義的不確定性。

3、先驗知識并不替代感知,而是幫助機器人更聰明地選擇下一步:LLM 提供語義常識,幾何模型過濾不可能位置,重定位模型學習人類移動物體的習慣。

4、在農業機器人中,時間維度同樣重要:上一輪完整重建可以作為下一輪觀測規劃的先驗,讓機器人在重復監測中避免從零開始。

5、面向采摘等高價值任務,機器人需要從“識別果實”進一步走向“估計可采摘性”,并理解葉片、視角和目標之間的遮擋關系。

總的來看,Bennewitz 試圖回答的是一個非常現實的問題:當機器人無法一次看清世界時,它應該如何通過行動把未知變成已知?她的答案是,用信念表示世界,用先驗約束搜索,用動作主動降低不確定性。

以下是AI 科技評論對 Maren Bennewitz 在 ICRA 2026 大會發表的演講實錄整理。內容基于英文現場轉寫進行不改原意的中文整理。

01


為了看見遮擋物,機器人必須學會“動手”

正如我們都知道的,機器人運行在雜亂、變化且只能部分觀測的環境中。因此,單純被動觀察遠遠不夠。為了完成任務,主動感知環境是必要的。主動感知機器人必須在行動中整合感知、預測、先驗信息和動作,主動獲取信息,并提升對環境的理解。

今天我將介紹機器人如何高效增強它對世界的知識,主要圍繞雜亂場景和隱藏物體展開。更具體地說,我會講機器人如何利用先驗和試探性動作,在少量步驟內完成感知和操作。

先看一個場景。我們有一個貨架,前面有幾個盒子,擋住了后方空間的視線。問題是,我們怎樣才能看見盒子后面的物體?也就是說,機器人如何推理前方物體背后可能存在什么?

在這個例子里,僅僅改變視角是不夠的。機器人必須移動場景中的一些物體,才能看見后面并覆蓋被遮擋的空間。這就是我們關注的問題。

我們使用一種帶有不確定性的度量語義地圖表示。這個表示既可以推理場景中的所有物體,也可以推理操作動作及其約束的影響。我們學習一個模型,預測這個地圖表示會如何隨著動作結果而演化。也就是說,我們預測場景會如何因為視角變化、推動或者抓取而改變,并把它作為動作如何改變世界的先驗。


基于這個學習到的模型,我們可以推斷動作的效果。因此,機器人會選擇那些能夠降低環境表示不確定性、降低度量語義表示不確定性的最佳動作。比如在這個案例里,機器人可以先向左推動一個盒子,然后抓取另一個盒子,把它移到一側,從而看見此前被遮擋的空間,并識別其中的物體。

我們學習動作條件網絡,預測占據、語義以及相應的不確定性。這些網絡會預測機器人執行某個動作之后,信念會如何變化。網絡也會預測對應的不確定性。隨后,我們選擇那些能夠降低不確定性、或者提高預期信息增益的動作。我們會在接下來兩個動作的序列上做優化,選擇最大化信息增益、降低不確定性的序列。


這里是我們的目標函數。對于純粹的視角變化,我們考慮預期信息增益;對于抓取、推動物體以移除后方遮擋空間的動作,我們還會額外考慮動作成本。然后,我們評估下一步測試動作帶來的信息增益,并在兩個動作的序列上進行優化,以最大化信息、降低不確定性。


這是我們與合作者共同開發的方法。接下來可以看到系統運行的過程:左邊是帶有相機的機器人實驗平臺,右邊顯示機器人已經識別出的物體。最開始,機器人已經識別了一些物體,而它的任務是識別場景中的所有物體。

使用我們的方法,機器人會查看世界中的不確定性地圖,選擇最好的動作來處理場景中的所有物體。它會移動一些物體,抓取一些物體,把它們放到一側,從而觀察后方空間。最后,機器人識別出了場景中的所有物體。當然,機器人只會移除那些為了覆蓋整個空間而必須移除的物體,并會在之后把它們放回貨架。

這里可以看到,機器人能夠維護關于環境中物體的長期信念。因此,即使存在遮擋,它也知道物體在貨架上的位置。

02


基于 3D 場景圖的按需物體搜索

接下來一個問題是:機器人如何在更大的場景中搜索物體?例如在一個完整家庭環境中,物體會頻繁移動、重新放置,也可能被隱藏在家具內部。我們如何讓機器人在用戶需要某個物體時進行搜索,而不是重新探索整個環境?

為此,我們把環境重建為一個 3D 場景圖,就像前一場報告中也展示過的那樣。這個圖包含房間、家具和隔層結構。我們利用這個圖來推理被搜索物體可能位于哪里,并把被搜索物體視為相關過程中的動態節點。


在搜索物體時,我們進行空間信念推理,利用這個圖表示來推理物體的位置。比如這里的例子中,機器人的任務是尋找一個物體。環境中有三個可能的位置:貨架、書桌和咖啡桌。

第一步,我們使用來自 LLM 的語義先驗,初始化關于搜索物體位置的信念。在這個例子里,機器人一開始認為最可能的位置是貨架,其次書桌和咖啡桌也有一定概率。

當然,我們也考慮幾何信息。我們會預測目標物體是否應該能夠放在某個位置上。如果這個物體太大,無法放進某個隔層,那么我們就會降低它在該位置的概率,相應地提高其他位置的概率。

最后,非常重要的是,我們會基于重定位動態來更新信念。也就是說,機器人學習環境中的物體重定位轉移概率。


整體流程有三步。首先,LLM 根據場景圖為我們預測候選放置位置。它的輸入是場景圖,輸出是候選位置,例如家具節點或者隔層節點,然后我們把這些排序轉換成關于位置的先驗。

其次,我們基于目標物體尺寸過濾掉不可行的位置。再次,我們基于觀察到的稀疏數據更新重定位轉移概率,讓機器人學習人的移動習慣,并隨著時間調整搜索策略。

我們把這些因素結合到全局定位中。由于被搜索物體可能在沒有被觀察到的情況下發生變化,我們也允許一定概率擴散到環境中的其他區域。最后,我們進行代價感知的動作選擇,在物體可訪問性、預期動作成本以及對人的影響之間做平衡,由機器人選擇最有用的位置進行檢查。

我們在家庭環境數據上評估了這個方法,場景中的物體會發生重定位。評估時,我們給定固定的搜索預算,并測試機器人能否找到目標物體。如果不使用任何先驗信息,只在可能搜索位置上使用均勻先驗,那么成功率較低。

加入語義先驗和幾何先驗后,搜索成功率會提高;進一步加入學習到的重定位轉移后,在固定時間預算下,成功率還能進一步提高。因此,這個方法能夠支持按需搜索,而不需要重新探索整個環境,因為機器人會隨時間維護長期信念。


03


讓農業機器人少走冤枉路

現在我們考慮持續變化的環境。一個具體例子是農業環境:植物會生長,外觀也會隨時間變化。我們考慮園藝或農業應用中的作物重復監測。監測會被反復執行,例如每周兩次,我們希望通過監測變化來估計產量。

當然,我們不希望每次都從頭開始。想法是使用上一個時間點學習到的模型,來指導當前時間點的視角規劃和重建。當作物生長時,它們會帶來嚴重的遮擋,因此我們需要利用上一輪的先驗。

我們的平臺會在作物行之間移動,并帶有固定的相機陣列。隨著平臺穿過環境,我們可以部分重建作物行。但由于作物有許多行,而且存在遮擋,當前數據中會出現空洞。于是,我們的想法是利用上一時間步的模型作為先驗,進行高效的視角規劃,移動投影或相機來填補當前時間戳數據中的空洞。


具體來說,我們會對上一時間步的重建模型進行非剛性配準。上一時間步的模型更完整,而當前時間步只有部分重建。我們把上一次的模型配準到當前的部分重建上,也就是把兩個點云以非剛性的方式對齊。

之后,我們執行一個優化過程。現在我們有了一個近似表面,可以使用集合覆蓋優化:在估計表面上采樣目標點,然后選擇能夠覆蓋這些目標點的視角。隨后,我們執行覆蓋優化,并用旅行商問題計算一條近似最優路徑。


在真實溫室數據中,首先可以看到移動平臺靜態相機得到的部分重建。由于遮擋,當前數據里有空洞。然后,我們把上一輪數據對齊到當前部分數據,基于近似表面執行視角規劃,再規劃路徑并在平臺上執行,從而收集覆蓋植物的新數據。

最后,我們得到了一條高效路徑,覆蓋了所有表面,也填補了當前數據中的空洞。這個模型隨后又可以用于下一時間步的監測。

04


把葉片也納入行動規劃

剛才我們看到,先驗地圖可以幫助重復監測中的視角規劃更高效。但像甜椒或番茄這樣的果實仍然會被部分遮擋,因為機器人不能僅僅依靠尋找它們就完成任務。有時,移動葉片是必要的,這樣才能可靠估計果實形狀和可采摘性。

在這項工作中,我們使用葉片形變模型來評估候選動作、評估可能的視角,并預測葉片背后的可見性。通過這種方式,我們可以揭示被遮擋的區域,并估計果實的尺寸。


到目前為止,我們假設遮擋葉片是已知的,也就是說機器人知道應該操作哪片葉子,才能看見后方缺失的部分。而我們現在正在做的是學習一種用于遮擋推理的表示。我們的目標是學習一種統一圖表示,建模可見性關系和遮擋關系。利用這個圖,機器人可以識別哪片葉子從哪個方向遮擋了目標,以及應該按什么順序進行處理。

例如,我們會估計觀察方向。在一個例子中,根據這個圖,我們得到果實和葉片的排序,并結合觀察方向判斷某片葉子的遮擋排名最高。因此我們知道,這片葉子需要被推到一側,才能顯露果實并估計它的形狀。

剛才介紹的這些技術可以用于估計可采摘狀態,然后進一步執行實際采摘。這里可以看到,機器人能夠使用一個包含相機、切割器和操作器的三臂系統,可靠地識別作物并完成相關操作。


最后總結一下。機器人在很多場景中都運行在雜亂、變化且只能部分觀測的環境里。因此,機器人需要同時規劃觀察動作和操作動作,用于物體搜索、地圖構建和環境重建。

我展示了先驗如何引導感知以及感知和操作動作的規劃。因此,先驗有助于實現高效的主動感知。

我還展示了信念傳播如何支持對遮擋物體以及操作動作效果的推理。通過主動選擇能夠降低不確定性、提升可觀測性并處理遮擋的動作,我們能夠增強機器人的能力,讓機器人更好地獲取知識、理解環境。

正如我最后提到的,下一步我們將通過學習和表示可見性圖以及遮擋關系,進一步推理遮擋問題;同時也會繼續研究生成式方法和相關服務機器人應用。


05


Q&A 問答環節

聽眾提問:移動葉片這個動作看起來代價比較高。為了估計果實的可采摘性,到底需要實際移動多少?能不能依賴關于果實外形和可采摘性的先驗信息,即使我們沒有完整看到果實?

Maren Bennewitz:謝謝你的問題。首先,我們會使用形狀補全方法。比如我們只部分觀察到甜椒時,可以使用一些方法來估計并補全它的形狀。

然后,我們會對葉片使用形變模型。我們使用一種形變圖來估計葉片能夠如何被操作、應該往哪個方向移動。之后,我們再估計被遮擋的區域是否能夠被顯露出來。這個過程目前當然仍然有成本,但最終我們能夠得到關于甜椒更完整的信息。

聽眾提問:所以你們確實需要移除遮擋物,才能估計它是否可采摘嗎?

Maren Bennewitz:我可能沒有完全理解你的問題。你是說僅僅估計可采摘狀態,對嗎?對于可采摘狀態本身,也許并不總是需要移除葉片;但我們這里討論的是移除葉片來估計形狀、估計合適的操作過程。因此,對于另一些設置,你也許不需要真的移除葉片,但可以做出相應決策。

聽眾提問:謝謝你的報告。我很欣賞這種基于信念的方法。我想問的是,當物體被完全遮擋時,物體本身會出現在你的信念先驗中嗎?如果目標完全被遮擋,這種基于信念的方法如何適應?

Maren Bennewitz:一開始,機器人完全不知道后面有什么。這是對的。因此,這個區域會有很高的不確定性,因為我們不了解這個區域。于是,機器人會推理應該移動哪些物體,才能看見后面。也就是說,我們會給這個區域的占據和語義賦予較高的不確定性。

聽眾提問:所以信念是關于區域的,而不是關于物體的?

Maren Bennewitz:正是如此。我們使用的是度量語義地圖表示,信念是在這個度量語義表示上的。基于這個表示,物體隨后才會被識別出來。謝謝。

去哪看 ICRA 核心【演講/論文】詳解?

為了讓國內的研發者、創業者與投資人能夠毫無時差地掌握本屆 ICRA 2026 的完整干貨,雷峰網已全面上線【ICRA 2026 深度專區】

專區不僅全面收錄了重磅論文的工程化解讀、專家前沿演講,更將持續更新前方記者的第一手會議動態。

與全球 8000 名頂尖大腦同步呼吸,搶先透視具身智能的下一個五年!

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
【世界杯】卡塔爾VS瑞士 世界杯開賽以來最良心的一場比賽!

【世界杯】卡塔爾VS瑞士 世界杯開賽以來最良心的一場比賽!

朝天門足球
2026-06-13 11:23:08
遇見小面起訴后續!索賠八千為何突然認慫,吃相難看結局大快人心

遇見小面起訴后續!索賠八千為何突然認慫,吃相難看結局大快人心

大魚簡科
2026-06-13 19:14:22
開封3歲男童失聯新進展!救援隊透可疑細節,家屬疑慮,恐要成真

開封3歲男童失聯新進展!救援隊透可疑細節,家屬疑慮,恐要成真

奇思妙想草葉君
2026-06-13 22:42:59
制裁不到48小時,菲律賓開始內訌:軍方公開站隊,并選擇對抗中國

制裁不到48小時,菲律賓開始內訌:軍方公開站隊,并選擇對抗中國

銘記歷史呀
2026-06-13 16:02:30
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

花折亦度無情
2026-06-13 16:49:17
剛剛,馬斯克成人類史上首位萬億富翁,但全網最羨慕的是 SpaceX 焊工

剛剛,馬斯克成人類史上首位萬億富翁,但全網最羨慕的是 SpaceX 焊工

AppSo
2026-06-13 09:42:15
提醒:煮熟也有毒。一口都別吃!很多家庭天天在吃,看完趕緊扔!

提醒:煮熟也有毒。一口都別吃!很多家庭天天在吃,看完趕緊扔!

王二哥老搞笑
2026-06-11 13:31:51
兩名中國人在泰被判死刑,中方送上一句話,讓泰國懸著的心落地了

兩名中國人在泰被判死刑,中方送上一句話,讓泰國懸著的心落地了

基斯默默
2026-06-13 14:25:21
2億歐,亞馬爾身價超兩支世界杯東道主球隊全隊身價

2億歐,亞馬爾身價超兩支世界杯東道主球隊全隊身價

懂球帝
2026-06-12 22:06:20
菲防長沒想到,繼全家被中方制裁后,還有更慘的:中國恐斷供化肥

菲防長沒想到,繼全家被中方制裁后,還有更慘的:中國恐斷供化肥

有范又有料
2026-06-13 17:56:58
中國人保集團原黨委委員、副總裁俞小平被查

中國人保集團原黨委委員、副總裁俞小平被查

澎湃新聞
2026-06-13 18:58:26
私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

素衣讀史
2026-06-11 21:56:30
史上最大金融危機將至?中國學者預警,征兆出現,中方已備好底牌

史上最大金融危機將至?中國學者預警,征兆出現,中方已備好底牌

破鏡難圓
2026-06-13 12:04:54
世界杯最猛亞洲隊來了!日本首發11人全五大聯賽,實力超越法國

世界杯最猛亞洲隊來了!日本首發11人全五大聯賽,實力超越法國

十點體壇
2026-06-13 23:00:16
誰能想到,1-0擊敗巴西,2-1擊敗阿根廷的球隊,世界杯首戰被打花

誰能想到,1-0擊敗巴西,2-1擊敗阿根廷的球隊,世界杯首戰被打花

小樓侃體育
2026-06-13 15:09:09
到底真的假的?網傳幾乎所有大學專業都在勸退…

到底真的假的?網傳幾乎所有大學專業都在勸退…

慧翔百科
2026-06-12 17:40:37
全球90%都是日本產?竟無一國成功復刻,一旦斷供我國該如何應對

全球90%都是日本產?竟無一國成功復刻,一旦斷供我國該如何應對

金錯刀
2026-06-12 18:22:07
英格蘭被“偷家”后續:絕大部分被盜物品被追回

英格蘭被“偷家”后續:絕大部分被盜物品被追回

體壇周報
2026-06-13 21:18:29
印度突破人類底線!男子和岳母4年亂倫

印度突破人類底線!男子和岳母4年亂倫

歲月有情1314
2026-06-14 02:31:50
A股,重大調整!就在下周一

A股,重大調整!就在下周一

證券時報
2026-06-13 22:02:33
2026-06-14 06:15:00
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7372文章數 20757關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協議計劃周日簽署 如不順利還有終極手段

頭條要聞

特朗普:美伊協議計劃周日簽署 如不順利還有終極手段

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

手機
藝術
親子
家居
公開課

手機要聞

比華為三折疊還稀缺!iPhone Ultra國行備貨量不足:博主直言搶到賺到

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

親子要聞

真正覺醒的家庭

家居要聞

空間微調 移形換境

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版