无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

量化穩定性與目標混淆之間的權衡

0
分享至

Quantifying Trade-Offs Between Stability and Goal-Obfuscation?

量化穩定性與目標混淆之間的權衡

https://arxiv.org/pdf/2605.06630



摘要

對抗環境下的安全關鍵型自主控制不僅要求跟蹤誤差信號具備Lyapunov穩定性。對于運行在線貝葉斯推斷的被動觀察者而言,執行目標導向軌跡的智能體具有內在的意圖可讀性(legibility),因為任何Lyapunov吸引域的收縮動力學會導致觀察者對潛在意圖參數的后驗信念不斷集中。本文將連續狀態空間上的意圖隱私問題,首次形式化為一個聯合控制問題,該問題同時作用于物理狀態與假設觀察者的潛在信念狀態。

鑒于主要挑戰集中于信念狀態動力學的分析,本文假設智能體動力學較為簡單,由微分包含建模。即智能體為全驅動系統,其控制輸入受到有界未知擾動的影響。觀察者的意圖推斷過程被建模為一個離散時間隨機動力系統,其狀態演化于Rao-Blackwellized粒子濾波器(RBPF)的信念狀態空間之上,該濾波器基于大量可能的智能體目標隨機樣本進行推理。智能體的控制輸入被建模為分段常數信號,其跳變時刻與RBPF的更新時刻同步。基于先前的意圖推斷框架及其在線可計算的、基于KL散度的信息泄漏度量,本文施加了一項隱私約束,即利用概率離散時間控制屏障函數(PCBFs),以高概率保證信息泄漏維持在預設閾值之上。一項關鍵技術貢獻在于,分別針對RBPF的貝葉斯更新步驟與重采樣步驟推導了獨立的PCBF結論,從而不僅獲得了針對完整更新過程的PCBF結果,還實現了隱私約束與智能體任務側跟蹤要求的融合。最后,通過考察隱私約束與跟蹤包絡(tracking envelope)之間的耦合關系,進行了聯合可行性分析。

1 引言

控制Lyapunov函數(CLF)與控制屏障函數(CBF)為通過在線凸規劃綜合實時安全關鍵型控制器提供了標準機制 [Ames et al., 2016, 2019]。在該范式下,控制器在每個時間步僅受最小擾動,使得生成的控制輸入在驅動Lyapunov函數趨于零的同時保持屏障函數非負,從而通過求解單一二次規劃(QP)同時獲得穩定性與約束滿足的聯合保證 [Ames et al., 2016]。該框架已被廣泛應用于足式機器人運動控制、自適應巡航控制以及多機器人協同等諸多領域 [Ames et al., 2019]。

基于Lyapunov的控制器設計背后隱含著一個假設:閉環穩定性無疑是一種理想的系統特性。從經典理論來看,基于Lyapunov的設計旨在構造具有法向雙曲不變流形(NHIM)結構的閉環動力學 [Palmer, 1995]。在該結構中,吸引域可分解為“目標參數化吸引子”與“法向纖維”的直積,且系統動力學在法向纖維上呈現收縮特性。因此,若外部觀察者已知(或可推斷出)該吸引子結構所對應的有限維參數向量,則隨著智能體向目標收斂,閉環軌跡的收縮幾何特性將導致觀察者對這些參數的后驗分布以不斷加快的速度趨于集中。對于目標導向型智能體而言,關鍵的潛在參數包括目標位置、目標半徑及期望到達時間。而任務最優軌跡恰恰最密集地分布在吸引流形附近,這一事實進一步加劇了系統的意圖可讀性問題。Dragan等人[2013]的研究表明,優化任務代價的軌跡具有內在的可讀性:貝葉斯觀察者僅需短暫的觀測窗口即可快速集中對智能體真實目標的后驗信念;若要降低此種可讀性,智能體必須有意識地偏離任務最優軌跡。相關互補研究將觀察者的推斷問題建模為逆向規劃 [Ramírez and Geffner, 2009; Baker et al., 2009] 或最大熵逆向強化學習 [Ziebart et al., 2008],進一步證實:在Lyapunov方法最為有效的系統運行區間內,目標穩定軌跡恰恰蘊含最豐富的信息。

先前的研究 [Wang et al., 2025b] 針對本文所研究類型的連續狀態系統,對該可讀性問題進行了形式化建模與量化分析。該研究中,對手對智能體意圖進行建模,并維護 N ? 0 個加權粒子,通過Rao-Blackwellized粒子濾波器(RBPF)從含噪位置測量中遞歸估計智能體意圖。結果表明,在標稱條件下對手能夠迅速還原智能體的真實意圖,這凸顯了對于任何采用基于Lyapunov控制的智能體而言,可讀性問題在實際應用中具有嚴峻的威脅。

本文旨在解答 [Wang et al., 2025b] 所遺留的控制綜合問題:面對一個運行RBPF推斷框架的強大對手,智能體應如何設計其控制輸入,才能在延緩推斷集中的同時,兼顧任務的穩定性與跟蹤要求?

本文貢獻。 本文的主要貢獻如下: 首先,將意圖隱私任務形式化為一個分段常數(間歇性驅動)控制問題。該問題直接作用于由RBPF權重更新(并擴展至RBPF狀態估計變量)所誘導的概率單純形上的潛在信念動力學,而非將其作為物理狀態空間的輔助優化目標。

其次,推導了針對RBPF更新周期的有限時域概率隱私保證。通過分析重采樣步驟所面臨的技術難點被成功克服,其關鍵在于將RBPF更新視為信念狀態空間上兩個概率獨立的隨機變換之復合:即貝葉斯更新步驟與重采樣步驟。針對上述每一變換,分別推導了信息泄漏增量的概率上界,并依據 [Mestres et al., 2025] 所建立的PCBF框架,將其融合為適用于完整RBPF更新過程的PCBF結論。值得注意的是,重采樣變換的概率界完全獨立于系統動力學與控制輸入,這為未來將本方法擴展至更復雜的智能體動力學模型提供了研究動機。

第三,開展了聯合可行性分析。通過構造兩類控制輸入(一類用于目標混淆,另一類用于優化跟蹤)之間的仿射插值,深入考察了隱私約束與跟蹤約束之間的耦合關系。約束間的沖突被顯式化為對插值參數的不等式約束。分析表明,當預設的跟蹤誤差包絡限制不過于嚴苛時,系統可實現聯合可行。未來仍需深入探究RBPF的收斂特性,以期建立嚴格的理論結論:闡明在強制要求跟蹤誤差具備實用穩定性(practical stability)的條件下,目標混淆任務將不可避免地面臨不可行性。

2 背景

本文主要基于兩個來源的進展。2.1節回顧了 Wang 等人 [2025b] 的工作,其中引入了用于意圖推斷的 RBPF(Rao-Blackwellized 粒子濾波器)。2.2節回顧了 Mestres 等人 [2025] 關于概率屏障函數的必要結果。

2.1 意圖推斷






本文的出發點是定理1 所產生的下界是假設對手(putative adversary)的 RBPF 信息狀態的與時間無關函數這一關鍵觀察。因此,這些函數可以被用作控制屏障函數。

2.2 概率安全性與 PCBF

考慮一個離散時間受控隨機系統



3 問題表述


為簡化起見,假設智能體是全驅動的,但受到有界擾動的影響,


4 概率信息安全性界

本節將 PCBF 框架應用于 RBPF 信念狀態更新,以獲得有限時域的概率隱私保證。

4.1 信息狀態動力學




4.2 貝葉斯更新屏障



4.3 重采樣更新屏障




4.4 組合PCBF界

引理1與引理2均以高概率為屏障變化量(13)確立了加法下界,而非PCBF條件(7)所要求的乘法形式。乘法形式可通過將狀態限制在下水平集(sublevel set)內予以恢復。


5 討論:聯合可行性




6 結論

本文探討了目標導向型智能體在存在被動對手情況下的意圖隱私問題,該對手運行在線貝葉斯推斷算法以推斷智能體的目標。本文并未修改任務或將隱私視為輔助懲罰項,而是將意圖隱私形式化為一個控制問題,該問題在由潛在信念狀態擴展的狀態空間上具有分段常數驅動特性;同時,將 RBPF 信息狀態
視為受控馬爾可夫過程,并將觀察者基于 KL 散度的信息泄漏作為待調節量。

主要的技術貢獻是一個組合概率控制屏障函數(PCBF)結果,它為完整的 RBPF 更新周期提供了有限時域的概率隱私保證。貝葉斯更新步驟通過將觀測 y y 控制向粒子云的切比雪夫中心,從而產生了屏障增量的一個加法下界。重采樣步驟通過將霍夫丁不等式(H?ffding’s inequality)應用于重新初始化粒子的隨機貢獻,產生了第二個加法下界。這兩個下界通過并界(union bound)論證以乘法方式組合,從而得出了一個覆蓋整個更新周期且失效概率為 δ f 的單一 PCBF 條件。

一項補充性貢獻揭示了任務中的混淆部分與其跟蹤部分之間的張力。研究表明,在存在嚴格的跟蹤包絡約束的情況下,智能體狀態的 RBPF 表示所具有的巨大不確定性可能導致聯合任務不可行。同時,如果放寬包絡約束,可行性得以恢復,且這種關系已被量化。

仍有幾個方向有待未來研究,其中最重要的是獲得能夠刻畫 RBPF 意圖濾波框架收斂性(及收斂速率)的收斂性結果。此類結果與跟蹤問題和混淆問題的聯合可行性密不可分(見引理 1),特別是在建立對有效混淆所允許的跟蹤包絡自然增長率的理解方面。為了進行驗證,有必要開展進一步的數值仿真與硬件實驗開發工作。

原文鏈接: https://arxiv.org/pdf/2605.06630

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日本爆發大規模抗議,高市終于低頭,中國外交部冷言:不糾錯免談

日本爆發大規??棺h,高市終于低頭,中國外交部冷言:不糾錯免談

貴州霖霖
2026-05-17 09:30:17
英國250萬穆斯林中,1/3年輕人正放棄約會:Halal Marriage為何成新選擇

英國250萬穆斯林中,1/3年輕人正放棄約會:Halal Marriage為何成新選擇

時光慢郵啊
2026-05-17 01:29:56
美退役軍官曾宣稱:中國殲16D電子戰機,簡直是美國海軍的噩夢!

美退役軍官曾宣稱:中國殲16D電子戰機,簡直是美國海軍的噩夢!

華史談
2026-05-17 08:57:13
在泰華人目擊“火車撞公交致8死32傷”:看著火車駛來懷疑它能否剎住,公交被拖行數十米起火,殃及多輛摩托車和私家車

在泰華人目擊“火車撞公交致8死32傷”:看著火車駛來懷疑它能否剎住,公交被拖行數十米起火,殃及多輛摩托車和私家車

極目新聞
2026-05-17 13:09:18
海風:聽到特朗普這句話,臺灣當局該醒了

海風:聽到特朗普這句話,臺灣當局該醒了

環球網資訊
2026-05-16 17:37:05
三位美女你喜歡哪位我看中右邊,頗為賢惠、穩重大方,氣質美滿

三位美女你喜歡哪位我看中右邊,頗為賢惠、穩重大方,氣質美滿

科學發掘
2026-05-17 15:56:57
活塞G7傷情報告出爐,哈登迎來尷尬里程碑,阿特金森該變陣了

活塞G7傷情報告出爐,哈登迎來尷尬里程碑,阿特金森該變陣了

世界體育圈
2026-05-17 13:16:49
馬斯克黃仁勛在空軍一號熱聊照曝光,喝了可樂,皮衣黃疑似用三星

馬斯克黃仁勛在空軍一號熱聊照曝光,喝了可樂,皮衣黃疑似用三星

譯言
2026-05-16 10:38:32
空軍一號飛機即將起飛返航時,現場工作人員有人直接倒地!

空軍一號飛機即將起飛返航時,現場工作人員有人直接倒地!

阿龍聊軍事
2026-05-17 06:43:05
老板娘問我她屁股大不大?我該怎么回答?

老板娘問我她屁股大不大?我該怎么回答?

太急張三瘋
2026-03-28 12:35:10
44%進度,慢就是快

44%進度,慢就是快

閃存獵手
2026-05-16 04:52:09
特斯拉國內新品上架,全球最低價來了!

特斯拉國內新品上架,全球最低價來了!

XCiOS俱樂部
2026-05-17 16:32:44
斯維托麗娜奪得羅馬冠軍后,孟菲爾斯為妻子寫下溫情告白

斯維托麗娜奪得羅馬冠軍后,孟菲爾斯為妻子寫下溫情告白

網球之家
2026-05-17 13:29:52
霍爾木茲海峽,突傳大消息

霍爾木茲海峽,突傳大消息

第一財經資訊
2026-05-17 10:43:53
特朗普剛訪華,美媒察覺不對:最強殲20已部署,解放軍劍指臺海

特朗普剛訪華,美媒察覺不對:最強殲20已部署,解放軍劍指臺海

時光流轉追夢人
2026-05-17 02:41:07
訪華已經結束,特朗普回到白宮,用6句話談中國之行,措辭不尋常

訪華已經結束,特朗普回到白宮,用6句話談中國之行,措辭不尋常

阿校談史
2026-05-17 15:12:43
蘋果防線全線血崩!Mythos5天攻破最強硬件,全球20億臺設備危了

蘋果防線全線血崩!Mythos5天攻破最強硬件,全球20億臺設備危了

新智元
2026-05-15 12:33:48
這場頂級晚宴,真正的主角不是馬斯克、黃仁勛,而是一方中式桌面

這場頂級晚宴,真正的主角不是馬斯克、黃仁勛,而是一方中式桌面

魔都姐姐雜談
2026-05-15 00:53:47
固態電池一旦上車,最先被淘汰的不是燃油車,而是現在的新能源車

固態電池一旦上車,最先被淘汰的不是燃油車,而是現在的新能源車

老特有話說
2026-05-17 13:11:49
國宴待了32年的老國貨礦泉水!喝一次,娃哈哈農夫山泉都不香了

國宴待了32年的老國貨礦泉水!喝一次,娃哈哈農夫山泉都不香了

老特有話說
2026-05-17 13:15:19
2026-05-17 17:11:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1406文章數 19關注度
往期回顧 全部

科技要聞

三大運營商即將免月租?多方回應

頭條要聞

女子的奔馳4S店不愿回收 丈夫:賭100萬 找專業機構查

頭條要聞

女子的奔馳4S店不愿回收 丈夫:賭100萬 找專業機構查

體育要聞

生死戰只拿3分的核心,還有留的必要嗎?

娛樂要聞

《主角》劉浩存上線,死別猝不及防

財經要聞

OpenAI和蘋果的“聯盟”即將破裂

汽車要聞

大五座SUV卷王!樂道L80上市 租電15.68萬元起

態度原創

親子
本地
時尚
手機
公開課

親子要聞

媳婦睡懶覺不起床,閨女花式叫床服務,媳婦立馬乖乖起床了

本地新聞

用蘇繡的方式,打開江西婺源

5.22沙龍報名|何寬×黃競歐×王如菲:「二手知識,一手思考」

手機要聞

W19排名出爐,蘋果還是第五,華為還是第一

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版