亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

鬼手想點誰就點誰?LaSM讓GUI智能體把注意力「收回來」

0
分享至



如果把手機屏幕想象成一個舞臺,GUI 智能體就是臺下那個 “被授權(quán)動手” 的人:它能看懂屏幕上的按鈕、輸入框和彈窗,能按你的指令去點、去滑、去輸入。

問題在于,這個 “動手的人” 并不總是聽你的,它也會聽屏幕上的 “旁白”。當(dāng)旁白以彈窗的形式出現(xiàn),并且寫著 “點確認(rèn)即可完成任務(wù)”“點擊這里是正確答案” 時,智能體會在一瞬間被牽走注意力,手指落在攻擊者希望的位置。

往期工作中已經(jīng)把這種現(xiàn)象描述得足夠形象:環(huán)境里伸出一只 “鬼手”,劫持了你的任務(wù)流程,讓智能體把干擾當(dāng)作任務(wù)的一部分去執(zhí)行



  • 往期鏈接:https://mp.weixin.qq.com/s/W4J9u4qgzuXogxOLspVIHg
  • 論文題目:Caution for the Environment: Multimodal Agents are Susceptible to Environmental Distractions
  • 論文地址:https://arxiv.org/pdf/2507.10610
  • 代碼倉庫:https://github.com/YANGTUOMAO/LaSM

本文關(guān)注的就是這只 “鬼手” 最常見也最危險的形態(tài):彈窗式環(huán)境注入攻擊。如圖 1 所示,與傳統(tǒng)提示詞注入不同,這類攻擊不需要篡改輸入文本,它只要把一個可渲染的視覺元素貼到屏幕上,甚至讓彈窗內(nèi)容與用戶指令在語義上 “看起來很一致”,就可以誘導(dǎo)模型將其當(dāng)作有效目標(biāo),從而導(dǎo)致隱私泄露或系統(tǒng)誤操作。

已有研究將這種威脅系統(tǒng)化為環(huán)境干擾范式,并給出了彈窗、搜索、推薦、聊天等多種場景的評測框架,清楚地顯示多模態(tài)智能體會在 “環(huán)境噪聲” 里發(fā)生目標(biāo)漂移,進而輸出被干擾的動作序列。



圖 1 一個彈窗示例

面對彈窗,現(xiàn)有防御大體有兩條路。

第一條路是重訓(xùn)練,包括偏好優(yōu)化與強化式對齊,通過讓模型在訓(xùn)練時見過更多 “被彈窗騙過” 的負(fù)例來提升抗性。它有效,但代價高,部署門檻也高。

第二條路是提示詞級別的安全提醒,也就是在輸入里加一句 “請忽略屏幕彈窗”,或讓模型用思維鏈把風(fēng)險過一遍。它輕量,但在攻擊彈窗內(nèi)容與任務(wù)語義高度一致的情形下會失效,因為模型被迫在 “看起來很相關(guān)” 的彈窗語句與原始任務(wù)之間做選擇,結(jié)果往往是彈窗贏。

本文選擇了一條更 “像工程但其實更像機制” 的路:不改模型結(jié)構(gòu)、不加額外推理步驟、不重新訓(xùn)練,只在推理前對少數(shù)層的權(quán)重做一次性的放縮,使模型在決策關(guān)鍵階段把注意力重新對齊到任務(wù)相關(guān)區(qū)域

這個方法被稱為LaSM,即 Layer-wise Scaling Mechanism。它看起來很簡單,核心動作只有一個:把某些層的 Attention 與 MLP 權(quán)重同時乘上一個系數(shù) α,使這些層的表征在前向傳播中被 “適度放大”。但它之所以有效,是因為本文先回答了一個更底層的問題:彈窗出現(xiàn)時,模型的注意力是在哪些層開始 “走神” 的。

為了把 “走神” 變成可量化的證據(jù),本文借鑒訓(xùn)練無關(guān)的可視化方法,生成各層的相對注意力熱力圖。一個直觀現(xiàn)象是同一張屏幕在不同層會被看成完全不同的東西:淺層更像在掃視布局,中層開始建立語義對應(yīng),深層逐漸把視線收斂到會影響最終動作的那幾個候選按鈕。

本文將兩個代表性區(qū)域固定下來,一個是關(guān)閉彈窗的

,另一個是彈窗里誘導(dǎo)點擊的

。在每一層,本文從目標(biāo)像素附近截取一個局部 patch,把這個 patch 的注意力值展平成向量,然后用余弦相似度來比較不同樣本對同一區(qū)域的關(guān)注是否一致。形式化地說,局部向量為:



而兩次注意力模式的相似度為:



關(guān)鍵不是相似度本身,而是 “正確輸出” 和 “錯誤輸出” 在層間的分化軌跡。本文構(gòu)造了兩類樣本集:一種是模型能正確選擇

的集合,另一種是模型會被誘導(dǎo)去點

或其他無關(guān)元素的集合。

圖 2 的結(jié)果顯示,在淺層階段,正確與錯誤樣本的注意力模式幾乎沒有差別,它們都像是在 “看熱鬧”。差異從更深的語義層開始出現(xiàn),并且在一段中層區(qū)間內(nèi)變得最明顯。換句話說,模型不是一上來就被彈窗騙了,而是在走到 “需要把視覺細(xì)節(jié)與任務(wù)意圖綁定” 的那幾層時,注意力逐漸被彈窗的誘導(dǎo)元素拽偏了。這就是本文提出 “安全關(guān)鍵層” 的經(jīng)驗依據(jù)。



圖 2 各層關(guān)鍵區(qū)域注意力余弦線相似度

有了關(guān)鍵層,下一步就是干預(yù)。本文先嘗試了一個看似合理但實際會翻車的方案:直接把深層中差異最大的那幾層統(tǒng)一放大。實驗發(fā)現(xiàn),這種 “粗暴放大” 不僅沒有提升防御,反而會破壞模型原本的層級平衡,使得模型在高層語義聚合階段出現(xiàn)不穩(wěn)定。

于是本文設(shè)計了更穩(wěn)妥的 layer range narrowing 過程:先從全層放縮開始,觀察正確率隨層邊界變化的走勢,逐步收縮出一個能提升正確輸出比例的層區(qū)間。它的本質(zhì)是一種訓(xùn)練無關(guān)的結(jié)構(gòu)搜索,目標(biāo)是把放縮施加在 “既能改變決策,又不破壞全局語義” 的那段中層語義區(qū)間。如圖這兩種定位策略導(dǎo)致了顯著防御效果的差異。



圖 3 逐層放縮策略







效果是否真有這么 “補丁級別” 的好用,實驗數(shù)據(jù)給出了非常清楚的回答。本文在 12 種彈窗變體上構(gòu)建了 2,400 張受擾截圖,這些變體同時覆蓋彈窗大小、文字語義相關(guān)性以及字體顯著性。評價指標(biāo)使用 DSR,即模型是否選擇關(guān)閉彈窗作為防御成功。

表 1 給出了兩種主干模型在多種防御基線下的對比,最直觀的結(jié)論是 LaSM 幾乎對所有基線都能帶來顯著提升。作為一種后處理(post-hoc)的插件組件,LaSM 不需要重新訓(xùn)練或修改模型架構(gòu),和基線方法可以無縫銜接。以 Qwen2-VL-7B 為例,無防御(No defense, ND)的基座模型在 overlay 與 inductive 兩類攻擊下的平均 DSR 分別只有 18.9% 與 14.8%,和 LaSM 結(jié)合使用后分別提升到 66.4% 與 68.3%。當(dāng)把 LaSM 與思維鏈安全提示詞組合時,在相同數(shù)據(jù)集上 DSR 可以接近 100%。在 LLaVA-v1.6-Vicuna-13B 上,LaSM 同樣表現(xiàn)穩(wěn)定,在多個設(shè)置下達(dá)到接近或達(dá)到滿分。



表 1 論文實驗結(jié)果

本文并沒有止步于 “DSR 數(shù)值變高” 這一層,而是繼續(xù)追問:模型到底是怎么被拉回來的。一個關(guān)鍵證據(jù)來自注意力響應(yīng)曲線。本文定義了 AttnMean (l),即第 l 層熱力圖上目標(biāo)區(qū)域的平均注意力強度,







如圖 4 所示,當(dāng)對 “正確層區(qū)間” 進行放縮時,中層語義階段的注意力會明顯抬升,并且在深層的最終決策熱力圖中,模型的關(guān)注點更集中地落在

附近。相反,如果對 “錯誤層區(qū)間” 放縮,注意力會出現(xiàn)擴散,甚至發(fā)生明顯的 “注意力漂移”。這個現(xiàn)象解釋了為什么 LaSM 必須 “選對層”,也解釋了為什么它不是一個把所有層都變大就能解決的問題。



圖 4 平均注意力分?jǐn)?shù)對比

LaSM 還有兩個容易被忽略但對落地很關(guān)鍵的結(jié)論。

第一個結(jié)論是組件必須聯(lián)合放縮。本文做了消融實驗,結(jié)果顯示:只放縮注意力權(quán)重,準(zhǔn)確率甚至比無防御更低,只放縮 MLP 也同樣崩壞,只有 Attention 與 MLP 同時放縮,防御才會上來。表 2 消融實驗的結(jié)果顯示,在同一設(shè)置下,聯(lián)合放縮得到 84.80% 的 DSR,而僅放縮注意力與僅放縮 MLP 分別只有 0.95% 與 0.47%。這說明彈窗攻擊并不是單純 “注意力被吸走” 這么簡單,非線性表征的門控與放大同樣在決定最終動作。

第二個結(jié)論是 α 不是越大越好。本文在 [0.9,1.3] 區(qū)間按步長掃描,發(fā)現(xiàn)有效范圍通常貼近 1,并且不同模型的最優(yōu)點并不一致。以 Qwen2-VL-7B 為例,α=1.10 時 DSR 達(dá)到峰值 94.79%,但當(dāng) α 偏離到 1.30 甚至更大時,性能會快速下滑,輸出也會出現(xiàn)語義扭曲。附錄里甚至展示了極端 α 下模型輸出變得 “語無倫次” 或 “過度保守反復(fù)點擊關(guān)閉” 的失敗模式,這些例子讓 “系數(shù)敏感性” 變得非常直觀。



表 2 消融實驗

更重要的是,本文沒有把視角限制在單步的 “點哪個按鈕” 上。因為在真實手機任務(wù)里,彈窗不是孤立出現(xiàn)的,它往往插在一個長流程的中間。為此,本文基于 AndroidControl 構(gòu)建了一個更接近真實部署的評測集。它先篩出模型本來就能完整跑通的 224 個 episode,然后在每個 episode 的隨機一步插入合成彈窗,再追加一張干凈截圖來模擬 “關(guān)掉彈窗繼續(xù)任務(wù)” 的合理行為。最終數(shù)據(jù)集包含 911 張圖像,覆蓋正常與攻擊兩種狀態(tài)。

結(jié)果表明,LaSM 在幾乎不犧牲正常能力的情況下,顯著提升了完整任務(wù)成功率。表 3 顯示,在 OS-Atlas-7B-Pro 上,LaSM 的 Type 準(zhǔn)確率為 94.4%,與無防御的 97.26% 相比僅有輕微下降;Grounding 準(zhǔn)確率為 76.05%,與無防御的 75.24% 基本持平;而最關(guān)鍵的 TSR 從 18.75% 提升到 30.36%,相對提升 61.92%。這組數(shù)據(jù)回答了一個部署方最關(guān)心的問題:防御補丁是否會讓正常任務(wù)變鈍。本文給出的答案是影響很小,但換來的魯棒性提升很實在。



表 3 真實手機任務(wù)防御效果和影響

附錄里還有兩個 “異常發(fā)現(xiàn)”。第一類失敗是極簡界面上的主導(dǎo)彈窗。當(dāng)屏幕幾乎沒有其他信息時,彈窗會成為視覺上唯一的錨點,模型更容易把它當(dāng)作任務(wù)核心去執(zhí)行。第二類失敗是輸入文字時對彈窗視而不見。模型一旦進入 TYPE 模式,鍵盤布局會形成一種強特征,使得它傾向于沿著既定輸入路徑繼續(xù)完成輸入,而忽略了新出現(xiàn)的彈窗。本文推測這是某種 “模式捷徑”,與近期關(guān)于 GUI 智能體記憶化與捷徑化的分析相吻合。作者想通過這些失敗模式的展示,進一步把防御方法從 “實驗室平均指標(biāo)” 推向 “真實世界魯棒性”,告訴其他研究者哪里仍然需要額外的策略協(xié)同。



圖 5 防御失敗案例展示

如果要用一句話概括本文的貢獻,那么它并不是又提出一個 “更強的提醒提示詞”,也不是再收集一批數(shù)據(jù)去重訓(xùn)練,而是從注意力漂移的層間規(guī)律出發(fā),找到一段安全關(guān)鍵層區(qū)間,并用一個訓(xùn)練無關(guān)的權(quán)重放縮補丁,把 GUI 智能體的注意力從彈窗的 “鬼手” 里抽回來。彈窗仍然會出現(xiàn),誘導(dǎo)文本仍然會寫得像任務(wù)的一部分,但當(dāng)關(guān)鍵層的表征不再被輕易拽偏時,智能體至少不必把 “看見” 誤當(dāng)成 “該做”。這或許是讓多模態(tài)智能體真正走向可部署的重要一步。

本文第一作者閆子赫,為上海交通大學(xué)網(wǎng)絡(luò)空間安全專業(yè)二年級博士研究生,主要研究方向為多模態(tài)智能體安全與多模態(tài)智能體可解釋性,導(dǎo)師是張倬勝助理教授。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
1969年蘇聯(lián)要扔原子彈,毛主席:你敢扔我國8億軍民就敢反擊

1969年蘇聯(lián)要扔原子彈,毛主席:你敢扔我國8億軍民就敢反擊

老范談史
2026-04-15 09:28:00
打了45天,伊朗終于發(fā)現(xiàn)最大敵人不是美國,不是以色列,而是他們

打了45天,伊朗終于發(fā)現(xiàn)最大敵人不是美國,不是以色列,而是他們

天天熱點見聞
2026-04-15 05:15:06
特朗普快要崩潰了!內(nèi)塔尼亞胡手握核彈:以色列叫囂重啟對伊打擊

特朗普快要崩潰了!內(nèi)塔尼亞胡手握核彈:以色列叫囂重啟對伊打擊

普覽
2026-04-15 21:30:56
范志毅任上海足協(xié)副主席,和上綜藝賺錢兩不誤,3婚與嬌妻很幸福

范志毅任上海足協(xié)副主席,和上綜藝賺錢兩不誤,3婚與嬌妻很幸福

君笙的拂兮
2026-04-14 22:57:41
機器人切除腫瘤不徹底,時隔18天二次手術(shù),兩年后患者去世;鑒定認(rèn)為醫(yī)院擔(dān)主責(zé)

機器人切除腫瘤不徹底,時隔18天二次手術(shù),兩年后患者去世;鑒定認(rèn)為醫(yī)院擔(dān)主責(zé)

大風(fēng)新聞
2026-04-15 13:32:16
18億大關(guān)失守!雙色球獎池持續(xù)走低,15億返獎線即將到來

18億大關(guān)失守!雙色球獎池持續(xù)走低,15億返獎線即將到來

好笑娛樂君每一天
2026-04-15 19:13:55
想走圓潤風(fēng),奈何長了張“知性臉”!

想走圓潤風(fēng),奈何長了張“知性臉”!

飛娛日記
2026-04-02 11:21:51
美霸權(quán)攪局能源,中國豈能袖手旁觀

美霸權(quán)攪局能源,中國豈能袖手旁觀

烽火瞭望者
2026-04-15 06:12:59
劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

老吳教育課堂
2026-04-14 07:44:56
NFC、FC、HPP……哪種才是100%真果汁?

NFC、FC、HPP……哪種才是100%真果汁?

混知
2026-03-24 17:07:26
心源性猝死的人越來越多?醫(yī)生強調(diào):寧可打打牌,建議別做這7事

心源性猝死的人越來越多?醫(yī)生強調(diào):寧可打打牌,建議別做這7事

醫(yī)學(xué)原創(chuàng)故事會
2026-03-29 23:50:13
別再傳“蒙古國防中國”了!南邊連草都不長,讓人怎么?。?>
    </a>
        <h3>
      <a href=別再傳“蒙古國防中國”了!南邊連草都不長,讓人怎么住? 起喜電影
2026-04-15 18:57:22
外交部:藏南地區(qū)是中國領(lǐng)土,中方從不承認(rèn)所謂“阿魯納恰爾邦”

外交部:藏南地區(qū)是中國領(lǐng)土,中方從不承認(rèn)所謂“阿魯納恰爾邦”

江西地名研究
2026-04-15 22:51:52
男子花20萬在小姐身上,聽到小姐和別人纏綿后,2011年將小姐殺死

男子花20萬在小姐身上,聽到小姐和別人纏綿后,2011年將小姐殺死

漢史趣聞
2026-04-13 14:28:43
不再搞形式!機關(guān)事業(yè)單位這些公務(wù)開支全部叫停

不再搞形式!機關(guān)事業(yè)單位這些公務(wù)開支全部叫停

王姐懶人家常菜
2026-04-15 14:06:32
邁阿密官宣換帥:41歲小馬哥辭職 曾率隊首奪美職聯(lián)冠軍 新帥公布

邁阿密官宣換帥:41歲小馬哥辭職 曾率隊首奪美職聯(lián)冠軍 新帥公布

我愛英超
2026-04-15 05:07:02
伊朗稱一艘貨輪成功突破美國封鎖,通過霍爾木茲海峽

伊朗稱一艘貨輪成功突破美國封鎖,通過霍爾木茲海峽

山河路口
2026-04-15 22:38:32
青澀的愛:那時候的我們,連牽手都要鼓起勇氣

青澀的愛:那時候的我們,連牽手都要鼓起勇氣

疾跑的小蝸牛
2026-04-15 20:43:41
越南人認(rèn)為:丟掉廣東、廣西,就像沒了大門,為此感嘆了千年

越南人認(rèn)為:丟掉廣東、廣西,就像沒了大門,為此感嘆了千年

慕名而來只為你
2026-04-15 10:48:03
海峽被封,特朗普給了中國兩條路,中方二話不說,馬上給俄發(fā)邀請

海峽被封,特朗普給了中國兩條路,中方二話不說,馬上給俄發(fā)邀請

數(shù)字化看世界
2026-04-15 13:23:28
2026-04-15 23:31:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12772文章數(shù) 142628關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團下鄉(xiāng)演出臺下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團下鄉(xiāng)演出臺下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

健康
藝術(shù)
教育
游戲
時尚

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

這山水,蕩滌胸中塵埃

教育要聞

千城百縣看中國|山東定陶:創(chuàng)意滿格大課間

任天堂第一方獨占IGN 7分:無法導(dǎo)入、分享也是抽象

赫本愛穿的傘裙,好優(yōu)雅!

無障礙瀏覽 進入關(guān)懷版