亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話鄧智航|以「龍蝦」為起點(diǎn),起底從單個(gè) Agent 到 Agentic Web 的安全重構(gòu)

0
分享至


安全問題不再局限模型,而是系統(tǒng)中的控制權(quán)之爭。

作者丨鄭佳美

編輯丨岑 峰

OpenClaw 的爆火,讓一個(gè)原本更多停留在技術(shù)圈內(nèi)部的變化,突然變得具象起來。

當(dāng)一個(gè) Agent 可以跨應(yīng)用執(zhí)行任務(wù)、調(diào)用工具、在幾乎沒有人工干預(yù)的情況下完成復(fù)雜流程時(shí),人們第一次直觀地看到:AI 正在從“生成內(nèi)容的工具”,轉(zhuǎn)變?yōu)椤皡⑴c行動(dòng)的主體”。也正是在這一刻,安全問題迅速被推到前臺(tái)。

但一個(gè)更值得注意的現(xiàn)象是,在幾乎所有關(guān)于 Agent 安全的討論中,問題的定義仍然高度集中在模型層面:輸入是否被注入、輸出是否越界、對(duì)齊是否失效。這種討論路徑本身并沒有錯(cuò),但它隱含著一個(gè)前提,即安全問題主要發(fā)生在“模型”這一單點(diǎn)之上。

問題在于,這個(gè)前提可能正在失效。當(dāng) Agent 不再只是響應(yīng)指令,而是持續(xù)接收來自不同來源的信息、在多組件結(jié)構(gòu)中做出決策、并通過工具鏈將決策轉(zhuǎn)化為現(xiàn)實(shí)動(dòng)作時(shí),“安全”所指向的對(duì)象,已經(jīng)不再是單一模型,而是一個(gè)由模型、記憶、工具、環(huán)境以及交互鏈路共同構(gòu)成的系統(tǒng)。

在這樣的系統(tǒng)中,風(fēng)險(xiǎn)不一定以“錯(cuò)誤輸出”的形式出現(xiàn),也不一定以“瞬時(shí)失控”的方式爆發(fā)。它可能表現(xiàn)為決策過程中的偏移、信息在鏈路中的傳遞與放大,甚至是跨組件、跨主體之間的相互影響。

這也意味著,Agent 安全的問題,正在從“是否安全”,轉(zhuǎn)向“如何被影響”。

在論文《From Secure Agentic AI to Secure Agentic Web》中,上海交通大學(xué)、上海創(chuàng)智學(xué)院張偉楠團(tuán)隊(duì)正是從這一轉(zhuǎn)變出發(fā),嘗試將 Agent 安全從模型層面的魯棒性問題,重新置于系統(tǒng)結(jié)構(gòu)與運(yùn)行機(jī)制之中進(jìn)行討論。

圍繞這一問題,AI 科技評(píng)論與論文一作鄧智航進(jìn)行了對(duì)話。下文在不改變原意的前提下,對(duì)訪談內(nèi)容進(jìn)行了整理與呈現(xiàn),試圖還原其對(duì)于 Agent 安全問題“從模型走向系統(tǒng)”的整體理解。


論文鏈接:https://arxiv.org/pdf/2603.01564

01


Agent 安全,被理解錯(cuò)了嗎?

AI 科技評(píng)論:最近 OpenClaw 的爆火,讓很多人開始關(guān)注 Agent 安全,但你會(huì)發(fā)現(xiàn)大家討論的重點(diǎn)幾乎都集中在 prompt injection、越獄這些問題上,你是怎么看待這種觀點(diǎn)的?

鄧智航:我認(rèn)為這其實(shí)是目前一個(gè)非常普遍的誤解。現(xiàn)在大多數(shù)人在談 Agent 安全的時(shí)候,還是停留在 prompt injection、越獄這些比較“表層”的問題上,本質(zhì)上仍然是在關(guān)注模型輸出這一層。

但實(shí)際上,Agent 已經(jīng)不再是一個(gè)只生成文本的系統(tǒng)了。過去的 chatbot,本質(zhì)上就是輸入一段文本、輸出一段文本,而現(xiàn)在的 Agent 會(huì)調(diào)用工具,會(huì)寫入長期記憶,還會(huì)持續(xù)和外部環(huán)境進(jìn)行交互。

在這種情況下,安全問題的重心必須發(fā)生轉(zhuǎn)變,也就是要從“模型會(huì)不會(huì)說話”,轉(zhuǎn)向“整個(gè)系統(tǒng)在開放環(huán)境中是否可控、可審計(jì)、可約束”。我認(rèn)為這是目前最重要的一個(gè)視角變化。

AI 科技評(píng)論:也就是說,它的風(fēng)險(xiǎn)已經(jīng)不只是“說錯(cuò)話”,而是會(huì)真正影響現(xiàn)實(shí)世界?

鄧智航:可以這么理解。因?yàn)?Agent 現(xiàn)在具備調(diào)用工具和操作外部系統(tǒng)的能力,它的行為已經(jīng)不再局限在生成內(nèi)容這一層,而是可以直接轉(zhuǎn)化為現(xiàn)實(shí)中的動(dòng)作。比如它可以刪除你的文件,可以泄露你的隱私,甚至可以在獲取到一些敏感信息之后,調(diào)用郵件系統(tǒng)自動(dòng)發(fā)送給攻擊者。所以現(xiàn)在的問題不只是“生成是否安全”,而是它在執(zhí)行層面是否安全,這個(gè)變化是非常本質(zhì)的。

AI 科技評(píng)論:如果必須選一個(gè)關(guān)鍵因素,你覺得這種變化是由什么驅(qū)動(dòng)的?很多人會(huì)說是工具調(diào)用。

鄧智航:工具調(diào)用確實(shí)是一個(gè)重要因素,但如果只能選一個(gè)更核心的點(diǎn),我認(rèn)為是 Agent 在開放環(huán)境中的自主行動(dòng)能力。工具調(diào)用本質(zhì)上只是能力的一個(gè)接口,它讓 Agent 可以做更多事情,但真正讓安全問題發(fā)生質(zhì)變的,是 Agent 開始在一個(gè)動(dòng)態(tài)、復(fù)雜,甚至帶有對(duì)抗性的環(huán)境中進(jìn)行感知、判斷和執(zhí)行。

比如網(wǎng)頁中的內(nèi)容、文檔中的信息、第三方服務(wù)返回的數(shù)據(jù),這些都會(huì)進(jìn)入 Agent 的決策流程,從而共同構(gòu)成一個(gè)更大的風(fēng)險(xiǎn)面。所以關(guān)鍵不只是“能不能調(diào)用工具”,而是“在什么環(huán)境中行動(dòng),以及如何行動(dòng)”。

AI 科技評(píng)論:在你們的論文中把威脅分成 prompt、environment、memory、toolchain 等不同類別,這種分類背后的共性是什么?

鄧智航:如果從攻擊者的角度來看,其實(shí)這些攻擊有一個(gè)非常統(tǒng)一的本質(zhì),那就是爭奪對(duì) Agent 的決策控制權(quán)。無論是 prompt 攻擊、環(huán)境注入、記憶投毒,還是工具鏈上的問題,它們表面上發(fā)生在不同模塊,但本質(zhì)上都是在影響 Agent 的理解能力和認(rèn)知過程。

所以安全問題的核心,并不是某個(gè)漏洞被觸發(fā),而是 Agent 在看似正常的情況下,被悄悄帶偏了。這種“控制權(quán)的轉(zhuǎn)移”,是我認(rèn)為最關(guān)鍵的共性。

AI 科技評(píng)論:你剛剛提到環(huán)境,那是不是可以理解為,外部世界本身就是 Agent 的輸入?

鄧智航:是的,這個(gè)理解是對(duì)的。對(duì)于人來說,網(wǎng)頁主要是用來閱讀和判斷信息的,但對(duì)于 Agent 來說,它通常不會(huì)像人一樣去做復(fù)雜判斷,而是會(huì)把網(wǎng)頁、文件以及工具返回的內(nèi)容直接作為輸入,用來影響它的任務(wù)規(guī)劃和行為決策。

所以從系統(tǒng)安全的角度來看,我們需要把整個(gè)外部環(huán)境都視為潛在的攻擊面,也就是說默認(rèn)它可能是帶有惡意意圖的,而不是默認(rèn)它是可信的。

AI 科技評(píng)論:如果有人認(rèn)為,通過 system prompt 和拒答機(jī)制,已經(jīng)可以解決大部分問題,你會(huì)怎么回應(yīng)?

鄧智航:我覺得這是遠(yuǎn)遠(yuǎn)不夠的。首先,system prompt 本身就可能被篡改或者被攻擊,其次,很多攻擊并不是通過用戶正面輸入進(jìn)入系統(tǒng)的,而是來自網(wǎng)頁內(nèi)容、工具返回,甚至是跨 Agent 的通信。

所以 system prompt 和拒答機(jī)制更多只是第一層護(hù)欄,它們很重要,但無法覆蓋整個(gè) Agent 系統(tǒng)的攻擊面。真正可靠的安全方案,需要把工具權(quán)限控制、運(yùn)行時(shí)監(jiān)控、協(xié)議級(jí)校驗(yàn)以及持續(xù)的紅隊(duì)測試結(jié)合起來,從而形成一個(gè)更完整的安全體系,本質(zhì)上這是一個(gè)生態(tài)級(jí)的問題。

AI 科技評(píng)論:在你們的論文中把 toolchain 風(fēng)險(xiǎn)類比為供應(yīng)鏈問題,這個(gè)你會(huì)怎么解釋?

鄧智航:這個(gè)類比是比較直觀的。風(fēng)險(xiǎn)不一定來自模型本身,也可能來自它依賴的第三方工具、API 或插件。比如一個(gè)被污染的工具提供方,一個(gè)返回結(jié)果不可靠的接口,或者多個(gè)看起來安全的工具在組合調(diào)用時(shí)產(chǎn)生聯(lián)動(dòng),這些都可能導(dǎo)致嚴(yán)重的后果。所以在 Agent 系統(tǒng)中,工具鏈其實(shí)就相當(dāng)于一個(gè)供應(yīng)鏈,而安全問題也就變成了供應(yīng)鏈安全問題。

AI 科技評(píng)論:那像 MCP 這種統(tǒng)一工具調(diào)用方式,一方面提升能力,一方面是否也在放大風(fēng)險(xiǎn)?

鄧智航:是的,這種雙重性是非常明顯的。一方面,MCP 提供了統(tǒng)一的上下文和工具交互方式,使得不同系統(tǒng)之間可以更方便地協(xié)作,這確實(shí)大幅提升了 Agent 的能力。但另一方面,它作為一個(gè)統(tǒng)一入口,也會(huì)把權(quán)限問題、信任問題以及潛在的污染風(fēng)險(xiǎn)集中放大。

所以關(guān)鍵不在于要不要使用 MCP,而在于在使用這些能力的同時(shí),是否同步設(shè)計(jì)了相應(yīng)的安全機(jī)制。本質(zhì)上,能力越強(qiáng),對(duì)應(yīng)的風(fēng)險(xiǎn)面就越大。

AI 科技評(píng)論:現(xiàn)在圍繞 Agent 安全的討論很多,你覺得哪些風(fēng)險(xiǎn)被高估了,哪些被低估了?

鄧智航:被高估的,主要是那些容易被發(fā)現(xiàn)的風(fēng)險(xiǎn),比如單輪越獄或者即時(shí)攻破,這類問題因?yàn)楸容^直觀,所以更容易被關(guān)注。但被低估的,是一些更接近真實(shí)部署場景的問題,比如長期記憶污染、Agent 之間的傳播效應(yīng),以及行為偏移。這些問題通常不會(huì)立刻爆發(fā),也不容易被察覺,但會(huì)在長期過程中持續(xù)影響 Agent 的行為。

一個(gè)更“聰明”的攻擊,不會(huì)讓 Agent 當(dāng)場失控,而是會(huì)慢慢改變它的偏好、信任對(duì)象和決策傾向,讓它在很多看似正常的決策中逐漸偏移。我認(rèn)為這種風(fēng)險(xiǎn)是更值得警惕的。

02


問題,不再發(fā)生在一個(gè) Agent 上

AI 科技評(píng)論:如果 Agent 之間形成網(wǎng)絡(luò),會(huì)帶來什么新的變化?

鄧智航:一個(gè)很重要的變化是,我們原來在互聯(lián)網(wǎng)中有一個(gè)默認(rèn)前提,就是請(qǐng)求的另一端大概率是人,很多信任關(guān)系是建立在這個(gè)隱含假設(shè)之上的。但在 Agentic Web 中,這個(gè)前提被打破了,因?yàn)檎?qǐng)求很可能來自另一個(gè) Agent,甚至是多層 Agent 的委托和自動(dòng)決策。

這就意味著,原來依賴常識(shí)建立的信任關(guān)系已經(jīng)不成立了,必須轉(zhuǎn)變?yōu)轱@式表達(dá),并且需要具備可驗(yàn)證、可審計(jì)和可追蹤的能力。

AI 科技評(píng)論:這是不是也意味著,一旦出問題,會(huì)很難追溯責(zé)任?

鄧智航:是的,這是一個(gè)非常現(xiàn)實(shí)的問題。如果是人說錯(cuò)話,我們可以直接找到這個(gè)人,但如果是 Agent 出現(xiàn)問題,我們很難判斷它是自己判斷錯(cuò)誤,還是被其他 Agent 誤導(dǎo),或者是某個(gè)中間環(huán)節(jié)被污染。

在這種情況下,就需要一整套審計(jì)和追溯機(jī)制,否則就會(huì)變成需要一層一層往上追,這個(gè)過程是非常困難的,有點(diǎn)類似于追查資金來源的鏈條。

AI 科技評(píng)論:那會(huì)不會(huì)出現(xiàn)一種攻擊,不是立刻出問題,而是長期潛伏?

鄧智航:我認(rèn)為這種情況是非常可能的,而且概率很高。一個(gè)更成熟的攻擊方式,不會(huì)馬上制造一個(gè)可以被發(fā)現(xiàn)的事故,而是會(huì)悄悄改變 Agent 的偏好、信任對(duì)象以及行為傾向,讓它在很多看似正常的微小決策中持續(xù)偏移。相比那種瞬間失控,這種長期的行為漂移其實(shí)更危險(xiǎn),因?yàn)樗[蔽,也更難被檢測。

AI 科技評(píng)論:那能力和安全之間的矛盾應(yīng)該怎么處理?

鄧智航:這是一個(gè)不可避免的張力。Agent 的能力越強(qiáng),它可以訪問的上下文越多、可以調(diào)用的工具越多,自主性也越高,但相應(yīng)的風(fēng)險(xiǎn)也會(huì)增加。如果把權(quán)限收緊,它的能力又會(huì)受到限制。

所以問題不在于能不能消除這種張力,而在于能不能把它設(shè)計(jì)成一個(gè)可控的系統(tǒng),比如通過分級(jí)授權(quán)、實(shí)時(shí)監(jiān)測以及事后追溯等機(jī)制,把這種張力轉(zhuǎn)化為一個(gè)可以被管理的狀態(tài)。

AI 科技評(píng)論:你覺得未來兩三年,Agent 安全的分水嶺會(huì)出現(xiàn)在哪里?

鄧智航:我認(rèn)為關(guān)鍵在于,整個(gè)行業(yè)能不能把身份、授權(quán)、溯源以及運(yùn)行時(shí)治理這些能力真正做成基礎(chǔ)設(shè)施。如果這些基礎(chǔ)設(shè)施建立起來,Agent 才有可能從“能用但危險(xiǎn)”,走向“可擴(kuò)展且可治理”。

如果只是依賴 prompt 工程或者局部的補(bǔ)丁式防御,一旦 Agent 大規(guī)模進(jìn)入開放網(wǎng)絡(luò),這種方式是無法支撐的。

AI 科技評(píng)論:那這種“安全基礎(chǔ)設(shè)施”,你覺得可能會(huì)以什么形式出現(xiàn)?

鄧智航:具體形式還需要行業(yè)去探索,但可以做一個(gè)類比。兩年前沒有 MCP 的時(shí)候,大家的工具調(diào)用方式是完全不統(tǒng)一的,不同系統(tǒng)之間也很難互通。但 MCP 出現(xiàn)之后,通過統(tǒng)一協(xié)議,工具調(diào)用這一層被標(biāo)準(zhǔn)化,Agent 的能力也因此提升。

未來的安全機(jī)制,也有可能以類似“協(xié)議”的形式出現(xiàn),通過統(tǒng)一的安全協(xié)議,讓整個(gè) Agent 生態(tài)在運(yùn)行過程中更安全。


未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
復(fù)雜的黎巴嫩,走投無路的真主黨

復(fù)雜的黎巴嫩,走投無路的真主黨

寰宇大觀察
2026-04-17 17:36:11
申花3:1鐵人,黃健翔犀利點(diǎn)評(píng):外援太絲滑,卻揪出門將最大隱患

申花3:1鐵人,黃健翔犀利點(diǎn)評(píng):外援太絲滑,卻揪出門將最大隱患

晚霧空青
2026-04-19 02:32:45
衛(wèi)冕冠軍泰州被徐州3:0血洗,蘇北五虎專治各種不服!

衛(wèi)冕冠軍泰州被徐州3:0血洗,蘇北五虎專治各種不服!

錫望
2026-04-18 22:24:06
濟(jì)南19日傍晚將迎強(qiáng)對(duì)流天氣!小到中雨伴有雷電,降溫8℃~10℃,局部陣風(fēng)10級(jí)

濟(jì)南19日傍晚將迎強(qiáng)對(duì)流天氣!小到中雨伴有雷電,降溫8℃~10℃,局部陣風(fēng)10級(jí)

魯中晨報(bào)
2026-04-18 18:16:10
蘇超一家獨(dú)大,多少地方文旅成了陪跑?

蘇超一家獨(dú)大,多少地方文旅成了陪跑?

環(huán)球旅訊
2026-04-17 08:08:52
老婆新婚夜不讓碰,我心冷上了高原,一年后她抱著孩子來探親

老婆新婚夜不讓碰,我心冷上了高原,一年后她抱著孩子來探親

紅豆講堂
2026-02-11 17:55:07
還能活多久,看體重就知?醫(yī)生強(qiáng)調(diào):上了年紀(jì)的人,體重這些剛好

還能活多久,看體重就知?醫(yī)生強(qiáng)調(diào):上了年紀(jì)的人,體重這些剛好

醫(yī)學(xué)科普匯
2026-04-18 17:05:51
胡錫進(jìn)給沃爾沃汽車做廣告,評(píng)論區(qū)全翻車了……

胡錫進(jìn)給沃爾沃汽車做廣告,評(píng)論區(qū)全翻車了……

麥杰遜
2026-04-17 11:51:26
震驚!“首位背刺張雪峰之人”,大鵬公開貶低前東家、低價(jià)挖資源

震驚!“首位背刺張雪峰之人”,大鵬公開貶低前東家、低價(jià)挖資源

火山詩話
2026-04-16 06:02:23
太慘了!成都這個(gè)板塊又跌了20%!

太慘了!成都這個(gè)板塊又跌了20%!

樓市滅霸
2026-04-18 16:45:57
女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
海軍預(yù)備役殺妻藏尸冰柜,逃亡兩月海外落網(wǎng)

海軍預(yù)備役殺妻藏尸冰柜,逃亡兩月海外落網(wǎng)

追星雷達(dá)站
2026-04-17 09:26:20
許家印認(rèn)罪,人民日?qǐng)?bào)稱呼變11字釋放不尋常信號(hào)

許家印認(rèn)罪,人民日?qǐng)?bào)稱呼變11字釋放不尋常信號(hào)

未來已來風(fēng)云變幻
2026-04-19 04:32:30
八國聯(lián)軍中,有七國主動(dòng)退還賠款,唯獨(dú)一國分文不退,是哪個(gè)?

八國聯(lián)軍中,有七國主動(dòng)退還賠款,唯獨(dú)一國分文不退,是哪個(gè)?

千秋文化
2025-03-28 10:37:53
高市要哭了:花了30年才當(dāng)上首相,卻連打4通電話,要求伊朗放人

高市要哭了:花了30年才當(dāng)上首相,卻連打4通電話,要求伊朗放人

云舟史策
2026-04-19 07:25:45
民企貪腐,參照公職入罪標(biāo)準(zhǔn),有何深意?

民企貪腐,參照公職入罪標(biāo)準(zhǔn),有何深意?

中國新聞周刊
2026-04-18 12:07:25
1-0!卡帥專打強(qiáng)隊(duì)+曼聯(lián)領(lǐng)先切爾西10分,熱刺15輪不勝保級(jí)難了

1-0!卡帥專打強(qiáng)隊(duì)+曼聯(lián)領(lǐng)先切爾西10分,熱刺15輪不勝保級(jí)難了

體育知多少
2026-04-19 06:33:19
照母山近十年首個(gè)豪宅開盤,兩小時(shí)宣告售罄?現(xiàn)場驚爆大瓜

照母山近十年首個(gè)豪宅開盤,兩小時(shí)宣告售罄?現(xiàn)場驚爆大瓜

小樹聊房
2026-04-18 21:54:43
伊能靜長文控訴!十年沒二人世界,她抑郁是秦昊缺位還是自作自受

伊能靜長文控訴!十年沒二人世界,她抑郁是秦昊缺位還是自作自受

郭蛹包工頭
2026-04-17 14:14:44
卡里克治下曼聯(lián)近12場英超8勝,與本賽季前21場贏球場次持平

卡里克治下曼聯(lián)近12場英超8勝,與本賽季前21場贏球場次持平

懂球帝
2026-04-19 07:27:03
2026-04-19 08:19:00
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7198文章數(shù) 20744關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

媒體:特朗普對(duì)伊朗發(fā)動(dòng)攻擊 美國遭遇四大挫敗

頭條要聞

媒體:特朗普對(duì)伊朗發(fā)動(dòng)攻擊 美國遭遇四大挫敗

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬元起

態(tài)度原創(chuàng)

房產(chǎn)
親子
藝術(shù)
本地
時(shí)尚

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!海口樓市,突然殺入神秘房企!

親子要聞

老公終于夢想成真了!幫忙給寶寶起小名唄

藝術(shù)要聞

夜色下的歐洲

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

選對(duì)發(fā)型,真的能少走很多變美彎路

無障礙瀏覽 進(jìn)入關(guān)懷版