无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

大模型 Agent 安全問題,需要認真管管了

0
分享至

這兩天 AWS 和 Vercel 幾乎前后腳開源了兩個項目,一個叫 Rex(github.com/trusted-remote-execution),一個叫 deepsec(github.com/vercel-labs/deepsec)

剛開始我以為這倆沒啥關系,仔細看完發現它們是同一道題的正反兩面:

  • Rex約束 Agent 能干啥——你給它寫 Cedar 策略,越界一律拒絕

  • deepsec Agent 當安全研究員——專門去你代碼庫里挖那些躺了幾年的漏洞

一個負責"別讓 Agent 亂來",一個負責"讓 Agent 拼命找事",今天一起聊

一、AWS Rex:給 AI 腳本套上策略韁繩 它解決啥問題

老 DevOps 同學都懂一個無解的痛:腳本拿到了執行環境的全部權限

一個本來只是想"讀讀日志"的腳本,能力上和"刪庫跑路"的腳本是一模一樣的——靠的是寫腳本的人有良心、Reviewer 沒看走眼、CI 配得仔細

人類還能扛住,Agent 時代直接崩塌

? 當 Agent 自己生成、自己執行腳本時,沒有人 review 每一次系統調用——代碼評審、審批流、白名單這些防護,全在"代碼運行時才生成"這一前提下失效

Rex 的思路簡單粗暴:腳本說要做什么,策略說什么被允許,每個操作都先查策略再執行

用一張流程文字圖描述:

Rhai 腳本 ──? Rex SDK 操作(read/write/open…)──? Cedar 策略檢查

通過 ─────? 執行系統調用
拒絕 ─────? ACCESS_DENIED_EXCEPTION
技術選型很有意思

組件

選了啥

為啥

腳本語言

Rhai

輕量級嵌入式語言, 零內置系統訪問

策略引擎

Cedar

AWS 自家的策略語言,已經在 IAM/Verified Permissions 里跑了

Runtime

rex-runner(Rust)

唯一能碰主機的入口

最關鍵的是 Rhai 這個選擇——它本身根本沒有 read/write/exec 這些系統調用,所有能摸到主機的能力都得通過 Rex 提供的 SDK,而 SDK 的每一次調用都先過 Cedar 策略

這就把"腳本"和"權限"徹底解耦了:腳本一字不改,換個策略就換一套權限

Agent 撞墻了會怎樣

這是我覺得 Rex 最妙的地方:

? 如果 Agent 因為幻覺、提示詞注入或者過度發揮,生成了一個超出策略的腳本——它會收到一個明確的 ACCESS_DENIED_EXCEPTION,而不是造成意料之外的副作用 Agent 可以觀察到這個錯誤、推理、然后調整

換句話說,Rex 不是把 Agent 關進沙箱(那種思路約束的是 Agent 本身),而是約束 Agent 能對宿主機做什么——主權在服務 owner 手上,不管 Agent 怎么折騰,硬邊界守得住

5 分鐘跑通 Demo

按官方教程,一行 Cargo 裝好:

cargo install rex-runner

寫一個策略文件,明確只允許 openread

permit(
principal,
action in [
file_system::Action::"open",
file_system::Action::"read",


// 取消注釋才允許 write:
//file_system::Action::"create",
//file_system::Action::"write",
],
resource
);

寫一個故意"越權"的腳本——先寫文件再讀:

write("/tmp/hello.txt", "Hello from Rex!");
cat("/tmp/hello.txt")

跑:

rex-runner \
--script-file script.rhai \
--policy-file policy.cedar \
--output-format human

直接報錯:

error: Permission denied:
file_system::Action::"create" on /tmp/hello.txt

createwrite 在策略里取消注釋再跑,腳本一字不改,這回就能正常輸出 Hello from Rex!

? 腳本沒變,只改了策略——這就是 Rex 想傳遞的核心

文檔里還提到可以和 IAM、SSM 配合,把這套策略接到 AWS 已有的權限體系里,企業級落地的鏈路是通的

二、Vercel deepsec:讓 Agent 自己去挖漏洞 它解決啥問題

聊完防守,聊進攻

deepsec 的定位是 "agent-powered vulnerability scanner"——不是 SAST、不是 DAST,是讓 Claude 和 Codex 這兩個最強的 coding agent 真的去你代碼里翻

按官方原話:

? 配置上用最強模型 + 最大思考預算(Opus 4.7 max effort + GPT-5.5 xhigh reasoning),掃一個大倉庫可能花幾千甚至上萬美元

聽起來燒錢?是真燒錢,但 Vercel 的用戶反饋值這價:

? James Perkins, Unkey CEO:deepsec 的掃描是我們用過最徹底的,問題最多,真陽性率也好 Steven Tey, dub.co Founder:我們收到過太多自動化安全報告,大多數都不可執行——deepsec 是第一個能挖出"我們真希望安全工程師能 flag 出來"的問題的工具
deepsec 工作臺 5 步流水線

deepsec 把"讓 Agent 找漏洞"拆得很工程化:

步驟

干啥

Scan

先用 regex 全倉掃一遍,定位安全敏感的文件

Investigate

Agent 對每個候選文件做深度調查——追數據流、查緩解措施、給出嚴重級

Revalidate

第二個 Agent 對發現做交叉驗證,去假陽性、重新分級

Enrich

用 Git 元數據找到對應該修復的人

Export

把發現導出成可以變工單的指令格式(人類和 Agent 都能用)

這套流程里我最欣賞的是 Revalidate——單 Agent 給的 finding 信噪比注定不會高,再過一遍專門做"挑刺"的 Agent,假陽性率官方說是 10–20%

10–20% 的假陽性率是個什么概念?SonarQube、CodeQL 這類傳統 SAST 工具能做到 20–30% 已經算可以接受,deepsec 在面對"非確定性 LLM"的前提下還能壓到這個水平,工程上是花了功夫的

跑一遍要錢 + 要算力

# 在你倉庫根目錄
npx deepsec init
cd .deepsec
pnpm install

然后官方建議你讓你自己的 coding agent 去自舉——給 Claude/Codex 喂這個 prompt:

? 讀 .deepsec/node_modules/deepsec/SKILL.md 理解工具,然后讀 .deepsec/data/ /SETUP.md 跟著做:掃一下 README、AGENTS.md/CLAUDE.md 和幾個有代表性的代碼文件,把 INFO.md 各個章節填上 控制在 50–100 行——抓 3–5 個例子就夠,別窮舉

填完跑:

pnpm deepsec scan
pnpm deepsec process
pnpm deepsec revalidate # 可選,能壓假陽性
pnpm deepsec export --format md-dir --out ./findings

大倉庫單機要掃好幾天,于是 deepsec 還提供了一個殺手锏——散到 Vercel Sandbox 上并發跑

pnpm deepsec sandbox process --project-id my-app --sandboxes 10 --concurrency 4

按 Vercel 自己的說法,他們掃自家代碼經常拉到 1000+ 并發 sandbox,幾天的活兒壓成幾小時

不需要"安全特供模型"

很多人以為安全任務必須用 Anthropic / OpenAI 那種"cyber 微調版"——deepsec 實測下來,原版的 Opus 4.7 和 GPT-5.5 完全夠用,工具內置了一個 classifier 檢測拒答,遇到拒絕會自動重試

這個細節挺重要:意味著普通用戶用現成訂閱就能跑,不用走特殊審批

三、放一起看:Agent × Security 的攻守同源

我把這兩個項目放一起聊不是湊數,它們其實在回答同一個問題:

? 當 AI Agent 真的在生產環境里寫代碼、跑腳本、改系統時,安全模型該怎么變?

AWS Rex

Vercel deepsec

角色

防守

進攻

誰是主體

Agent 是被約束方

Agent 是研究員

信任假設

"Agent 會出錯/被注入"

"Agent 比規則更會找漏洞"

落地形態

Rust runtime + Cedar 策略

Coding agent + 5 步流水線

關鍵技術押注

策略與代碼解耦

用最強模型 + 多 Agent 交叉驗證

注意它們都不約而同地承認了一個前提:單個 Agent 不可信

  • Rex 的回答:那就不讓你越界,每個操作都查

  • deepsec 的回答:那就讓兩個 Agent 互相挑刺,把假陽性壓下去

這種"不相信單點 Agent,但相信 Agent + 工程化約束"的思路,我覺得是 2026 年 Agent 落地最成熟的姿態

總結

  • Rex :值得每一個準備讓 Agent 碰生產環境的團隊認真試試,Cedar + Rhai 這套配置確實優雅;缺點是目前操作集還偏基礎(文件系統等),SDK 擴展看后續社區

  • deepsec :要錢要算力,但 對中大型代碼庫是真有用 ——尤其是 auth、數據層、后端服務這種安全面大的場景,跑一次幾千美元換出 5 個真陽性 critical 漏洞,怎么算都劃算

  • 共同啟示 :未來一年 Agent 安全工具會爆發,"約束 Agent"和"使用 Agent 當安全員"會同時成為標配

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“我朝思暮想要住在女婿旁邊”,杭州72歲丈母娘選房現場落淚:女兒去世后他一直照顧我,別人家兒子都沒這么好;女婿:若再婚也會帶著她

“我朝思暮想要住在女婿旁邊”,杭州72歲丈母娘選房現場落淚:女兒去世后他一直照顧我,別人家兒子都沒這么好;女婿:若再婚也會帶著她

都市快報橙柿互動
2026-06-17 22:17:34
上海這天,林志玲扁頭油膩,王玉雯驚艷,孫儷穿對衣服狀態回春

上海這天,林志玲扁頭油膩,王玉雯驚艷,孫儷穿對衣服狀態回春

一個小豹子
2026-06-16 20:23:20
陳紅曬全家福,兒子兒媳顏值高很般配,自曝前夫一直跟著她想復婚

陳紅曬全家福,兒子兒媳顏值高很般配,自曝前夫一直跟著她想復婚

喜歡歷史的阿繁
2026-06-18 02:13:58
還是來了,為了制裁中國,特朗普開出天價籌碼!普京這次真心動了

還是來了,為了制裁中國,特朗普開出天價籌碼!普京這次真心動了

史料布籍
2026-06-17 10:27:47
正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

健康科普365
2026-05-09 21:05:04
有梅西勝率76%,沒他75%!名記直言:梅西是球王,但阿根廷走不遠

有梅西勝率76%,沒他75%!名記直言:梅西是球王,但阿根廷走不遠

圣西羅的太陽
2026-06-17 12:07:38
在美菲壓力下,中方已撤出在黃巖島安裝的所謂設施?外交部:敦促有關國家立即停止造謠污蔑

在美菲壓力下,中方已撤出在黃巖島安裝的所謂設施?外交部:敦促有關國家立即停止造謠污蔑

每日經濟新聞
2026-06-17 15:58:49
20萬家公司倒閉,欠薪暴漲94%,克里姆林宮嘴里的“穩中向好”?

20萬家公司倒閉,欠薪暴漲94%,克里姆林宮嘴里的“穩中向好”?

戧詞奪理
2026-06-17 16:00:17
離開東方甄選活不下去?曾經跟著董宇輝的明明如今帶貨榜直接反超

離開東方甄選活不下去?曾經跟著董宇輝的明明如今帶貨榜直接反超

情感大頭說說
2026-06-18 01:10:50
3-2!3-0!世聯賽:有驚無險,中國女排3:2逆轉德國女排

3-2!3-0!世聯賽:有驚無險,中國女排3:2逆轉德國女排

寶哥精彩賽事
2026-06-17 21:49:22
穆勒曬和梅西的合照:這家伙是goat

穆勒曬和梅西的合照:這家伙是goat

懂球帝
2026-06-17 11:44:39
烏軍在多戰場取得重大突破,俄軍節節敗退。

烏軍在多戰場取得重大突破,俄軍節節敗退。

世界探索發現
2026-04-22 01:08:43
特朗普罵奧巴馬“蠢貨”,《觀點》主持人群嘲:你的協議更爛?

特朗普罵奧巴馬“蠢貨”,《觀點》主持人群嘲:你的協議更爛?

追星雷達站
2026-06-18 01:00:22
你在無意中發現別人什么秘密?網友爆料,電視劇都不敢這樣演

你在無意中發現別人什么秘密?網友爆料,電視劇都不敢這樣演

夜深愛雜談
2026-03-16 22:21:03
賭王三太陳婉珍究竟有多美?一組最全的老照片,帶你了解真正三太

賭王三太陳婉珍究竟有多美?一組最全的老照片,帶你了解真正三太

夢醉為紅顏一笑
2026-06-12 20:44:29
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的

明天后天大后天
2026-06-17 04:42:38
佛山徹底失守!廣東第三城易主

佛山徹底失守!廣東第三城易主

洞見報告
2026-05-02 18:55:22
特朗普突然表態:以色列不用停火,但必須"保持分寸"

特朗普突然表態:以色列不用停火,但必須"保持分寸"

桂系007
2026-06-17 23:50:23
官方:B席加盟皇馬,雙方簽約至2028年

官方:B席加盟皇馬,雙方簽約至2028年

懂球帝
2026-06-17 17:23:22
再訪蔡磊:每天工作12小時,只有死亡才能讓我停下

再訪蔡磊:每天工作12小時,只有死亡才能讓我停下

一條
2026-06-17 11:25:07
2026-06-18 04:35:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3435文章數 11165關注度
往期回顧 全部

科技要聞

馬斯克好友長文:他最可怕的,是這套方法論

頭條要聞

C羅啞火!葡萄牙1-1爆冷 送民主剛果隊史世界杯首分

頭條要聞

C羅啞火!葡萄牙1-1爆冷 送民主剛果隊史世界杯首分

體育要聞

梅西帽子戲法:紀錄厚重,球王輕盈

娛樂要聞

陳紅一反常態保持沉默

財經要聞

拉加德警告:AI可能引爆下一場金融危機

汽車要聞

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車!

態度原創

本地
旅游
游戲
公開課
軍事航空

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當老板

旅游要聞

1800余場端午活動打造城市游樂園

終于又有好游戲玩啦!這10款獨立游戲新作創意拉滿,強推入庫!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美被指拒絕以色列看美伊諒解備忘錄

無障礙瀏覽 進入關懷版