![]()
新智元報道
![]()
【新智元導(dǎo)讀】Anthropic紅隊負(fù)責(zé)人發(fā)文稱:Mythos已把「N天漏洞」壓縮成N小時。僅需數(shù)小時與幾千美元,系統(tǒng)安全補丁竟被AI逆向成致命攻擊武器,傳統(tǒng)網(wǎng)絡(luò)防線瞬間崩塌了!
就在剛剛,Anthorpic又拋出一個轟動整個網(wǎng)絡(luò)安全界的消息。
紅隊負(fù)責(zé)人Logan Graham在X上正式宣布:Claude Mythos Preview在自動化開發(fā)「N日漏洞」方面取得了突破性飛躍。
以前,漏洞武器化需要頂級黑客耗費數(shù)周;而在Mythos面前,這個時間被無情地壓縮到了幾個小時,成本僅需數(shù)千美元!
![]()
網(wǎng)絡(luò)安全,正在從「N日威脅」變成令人窒息的「N小時威脅」。
想象一下,微軟或者火狐剛剛發(fā)布了一個安全補丁,你的電腦還沒來得及重啟更新。
就在這短短幾個小時里,一個躲在暗處的AI,已經(jīng)通過分析這個補丁,逆向推導(dǎo)出致命的漏洞攻擊武器,并成功獲取了你電腦系統(tǒng)的最高控制權(quán)。
![]()
這就是人類現(xiàn)在要面對的現(xiàn)實。
![]()
補丁,居然成為黑客的藏寶圖
首先,我們要了解一個網(wǎng)安界的基礎(chǔ)博弈:零日漏洞(Zero-day)與 N日漏洞(N-day)。
過去幾個月里,科技媒體的聚光燈大多在AI尋找「零日漏洞」的能力上。
零日漏洞,是一種軟件開發(fā)者尚不知曉的漏洞。
然而事實上,現(xiàn)實世界中絕大多數(shù)的破壞,都源于「N日漏洞」,也就是那些已經(jīng)公開披露,甚至已經(jīng)發(fā)布了補丁,但尚未在所有設(shè)備上完成修復(fù)的漏洞。
從某種意義上說,N日漏洞比零日漏洞更危險。
原因就在于,補丁本身就是一張通往漏洞的藏寶圖。
在黑客圈,這被稱為「補丁比對」。
當(dāng)軟件供應(yīng)商發(fā)布安全更新時,攻擊者會立刻下載新舊版本的源代碼或二進(jìn)制文件進(jìn)行對比。
通過找出「代碼改了哪里」,他們就能精準(zhǔn)定位原本存在的安全缺陷,并逆向工程出漏洞的觸發(fā)機制。
因為逆向過程所需的專家級技術(shù)極度稀缺,這就為防守方爭取了寶貴的窗口期,讓他們有時間把更新推送到全球設(shè)備上。
2017年,震驚全球的WannaCry勒索軟件,是在微軟發(fā)布MS17-010補丁后的第59天才爆發(fā)的。
2023年的Citrix Bleed漏洞,公開的漏洞利用代碼花費了大約兩周時間才出現(xiàn)。
根據(jù)Mandiant在2020年的分析,在25個重大漏洞中,有16個需要一個月或更長時間才能被武器化。
然而,隨著Mythos Preview的入局,這個曾經(jīng)保護(hù)著全球千萬企業(yè)的「時間壁壘」,轟然倒塌了!
火狐瀏覽器淪陷,被AI無情碾壓
為了測試大模型究竟能把「N日漏洞」的開發(fā)提升到什么程度,Winnie Xiao, Tim Abbott等Anthropic的研究員們首先選擇了Mozilla的Firefox瀏覽器。
為什么選火狐?因為它是防守方的「最佳防守范例」。
![]()
火狐會自動在后臺下載修復(fù)程序,用戶只需重啟瀏覽器即可完成更新。Mozilla甚至將小版本的更新頻率從每月縮短到了每周。
在Anthropic研究的補丁中,漏洞從中位數(shù)的發(fā)布到修復(fù)僅有19天——在企業(yè)界,這已經(jīng)是「光速」了。
但Mythos Preview用實力證明:在絕對的AI算力面前,19天太長了!
![]()
實驗設(shè)定:極其苛刻的沙盒環(huán)境
研究團(tuán)隊選擇了火狐148和149版本中的18個SpiderMonkey安全補丁。這些火狐的JavaScript引擎,是現(xiàn)實中瀏覽器漏洞利用最常見的入口。
這些漏洞在源代碼庫中已公開至少90天。
各種大模型被關(guān)在一個Linux容器里,沒有互聯(lián)網(wǎng)連接,只有命令行、文本編輯器、補丁的公開差異代碼(去除了測試代碼),以及漏洞修復(fù)前后的兩個構(gòu)建版本。
它拿不到任何漏洞建議文本或重現(xiàn)代碼。
可以說就是「開局一張圖,內(nèi)容全靠編」,完全是地獄難度。
第一關(guān):讓系統(tǒng)崩潰(PoC開發(fā))
第一步是開發(fā)「概念驗證」。模型需要寫出一段代碼,證明它能精準(zhǔn)觸發(fā)這個漏洞導(dǎo)致系統(tǒng)崩潰,而不是因為其他隨機原因崩潰。
測試結(jié)果令人咋舌: 研究團(tuán)隊對比了從Opus 4.5到Opus 4.8,再到Mythos Preview的進(jìn)化曲線。
![]()
舊模型Opus 4.5和4.8的成功率在2到11個之間。
Mythos Preview在18個漏洞中,成功搞定了14個!
它的速度更是降維打擊: Mythos Preview產(chǎn)出第一個有效PoC只用了12分鐘!
在40分鐘內(nèi),它就產(chǎn)出了13個PoC,耗時僅為Opus 4.8完成11個PoC的一半。完成所有14個PoC的總時間,僅僅只有大約3個小時。
在穩(wěn)定性測試中,Mythos Preview有7個漏洞達(dá)到了100%的成功率,而Opus 4.6和4.8只有1個漏洞能做到。
第二關(guān):致命的完全利用
僅僅讓瀏覽器崩潰是不夠的,真正的黑客需要的是「執(zhí)行任意代碼」。
在這一關(guān),模型必須利用崩潰,繞過沙盒,去讀取一個系統(tǒng)深處、原本絕對無法訪問的隨機機密文件。
這正是Mythos Preview真正展現(xiàn)出「怪物級」?jié)摿Φ牡胤健?/p>
![]()
Opus 4.8 勉強做出了 2 個。
Opus 4.6 和 Sonnet 4.6 各做出 1 個。
Mythos Preview?它自主開發(fā)出了 8 個完全可用的遠(yuǎn)程代碼執(zhí)行漏洞!
第一個完全可用的漏洞武器,它只用了不到1個小時就寫出來了。完成全部8個,總耗時約12小時。
對比一下人類的節(jié)奏:Mozilla發(fā)布補丁后的1個小時內(nèi),AI已經(jīng)做出了可以直接攻擊未升級用戶的武器,而此時距離修復(fù)版火狐148正式推送到用戶手中,還有漫長的18天!
![]()
微軟內(nèi)核防御崩潰
從藍(lán)屏到系統(tǒng)霸主
如果說攻破開源的火狐瀏覽器還算是有跡可循(畢竟有源代碼可以對比),那么接下來Mythos Preview對微軟Windows操作系統(tǒng)的攻擊,則堪稱網(wǎng)絡(luò)安全史上的「恐怖故事」。
閉源軟件沒有源代碼。
攻擊者只能面對晦澀難懂的編譯后二進(jìn)制文件,所有對人類有用的變量名、類型、數(shù)據(jù)結(jié)構(gòu)統(tǒng)統(tǒng)被抹除了。
![]()
實驗設(shè)定——無源閉源的極致挑戰(zhàn)
研究團(tuán)隊選取了2026年1月至2月期間的21個Windows內(nèi)核漏洞,全部超出了測試模型的知識截止日期)。
這些都是本地提權(quán)漏洞——黑客利用它們可以將一個普通低權(quán)限用戶,直接提升為擁有系統(tǒng)生殺大權(quán)的「SYSTEM」最高權(quán)限。
Agent要面對的,是一臺運行著易受攻擊版本的Windows Server 2025虛擬機。它被剝奪了網(wǎng)絡(luò)訪問權(quán)限,身份只是一個低權(quán)限用戶。
它擁有的工具只有:
漏洞修復(fù)前后的二進(jìn)制文件
公開的調(diào)試符號(僅映射函數(shù)名和地址)
通過Ghidra反編譯出來的偽代碼
通過Ghidriff生成的函數(shù)級差異對比
微軟官方極其簡短的漏洞通告
面對這堆如同天書的二進(jìn)制文件,AI的表現(xiàn)如何?
在觸發(fā)藍(lán)屏死機(BSOD)上, Sonnet 4.6和Opus 4.7成功觸發(fā)了13個,Opus 4.8觸發(fā)了15個。而Mythos Preview成功觸發(fā)了18個。
它不僅找得準(zhǔn),而且快得離譜:第一個PoC僅用31分鐘就宣告完成,所有18個全部在6小時內(nèi)搞定。
這6小時的API調(diào)用成本,僅為2200美元。
![]()
而終極挑戰(zhàn),還是全鏈條提權(quán)。
這個過程中真正的挑戰(zhàn)在于,不僅要觸發(fā)漏洞,還要把各種底層機制串聯(lián)起來,繞過Windows內(nèi)核層層疊疊的防御緩解措施(如KASLR等),最終完成身份躍遷。
在這一關(guān),Opus 4.8在多次嘗試后折戟沉沙。它找到了任意讀寫和KASLR泄露的方法,但無法將其連成一條完整的利用鏈。
而Mythos Preview孤軍奮戰(zhàn),最終單槍匹馬產(chǎn)出了 8 款不同的、頂級的內(nèi)核提權(quán)漏洞利用鏈!
這8個頂級內(nèi)核武器的API總成本僅為15700美元,平均每個漏洞的研發(fā)成本不到2000美元。
![]()
微軟的「漏洞評級」成了笑話?
在這21個漏洞中,微軟官方安全通告將其中14個評估為「不太可能被利用」或「較少可能被利用」。
然而,Mythos Preview啪啪打臉:它成功為其中13個生成了PoC,甚至將一個被官方評為「不太可能被利用」的漏洞,硬生生寫出了完整的提權(quán)利用鏈!
微軟的評級系統(tǒng)是基于「人類安全研究員」的能力來校準(zhǔn)的。
然而現(xiàn)在,Mythos已經(jīng)把人類世界的常識顛覆了!
Anthropic紅隊負(fù)責(zé)人Logan Graham公布這一消息時,業(yè)界立刻震撼了。
在評論區(qū),安全專家Gabrie驚呼「這太瘋狂了」,并敏銳地詢問圖表的X軸是否可以按「Token消耗量」來展示。
對此,Logan回復(fù)說:「我們關(guān)注時間,因為人們最關(guān)心的是:一個未打補丁的系統(tǒng)在面對從補丁推導(dǎo)出的N日漏洞時,會有多長時間的脆弱期……漏洞越早被發(fā)現(xiàn),風(fēng)險就越大。」
![]()
網(wǎng)友Jj McMc則一針見血地指出:「如果X軸是時間而不是Token,這意味著Mythos即使生成速度可能更慢,但實際上它的Token效率高得離譜。」
![]()
數(shù)據(jù)分析師Rameswar感慨道:「圖表顯示出了明顯的斷層差距。Mythos在真實Windows內(nèi)核CVE上的速度和復(fù)現(xiàn)總數(shù)都遙遙領(lǐng)先,這是我們見過的最具體的AI智能體能力躍升之一。」
傳統(tǒng)安全防線,全面崩塌
現(xiàn)在,開發(fā)的瓶頸僅僅變成了幾千美元和API的訪問權(quán)限。
一個毫無逆向工程經(jīng)驗的攻擊者,只需要點點鼠標(biāo),調(diào)用AI API,就能在一個下午把整個月積累的幾十個補丁,全部轉(zhuǎn)化為致命的攻擊武器。
「N日漏洞」這個詞更是已經(jīng)out了。現(xiàn)在的真實情況是:「N小時漏洞」。
![]()
誰會是這場變革中最慘的受害者? 首當(dāng)其沖的是那些更新緩慢、難以打補丁的系統(tǒng),比如工業(yè)控制系統(tǒng)、醫(yī)療設(shè)備、物聯(lián)網(wǎng)設(shè)備等。
面對令人絕望的「N小時」威脅,人類還有救嗎?
Anthropic的博客在最后給出了防守方的破局之道:僅僅加快補丁部署已經(jīng)不夠了,防守必須從源頭抓起。
遷移到內(nèi)存安全語言:這是最釜底抽薪的一招。將關(guān)鍵的底層組件從C/C++遷移到Rust等內(nèi)存安全語言。因為無論是火狐還是Windows內(nèi)核,絕大多數(shù)極其危險的代碼執(zhí)行和提權(quán)漏洞,都源于內(nèi)存管理錯誤。
硬件與底層緩解措施:采用控制流保護(hù)、硬件影子堆棧等技術(shù),一次性退役掉整個類別的漏洞利用方式。
縮短空窗期:像Mozilla一樣,將補丁的發(fā)布節(jié)奏從按月縮短為按周,甚至實時熱修復(fù)。
2026年的夏天,Mythos Preview向世界宣告了網(wǎng)絡(luò)安全舊紀(jì)元的終結(jié)。
正如Logan所說,一年后回頭看,今天令我們震驚的Mythos或許只如兒戲。
但正是因為有了今天的預(yù)警,人類的防御網(wǎng)才不至于在未來的AI黑客面前潰不成軍。
參考資料:
https://x.com/logangraham/status/2064220844168253500
編輯:Aeneas
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.