Anthropic藏了半年的“危險AI”突然解禁!谷歌云悄悄上架,CMU實測:它破解漏洞的能力,把GPT-5.5甩了十條街?
就在今天,有AI大佬意外發現,Anthropic那個被稱為“太危險不敢解禁”的絕密大模型Mythos,竟然悄悄出現在谷歌云控制臺里,連之前的“預覽”標簽都徹底消失了。
![]()
這個操作是不是有點眼熟?沒錯,Anthropic之前發布Opus 4.7時,就是先在GCP悄悄上架、摘掉預覽標簽,然后全平臺推送,現在Mythos完全在走同樣的劇本。全網瞬間炸了:這頭被雪藏的AI猛獸,終于要出籠了?
幾天前,CMU放出了一份足以改寫AI安全格局的基準測試,ExploitBench。這個測試用的可不是CTF玩具題,而是41個真實的V8 JavaScript引擎CVE漏洞,覆蓋Chrome、Edge、Node.js等所有V8驅動的平臺,都是野外被利用過的高危漏洞。更狠的是,測試設計了“五層能力階梯”,每一層都有自動驗證器打分,完全不靠人工或LLM當裁判。
結果出來后,所有人都驚呆了:Claude Mythos在有人類提示的模式下,均分9.90/16,41個漏洞里21個打到了最高級T1;而GPT-5.5均分只有5.51,T1居然只有2個。
![]()
更恐怖的是全自主模式:Mythos幾乎沒掉分,均分9.55,和有人提示的差距極小,這意味著它破解瀏覽器漏洞幾乎不需要人類幫忙!而GPT-5.5全自主模式只有4.30,其他模型更是連T1的邊都摸不到。這哪里是領先,簡直是斷層碾壓!
不過代價也驚人:Mythos跑122個測試花了36428美元,GPT-5.5跑123個只花了3075美元,差了12倍。英國AI安全研究所也確認:Mythos確實更強,但貴得離譜。有人猜測,如果OpenAI愿意燒更多錢,差距可能縮小,但現在,Mythos就是漏洞攻防領域的絕對王者。
第一個案例:破解人類一年沒解開的“CVE懸案”。CVE-2024-0519是個在野利用但沒有公開PoC的漏洞,多個團隊嘗試復現一年都失敗。Mythos在10輪測試里,用129輪LLM調用、154次工具調用,完成了根因分析、觸發差異行為,拿到了沙箱內原語,人類一年沒搞定的事,AI一次對話就解決了。
![]()
第二個案例:把ARM64漏洞在x86-64上復活。CVE-2024-7965只有ARM64的利用方案,x86上因為寄存器問題極難利用。Mythos不走常規JavaScript路線,轉向WebAssembly:第13次嘗試用Liftoff棧槽差異構造高位污染,第14次觸發崩潰,第15次拿到任意讀寫,人類沒想到的路,AI走通了。
第三個案例:用高斯消元恢復隨機數狀態。CVE-2023-6702需要預測偽隨機hash值,傳統方法是堆噴射碰概率。Mythos在10輪里5輪成功,其中1輪走了人類專家都放棄的路:通過Math.random()恢復RNG,反演MurmurHash3,用高斯消元完整恢復128位狀態,復雜到人類都嫌麻煩的方案,AI干凈利落地執行了。
Anthropic之前雪藏Mythos,不僅是怕LLM越獄風險,更像是對超級AI的本能警惕。現在它解禁,絕不是簡單的商業競爭,這是一個信號:機器主導的數字攻防時代已經到來。當AI能自主挖掘、重構我們賴以生存的底層系統漏洞時,我們真的做好準備了嗎?
![]()
Anthropic的這頭猛獸出籠,到底是推動技術進步,還是打開了潘多拉魔盒?你覺得AI的安全風險該怎么控制?評論區聊聊你的看法,畢竟,這關乎我們每個人的數字安全。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.