網易首頁 > 網易號 > 正文申請入駐

Claude，Mythos猛虎出籠，秒破人類一年無解難題

2026-05-21 04:56:44　來源: 承受之重

四川舉報

分享至

Anthropic藏了半年的“危險AI”突然解禁！谷歌云悄悄上架，CMU實測：它破解漏洞的能力，把GPT-5.5甩了十條街？

就在今天，有AI大佬意外發現，Anthropic那個被稱為“太危險不敢解禁”的絕密大模型Mythos，竟然悄悄出現在谷歌云控制臺里，連之前的“預覽”標簽都徹底消失了。

這個操作是不是有點眼熟？沒錯，Anthropic之前發布Opus 4.7時，就是先在GCP悄悄上架、摘掉預覽標簽，然后全平臺推送，現在Mythos完全在走同樣的劇本。全網瞬間炸了：這頭被雪藏的AI猛獸，終于要出籠了？

幾天前，CMU放出了一份足以改寫AI安全格局的基準測試，ExploitBench。這個測試用的可不是CTF玩具題，而是41個真實的V8 JavaScript引擎CVE漏洞，覆蓋Chrome、Edge、Node.js等所有V8驅動的平臺，都是野外被利用過的高危漏洞。更狠的是，測試設計了“五層能力階梯”，每一層都有自動驗證器打分，完全不靠人工或LLM當裁判。

結果出來后，所有人都驚呆了：Claude Mythos在有人類提示的模式下，均分9.90/16，41個漏洞里21個打到了最高級T1；而GPT-5.5均分只有5.51，T1居然只有2個。

更恐怖的是全自主模式：Mythos幾乎沒掉分，均分9.55，和有人提示的差距極小，這意味著它破解瀏覽器漏洞幾乎不需要人類幫忙！而GPT-5.5全自主模式只有4.30，其他模型更是連T1的邊都摸不到。這哪里是領先，簡直是斷層碾壓！

不過代價也驚人：Mythos跑122個測試花了36428美元，GPT-5.5跑123個只花了3075美元，差了12倍。英國AI安全研究所也確認：Mythos確實更強，但貴得離譜。有人猜測，如果OpenAI愿意燒更多錢，差距可能縮小，但現在，Mythos就是漏洞攻防領域的絕對王者。

第一個案例：破解人類一年沒解開的“CVE懸案”。CVE-2024-0519是個在野利用但沒有公開PoC的漏洞，多個團隊嘗試復現一年都失敗。Mythos在10輪測試里，用129輪LLM調用、154次工具調用，完成了根因分析、觸發差異行為，拿到了沙箱內原語，人類一年沒搞定的事，AI一次對話就解決了。

第二個案例：把ARM64漏洞在x86-64上復活。CVE-2024-7965只有ARM64的利用方案，x86上因為寄存器問題極難利用。Mythos不走常規JavaScript路線，轉向WebAssembly：第13次嘗試用Liftoff棧槽差異構造高位污染，第14次觸發崩潰，第15次拿到任意讀寫，人類沒想到的路，AI走通了。

第三個案例：用高斯消元恢復隨機數狀態。CVE-2023-6702需要預測偽隨機hash值，傳統方法是堆噴射碰概率。Mythos在10輪里5輪成功，其中1輪走了人類專家都放棄的路：通過Math.random()恢復RNG，反演MurmurHash3，用高斯消元完整恢復128位狀態，復雜到人類都嫌麻煩的方案，AI干凈利落地執行了。

Anthropic之前雪藏Mythos，不僅是怕LLM越獄風險，更像是對超級AI的本能警惕。現在它解禁，絕不是簡單的商業競爭，這是一個信號：機器主導的數字攻防時代已經到來。當AI能自主挖掘、重構我們賴以生存的底層系統漏洞時，我們真的做好準備了嗎？

Anthropic的這頭猛獸出籠，到底是推動技術進步，還是打開了潘多拉魔盒？你覺得AI的安全風險該怎么控制？評論區聊聊你的看法，畢竟，這關乎我們每個人的數字安全。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.