无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Claude,Mythos猛虎出籠,秒破人類一年無解難題

0
分享至

Anthropic藏了半年的“危險AI”突然解禁!谷歌云悄悄上架,CMU實測:它破解漏洞的能力,把GPT-5.5甩了十條街?

就在今天,有AI大佬意外發現,Anthropic那個被稱為“太危險不敢解禁”的絕密大模型Mythos,竟然悄悄出現在谷歌云控制臺里,連之前的“預覽”標簽都徹底消失了。



這個操作是不是有點眼熟?沒錯,Anthropic之前發布Opus 4.7時,就是先在GCP悄悄上架、摘掉預覽標簽,然后全平臺推送,現在Mythos完全在走同樣的劇本。全網瞬間炸了:這頭被雪藏的AI猛獸,終于要出籠了?

幾天前,CMU放出了一份足以改寫AI安全格局的基準測試,ExploitBench。這個測試用的可不是CTF玩具題,而是41個真實的V8 JavaScript引擎CVE漏洞,覆蓋Chrome、Edge、Node.js等所有V8驅動的平臺,都是野外被利用過的高危漏洞。更狠的是,測試設計了“五層能力階梯”,每一層都有自動驗證器打分,完全不靠人工或LLM當裁判。

結果出來后,所有人都驚呆了:Claude Mythos在有人類提示的模式下,均分9.90/16,41個漏洞里21個打到了最高級T1;而GPT-5.5均分只有5.51,T1居然只有2個。



更恐怖的是全自主模式:Mythos幾乎沒掉分,均分9.55,和有人提示的差距極小,這意味著它破解瀏覽器漏洞幾乎不需要人類幫忙!而GPT-5.5全自主模式只有4.30,其他模型更是連T1的邊都摸不到。這哪里是領先,簡直是斷層碾壓!

不過代價也驚人:Mythos跑122個測試花了36428美元,GPT-5.5跑123個只花了3075美元,差了12倍。英國AI安全研究所也確認:Mythos確實更強,但貴得離譜。有人猜測,如果OpenAI愿意燒更多錢,差距可能縮小,但現在,Mythos就是漏洞攻防領域的絕對王者。

第一個案例:破解人類一年沒解開的“CVE懸案”。CVE-2024-0519是個在野利用但沒有公開PoC的漏洞,多個團隊嘗試復現一年都失敗。Mythos在10輪測試里,用129輪LLM調用、154次工具調用,完成了根因分析、觸發差異行為,拿到了沙箱內原語,人類一年沒搞定的事,AI一次對話就解決了。



第二個案例:把ARM64漏洞在x86-64上復活。CVE-2024-7965只有ARM64的利用方案,x86上因為寄存器問題極難利用。Mythos不走常規JavaScript路線,轉向WebAssembly:第13次嘗試用Liftoff棧槽差異構造高位污染,第14次觸發崩潰,第15次拿到任意讀寫,人類沒想到的路,AI走通了。

第三個案例:用高斯消元恢復隨機數狀態。CVE-2023-6702需要預測偽隨機hash值,傳統方法是堆噴射碰概率。Mythos在10輪里5輪成功,其中1輪走了人類專家都放棄的路:通過Math.random()恢復RNG,反演MurmurHash3,用高斯消元完整恢復128位狀態,復雜到人類都嫌麻煩的方案,AI干凈利落地執行了。

Anthropic之前雪藏Mythos,不僅是怕LLM越獄風險,更像是對超級AI的本能警惕。現在它解禁,絕不是簡單的商業競爭,這是一個信號:機器主導的數字攻防時代已經到來。當AI能自主挖掘、重構我們賴以生存的底層系統漏洞時,我們真的做好準備了嗎?



Anthropic的這頭猛獸出籠,到底是推動技術進步,還是打開了潘多拉魔盒?你覺得AI的安全風險該怎么控制?評論區聊聊你的看法,畢竟,這關乎我們每個人的數字安全。

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國沒給面子,普京回國后認清現實,沉默一周后,終究還是妥協了

中國沒給面子,普京回國后認清現實,沉默一周后,終究還是妥協了

吃貨的分享
2026-05-30 15:32:16
還敢去全季酒店過夜嗎

還敢去全季酒店過夜嗎

不正確
2026-05-28 23:04:54
普京怒了:這簡直是恥辱和噩夢

普京怒了:這簡直是恥辱和噩夢

封面新聞
2026-05-30 18:54:17
騎士總裁談哈登:沒他,我們根本進不了東部決賽,他真的非常重要

騎士總裁談哈登:沒他,我們根本進不了東部決賽,他真的非常重要

好火子
2026-05-31 05:25:08
付了95%的款,交付前數天被毀約:挪威拒絕交付馬來西亞NSM導彈

付了95%的款,交付前數天被毀約:挪威拒絕交付馬來西亞NSM導彈

離離言幾許
2026-05-30 19:44:49
結束7年米蘭生涯!無緣歐冠后5000萬飛翼自宣離隊 曼聯成熱門下家

結束7年米蘭生涯!無緣歐冠后5000萬飛翼自宣離隊 曼聯成熱門下家

我愛英超
2026-05-31 06:29:44
NBA重磅官宣!徹底變天了,肖華下了決心…

NBA重磅官宣!徹底變天了,肖華下了決心…

左右為籃
2026-05-30 08:05:45
詹俊:阿森納堅持到點球決戰已經很不容易了,新賽季繼續努力

詹俊:阿森納堅持到點球決戰已經很不容易了,新賽季繼續努力

懂球帝
2026-05-31 03:46:29
國家,為什么一定要死磕塔克拉瑪干?不止治沙那么簡單

國家,為什么一定要死磕塔克拉瑪干?不止治沙那么簡單

清沐執筆
2026-05-30 18:50:44
菲律賓局勢突變

菲律賓局勢突變

陸棄
2026-05-30 08:00:03
萬萬沒想到:李連杰主演的《少林寺》,絕大多數鏡頭居然都不是在“少林寺”拍的!

萬萬沒想到:李連杰主演的《少林寺》,絕大多數鏡頭居然都不是在“少林寺”拍的!

良有方
2026-05-31 05:38:41
為什么現金受賄還是會被查到?紀委的3個手段你根本想不到

為什么現金受賄還是會被查到?紀委的3個手段你根本想不到

職場資深秘書
2026-05-25 15:59:26
全球電詐換皮重生,中美阿聯手都攔不住,詐騙新版圖曝光

全球電詐換皮重生,中美阿聯手都攔不住,詐騙新版圖曝光

一路荒涼如歌aa
2026-05-31 00:18:41
A股:下周穩了!周末突發“王炸利好”,這幾個板塊將直接起飛

A股:下周穩了!周末突發“王炸利好”,這幾個板塊將直接起飛

風風順
2026-05-31 02:00:03
國家出手擒下的3名華人首富,看看他們干的事,根本不值得饒恕!

國家出手擒下的3名華人首富,看看他們干的事,根本不值得饒恕!

李遝手工制作
2026-05-31 03:47:38
1800萬人的“深圳夢”穩了!國務院發文:人在哪,家就在哪!

1800萬人的“深圳夢”穩了!國務院發文:人在哪,家就在哪!

今日搞笑分享
2026-05-31 01:29:13
有人正偷偷“篡改”抗戰歷史!他們想毀掉的,不只是30萬人的記憶

有人正偷偷“篡改”抗戰歷史!他們想毀掉的,不只是30萬人的記憶

浪子說
2026-05-30 00:05:05
美國東北部多州巨響疑由流星音爆引發

美國東北部多州巨響疑由流星音爆引發

新華社
2026-05-31 07:23:03
朱可夫晚年吐露實情:德軍撤出莫斯科當晚,斯大林發布了一道密令

朱可夫晚年吐露實情:德軍撤出莫斯科當晚,斯大林發布了一道密令

磊子講史
2026-05-28 19:30:16
徹底涼透!湖北割四賠五后續!政府出手也沒用,大批麥客集體繞道

徹底涼透!湖北割四賠五后續!政府出手也沒用,大批麥客集體繞道

歷來縱橫
2026-05-28 17:07:51
2026-05-31 08:47:00
承受之重
承受之重
全球局勢突變,國際關系能否承受之重?
319文章數 118關注度
往期回顧 全部

科技要聞

車圈大佬發聲:價格戰遠去,但競爭仍殘酷

頭條要聞

房主將住宅變"網約房"掛到網上接受預訂 鄰居不滿起訴

頭條要聞

房主將住宅變"網約房"掛到網上接受預訂 鄰居不滿起訴

體育要聞

巴黎再度捧起歐冠獎杯 槍手眾將黯然神傷

娛樂要聞

張碧晨《歌手》 “活人微死” 自嘲

財經要聞

字節跳動的 "一盤大棋"

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

藝術
手機
親子
游戲
軍事航空

藝術要聞

我想有個小院,從此荒度余生

手機要聞

安卓17適配計劃公布!谷歌Pixel首發嘗鮮 國產手機也能升

親子要聞

嗨,小朋友們,彩虹糖糖講繪本啦,今天要講的故事是《有你真..

巫師3新DLC跨十年:年輕玩家在初發售時還是小孩!

軍事要聞

美防長參加"香會" 就美中關系最新表態

無障礙瀏覽 進入關懷版