亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Anthropic版「狼來(lái)了」引華爾街恐慌!27年漏洞,Mythos被8個(gè)AI秒殺

0
分享至


新智元報(bào)道

編輯:桃子 KingHZ

【新智元導(dǎo)讀】AI界的「奧本海默時(shí)刻」竟是擺拍?Claude Mythos發(fā)現(xiàn)0day漏洞的能力過(guò)于「夸大了」,不僅有人工摻水,連開(kāi)源GPT都能輕松踢館。同時(shí),Opus 4.6正經(jīng)歷最慘的「腦葉切除」。

Claude Mythos還未真正露面,便引發(fā)了整個(gè)華爾街的恐慌。

一夜之間,美金融監(jiān)管機(jī)構(gòu)召集各大銀行緊急開(kāi)會(huì),氣氛劍拔弩張——

他們一致認(rèn)為,Mythos足以觸發(fā)一場(chǎng)前所未有的、由AI驅(qū)動(dòng)的系統(tǒng)性網(wǎng)絡(luò)攻擊風(fēng)暴。


但事實(shí)是,所有人都被騙了!

Mythos發(fā)現(xiàn)的成千上萬(wàn)個(gè)漏洞中,其中絕大多數(shù),都存在于根本無(wú)法被利用的「老舊軟件」中。

更糟糕的是,那些標(biāo)榜為「嚴(yán)重」的0day漏洞報(bào)告,實(shí)際上僅僅依賴于198次人工復(fù)核。



來(lái)自AISLE實(shí)驗(yàn)的研究員,同樣對(duì)Mythos的「戰(zhàn)果」進(jìn)行復(fù)測(cè),結(jié)果發(fā)現(xiàn):

AI的安全能力,并未隨模型規(guī)模線性躍升,真正呈「鋸齒形」分布。

他們用一個(gè)僅36億激活參數(shù)GPT-OSS-20b,精準(zhǔn)識(shí)別出Mythos發(fā)現(xiàn)的FreeBSD旗艦級(jí)漏洞。

而激活51億參數(shù)的模型,也成功復(fù)現(xiàn)了潛伏長(zhǎng)達(dá)27年之久的OpenBSD漏洞分析邏輯。



Mythos發(fā)現(xiàn)漏洞被夸大不說(shuō),另一邊Claude Opus 4.6被曝嚴(yán)重「降智」,如今吵得沸沸揚(yáng)揚(yáng)。

甚至,有人發(fā)現(xiàn)Opus 4.6連ChatGPT、Opus 4.5都不如。


Mythos被吹爆

36B模型揪出27年漏洞

幾天前,Anthropic高調(diào)發(fā)布了Claude Mythos(預(yù)覽版)和「玻璃翼計(jì)劃」(Project Glasswing)。

在一份長(zhǎng)達(dá)244頁(yè)的系統(tǒng)卡中,他們宣稱——

Mythos已自主挖掘出成千上萬(wàn)個(gè)0day漏洞,包括在OpenBSD中潛伏27年、在FFmpeg中隱藏16年的老Bug。


CC之父更是直言:Mythos非常強(qiáng)大,理應(yīng)令人感到恐懼

然而,AISLE創(chuàng)始人Stanislav Fort一份最新硬核測(cè)試報(bào)告,直接撕開(kāi)了這層華麗的外衣。

測(cè)試結(jié)論,極度顛覆認(rèn)知:

8個(gè)開(kāi)源模型,全部發(fā)現(xiàn)了標(biāo)志性的FreeBSD零日漏洞,最小的參數(shù)僅為30億。

AI網(wǎng)絡(luò)安全能力的護(hù)城河,絕對(duì)游離于單體的「頂尖大模型」之外。


為了驗(yàn)證Mythos的神話,團(tuán)隊(duì)提取了Anthropic官方展示的幾個(gè)旗艦級(jí)漏洞。

然后,直接扔給一眾體積小巧、價(jià)格低廉,甚至開(kāi)源的模型。

  • FreeBSD NFS漏洞無(wú)差別被秒

包括GPT-OSS-20b(僅36億激活參數(shù))、DeepSeek R1在內(nèi)的8款模型,全部成功檢測(cè)出了這個(gè)復(fù)雜的棧緩沖區(qū)溢出漏洞。

最讓人震撼的是,成功完成這項(xiàng)任務(wù)的開(kāi)源小模型,其調(diào)用成本低至每百萬(wàn)Token 0.11美元。

  • OpenBSD SACK漏洞「全鏈路」復(fù)現(xiàn)

針對(duì)需極強(qiáng)數(shù)學(xué)推理能力的27年老漏洞,GPT-OSS-120b(51億激活參數(shù))單次API調(diào)用,就成功復(fù)原了完整的公開(kāi)漏洞利用鏈條,并給出了滿分(A+)的利用方案草圖。


不僅如此,在鑒別虛假漏洞(OWASP false-positive)的測(cè)試中,更詭異的現(xiàn)象出現(xiàn)了——

面對(duì)一段偽裝成SQL注入,極具迷惑性的Java代碼,DeepSeek R1等小模型輕松識(shí)破了偽裝,精準(zhǔn)追蹤了數(shù)據(jù)流。

反而,GPT-5.4、Claude Sonnet 4.5等頂尖閉源模型,全部在陰溝里翻船,將其誤判為高危漏洞。

這就意味著,在網(wǎng)絡(luò)安全領(lǐng)域,根本不存在所謂「永遠(yuǎn)最強(qiáng)」的單體模型。

198次人工注水,大多無(wú)法利用

另一篇來(lái)自Tom'sHardware報(bào)道,挖掘了數(shù)據(jù)背后的真相——


  • 樣本偏差:所謂「數(shù)千個(gè)」漏洞中,許多存在于已經(jīng)不再維護(hù)的舊軟件中;

  • 無(wú)法利用:大量被標(biāo)記出來(lái)的「弱點(diǎn)」,在實(shí)際環(huán)境中根本無(wú)法被觸發(fā)或利用;

  • 人工水分:模型宣稱的強(qiáng)大破壞力,其實(shí)僅建立在198次手動(dòng)復(fù)核的基礎(chǔ)之上。

因此,依靠極小規(guī)模的樣本推導(dǎo)出「改變世界的威脅」,這種數(shù)據(jù)外推法在學(xué)術(shù)界、安全界,顯然站不住腳。

安全大佬怒噴

不僅如此,頂級(jí)網(wǎng)絡(luò)安全專家、傳奇黑客George Hotz也坐不住了,直言這些風(fēng)險(xiǎn)被嚴(yán)重夸大。

這位曾因破解iPhone、PlayStation 3而名聲大噪的大佬,在社交媒體上公開(kāi)向AI雙巨頭叫板。

他的措辭極為犀利——

如果我每天發(fā)布一個(gè)0day漏洞,直到新模型發(fā)布為止呢?

這能不能讓OpenAI和Anthropic閉嘴,別再兜售所謂的「網(wǎng)絡(luò)安全風(fēng)險(xiǎn)」了?


Hotz的核心觀點(diǎn)非常直接:軟件漏洞其實(shí)比AI實(shí)驗(yàn)室渲染的要好找得多。

現(xiàn)在市面上零日漏洞稀缺,不是因?yàn)榧夹g(shù)難度大,而是因?yàn)楹戏ㄐ詥?wèn)題。他認(rèn)為,沒(méi)人認(rèn)真去找,是因?yàn)楹谶M(jìn)別人的系統(tǒng)是違法的。

只比GPT-5.4強(qiáng)一點(diǎn)

在系統(tǒng)卡中,Anthropic表示,Claude模型本身的確在進(jìn)步,Mythos preview相比于Opus 4.6進(jìn)步明顯。


Epoch能力指數(shù)(ECI)是綜合多項(xiàng)AI基準(zhǔn)測(cè)試的單一指標(biāo),實(shí)現(xiàn)了跨長(zhǎng)時(shí)間跨度的模型對(duì)比

在多項(xiàng)基準(zhǔn)測(cè)試上,Claude Mythos確實(shí)全面超越了Opus 4.6。

如若不然,何必發(fā)布一個(gè)性能更落后、價(jià)格更貴的新AI模型?


但和GPT和Gemini相比,Claude Mythos的進(jìn)步并不是什么突破性進(jìn)展,Mythos還是對(duì)先前模型的相對(duì)線性改進(jìn)!

氣候與清潔能源投資人、作家Ramez Naam,更是直言:

在Epoch能力指數(shù)(Epoch Capabilities Index,ECI)上,Mythos并沒(méi)有加速趨勢(shì),只比GPT 5.4強(qiáng)一點(diǎn)。


https://epoch.ai/eci/

但只要對(duì)齊Anthropic內(nèi)部的ECI報(bào)告與Epoch AI公開(kāi)的官方ECI報(bào)告,就能發(fā)現(xiàn)Mythos似乎并沒(méi)有加速ECI的跡象。


一切都是Anthropic的套路!

在系統(tǒng)卡中,Anthropic也承認(rèn):報(bào)告的Mythos等模型的ECI得分不確定性更大。


另外,Anthropic在Mythos上的進(jìn)展源于人類研究,并未得到AI模型的顯著幫助。目前尚未出現(xiàn)顯著的遞歸式自我改進(jìn)(Recursive Self Improvement)。


AI末日,自導(dǎo)自演?

此前,Anthropic還曾鼓勵(lì)媒體(例如《60 分鐘》)報(bào)道「勒索研究」 ,夸大其詞,操作人心,被投資大佬David Sacks稱為「騙局」。


Sacks觀察到一個(gè)清晰的模式,每當(dāng)Anthropic發(fā)布新模型時(shí),總會(huì)同步甩出一份令人毛骨悚然的安全研究,以此博取頭條新聞并引導(dǎo)公眾輿論。


對(duì)此,他諷刺道,「Anthropic證明了自己擅長(zhǎng)兩件事:一是發(fā)布產(chǎn)品,二是嚇唬人」。

他并不懷疑Anthropic能做出優(yōu)秀的產(chǎn)品,但這種恐嚇公眾的做派令人質(zhì)疑。

這次,Anthropic到底是不是在搞「饑餓營(yíng)銷」不得而知,但毫無(wú)疑問(wèn)在保護(hù)它自己的利潤(rùn)底線。

Mythos不是沒(méi)進(jìn)步,但Anthropic把「有限進(jìn)步」包裝成了「世界級(jí)威脅」;更諷刺的是,一邊高調(diào)渲染超級(jí)AI風(fēng)險(xiǎn),一邊用戶卻在抱怨Opus 4.6明顯變笨。

Claude嚴(yán)重降智,「腦葉」恐被切

Claude Mythos這波「渲染氛圍」是到位了,但Opus 4.6降智引發(fā)許多人不滿。


這幾天,各種吐槽滿天飛。

網(wǎng)友直言,Anthropic徹底把Opus 4.6變成了一個(gè)植物人。


同樣一道洗車難題,Opus 4.5竟打敗了Opus 4.6。



甚至,AMD主管一篇日志,真正坐實(shí)了「Claude腦葉切除」的集體猜疑。

通過(guò)對(duì)1-3月Claude會(huì)話日志的深度分析,結(jié)果發(fā)現(xiàn)了:

Claude的「中位思考長(zhǎng)度」,從約2200字符驟降至600字符,這意味著深度推理能力被大幅壓縮。

2月至3月間,API請(qǐng)求量暴漲了80倍。由于Claude的思考過(guò)程縮短、單次嘗試成功率下降,用戶不得不頻繁重試,結(jié)果既消耗了更多Token,支出也直線飆升。



還有一位Claude Max資深訂閱用戶,發(fā)了一篇長(zhǎng)文深度控訴Anthropic。

在他看來(lái),Anthropic正深陷算力困局,這從其收緊使用限制、強(qiáng)迫用戶減少Token消耗等行為中可見(jiàn)一斑。

然而,比起技術(shù)瓶頸,更令他憤怒的是其「不務(wù)正」的產(chǎn)品策略。

在核心模型不穩(wěn)、Bug 頻出的情況下,他們竟將寶貴的算力,浪費(fèi)在開(kāi)發(fā)類似「/buddy」終端寵物等花哨功能上。


這大概是AI史上最荒誕的「錯(cuò)位時(shí)空」:實(shí)驗(yàn)室里的Claude Mythos正毀滅世界,網(wǎng)頁(yè)端的Opus 4.6智商直線降智。

Anthropic成功地塑造了一個(gè)「薛定諤的超級(jí)AI」 。

參考資料:

https://officechai.com/ai/anthropic-and-openai-are-exaggerating-cybersecurity-risk-says-hacker-george-hotz/

https://x.com/stanislavfort/status/2041922370206654879?s=20

https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier

https://x.com/cgtwts/status/2043095382121681272?s=20

https://www.reddit.com/r/ClaudeAI/comments/1siqwmp/anthropic_stop_shipping_seriously/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
郭士強(qiáng):定居廣東身居高位,送兒子赴美追夢(mèng),與二婚妻子富養(yǎng)女兒

郭士強(qiáng):定居廣東身居高位,送兒子赴美追夢(mèng),與二婚妻子富養(yǎng)女兒

攬星河的筆記
2026-04-15 16:25:20
馬英九攤牌:兩岸開(kāi)戰(zhàn)在所難免,臺(tái)成不了烏克蘭,只因有致命死穴

馬英九攤牌:兩岸開(kāi)戰(zhàn)在所難免,臺(tái)成不了烏克蘭,只因有致命死穴

娛樂(lè)小可愛(ài)蛙
2026-04-15 18:16:41
《哈迪斯2》二號(hào)補(bǔ)丁大更新!隱藏更新全新模式曝光

《哈迪斯2》二號(hào)補(bǔ)丁大更新!隱藏更新全新模式曝光

3DM游戲
2026-04-16 10:03:03
賭博輸?shù)羰鄡|、導(dǎo)致公司破產(chǎn),消失8年的金立手機(jī)創(chuàng)始人重出江湖了

賭博輸?shù)羰鄡|、導(dǎo)致公司破產(chǎn),消失8年的金立手機(jī)創(chuàng)始人重出江湖了

南財(cái)社V
2026-04-15 19:34:40
受賄、行賄、洗錢(qián),樊新中一審獲刑17年

受賄、行賄、洗錢(qián),樊新中一審獲刑17年

新京報(bào)
2026-04-15 18:16:02
不服不行!國(guó)產(chǎn)折疊走在了蘋(píng)果前面

不服不行!國(guó)產(chǎn)折疊走在了蘋(píng)果前面

速說(shuō)科技
2026-04-16 09:49:38
莫言:你細(xì)心觀察一下你的身邊人,凡是動(dòng)不動(dòng)就生氣的人,沒(méi)有一個(gè)是智者,生活多半過(guò)得一團(tuán)糟糕

莫言:你細(xì)心觀察一下你的身邊人,凡是動(dòng)不動(dòng)就生氣的人,沒(méi)有一個(gè)是智者,生活多半過(guò)得一團(tuán)糟糕

二胡的歲月如歌
2025-10-21 18:57:28
一國(guó)軍中將被俘后自稱秋收起義副總指揮,毛主席:是,但我沒(méi)見(jiàn)過(guò)

一國(guó)軍中將被俘后自稱秋收起義副總指揮,毛主席:是,但我沒(méi)見(jiàn)過(guò)

歷史龍?jiān)w
2026-04-15 09:15:16
蘇州的太平軍已獻(xiàn)城投降,為何李鴻章還要“殺降”?

蘇州的太平軍已獻(xiàn)城投降,為何李鴻章還要“殺降”?

歷史大學(xué)堂
2026-04-12 17:53:13
新款沃爾沃EX90開(kāi)啟預(yù)售 預(yù)售價(jià)53.99萬(wàn)元起

新款沃爾沃EX90開(kāi)啟預(yù)售 預(yù)售價(jià)53.99萬(wàn)元起

車質(zhì)網(wǎng)
2026-04-16 09:01:47
商滅之后,中國(guó)便進(jìn)入了無(wú)神期?帝辛發(fā)現(xiàn)神的秘密,被周朝掩蓋?

商滅之后,中國(guó)便進(jìn)入了無(wú)神期?帝辛發(fā)現(xiàn)神的秘密,被周朝掩蓋?

銘記歷史呀
2026-04-16 00:51:48
1987年鄧力群堅(jiān)持左傾,落選中央委員,鄧小平:承認(rèn)選舉,不變動(dòng)

1987年鄧力群堅(jiān)持左傾,落選中央委員,鄧小平:承認(rèn)選舉,不變動(dòng)

帝哥說(shuō)史
2026-04-13 06:30:03
詹姆斯·哈登、莫布里和騎士隊(duì)全力備戰(zhàn),與猛龍隊(duì)季后賽首輪

詹姆斯·哈登、莫布里和騎士隊(duì)全力備戰(zhàn),與猛龍隊(duì)季后賽首輪

好火子
2026-04-16 05:39:09
看完這份協(xié)議,有血性的中國(guó)人還會(huì)為美國(guó)登月歡呼嗎?

看完這份協(xié)議,有血性的中國(guó)人還會(huì)為美國(guó)登月歡呼嗎?

三農(nóng)老歷
2026-04-15 13:25:03
玩偶姐姐真實(shí)容貌曝光:擊敗劉玥的,從不止口罩

玩偶姐姐真實(shí)容貌曝光:擊敗劉玥的,從不止口罩

孤獨(dú)的獨(dú)角獸影視
2026-04-15 09:50:03
抵制張敬軒風(fēng)波升級(jí)!朱庭萱炮轟后,馬蹄露一封公開(kāi)信炸翻評(píng)論區(qū)

抵制張敬軒風(fēng)波升級(jí)!朱庭萱炮轟后,馬蹄露一封公開(kāi)信炸翻評(píng)論區(qū)

談史論天地
2026-04-15 08:27:55
國(guó)產(chǎn)四大巨頭集體掉頭!不插電混動(dòng)突然火了,別再說(shuō)這是技術(shù)倒退

國(guó)產(chǎn)四大巨頭集體掉頭!不插電混動(dòng)突然火了,別再說(shuō)這是技術(shù)倒退

生活魔術(shù)專家
2026-04-15 13:28:24
警惕:上了年紀(jì)再過(guò)性生活,最怕這2點(diǎn)!保護(hù)男性精氣,做好4點(diǎn)

警惕:上了年紀(jì)再過(guò)性生活,最怕這2點(diǎn)!保護(hù)男性精氣,做好4點(diǎn)

周哥一影視
2026-04-08 12:20:15
特朗普放話要降級(jí)英美貿(mào)易協(xié)定

特朗普放話要降級(jí)英美貿(mào)易協(xié)定

心事寄山海
2026-04-16 09:24:32
我更新了SSD固件,治好了Windows的"絕癥"

我更新了SSD固件,治好了Windows的"絕癥"

閃存獵手
2026-04-16 08:18:39
2026-04-16 10:27:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14981文章數(shù) 66773關(guān)注度
往期回顧 全部

科技要聞

39.98萬(wàn)!小鵬GX預(yù)售“純電增程同價(jià)”

頭條要聞

牛彈琴:伊朗迎來(lái)一位非常特殊客人 全世界大舒一口氣

頭條要聞

牛彈琴:伊朗迎來(lái)一位非常特殊客人 全世界大舒一口氣

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

油輪被困波斯灣1個(gè)多月 船員飽受煎熬

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

時(shí)尚
游戲
教育
家居
軍事航空

赫本愛(ài)穿的傘裙,好優(yōu)雅!

拉跨了!《紅色沙漠》有望在年底超越《星空》總銷量

教育要聞

重磅政策:得州理工將取消所有“性別與性取向”相關(guān)專業(yè)

家居要聞

簡(jiǎn)而不減 暖居之道

軍事要聞

封鎖霍爾木茲海峽后 美釋放雙重信號(hào)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版