亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

能力太強,Mythos被Anthropic“凍結(jié)”

0
分享至


出品|虎嗅科技組

作者|趙致格

編輯|苗正卿

頭圖|視覺中國

4月8日,關(guān)注AI圈動態(tài)的極客們收到了一個好消息和一個壞消息。好消息是Anthropic那個被傳得神乎其神的新模型Claude Mythos終于發(fā)布了預(yù)覽版,而各種公開的數(shù)據(jù)也顯示出Mythos確實全方面碾壓了Opus4.6。

但壞消息是,因為相關(guān)防護機制尚未成熟,Mythos當(dāng)前不對公眾開放,Anthropic還為其定制了一個安全項目玻璃墻計劃(Project Glasswing)。根據(jù)這一安全項目,僅有12家機構(gòu)能訪問Mythos。與此同時,Anthropic還承諾提供最高1億美元的模型使用額度,用于防御性網(wǎng)絡(luò)安全研究。


過去一段時間,關(guān)于Mythos的傳聞一直在滿天飛。早在3月26日,Anthropic的一個內(nèi)容管理系統(tǒng)出現(xiàn)了錯誤,曝光了一篇還沒有正式發(fā)布的草稿。這篇草稿稱Mythos是“史上最強大的模型”。

X上同樣有人爆料稱,某家實驗室完成了迄今為止最大的一次成功訓(xùn)練,而新模型的表現(xiàn)遠遠超過內(nèi)部預(yù)期,也超過了大家根據(jù)模型縮放定律(scaling law)能預(yù)測的水平。


雖然普通人無法親自體會這個傳說中的又一次“GPT時刻”,但Anthropic公布的一系列數(shù)據(jù)確實顯示出Mythos 強得可怕。

在專業(yè)漏洞復(fù)現(xiàn)測試CyberGym上,Mythos的得分是83.1%,而此前Anthropic 的最強模型Opus4.6的分數(shù)是66.6%。


在編程能力方面,Mythos在SWE-bench Pro、Terminal-Bench 2.0、SWE-bench Multimodal (internal implementation)、SWE-bench Multilingual、SWE-bench Verified中的測試分數(shù)均顯著高于Opus4.6。Anthropic稱,新模型的能力已經(jīng)達到“可以與最頂尖人類安全專家競爭”的水平。

在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。


Mythos不僅是在編程能力上表現(xiàn)強悍。在研究生水平科學(xué)問答測試(GPQA Diamond)測試中,Mythos以94.6%的分數(shù)超過Opus4.6的91.3%;在Humanity‘s Last Exam的有工具和無工具測試中,Mythos 56.8%和64.7%的分數(shù)均超過Opus4.6十個百分點。

在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

不過,上述維護的優(yōu)異表現(xiàn)并不是Anthropic不敢上線Mythos的原因。Mythos真正的可怕之處在它突破軟件安全防線的能力太強了。

理論上,所有軟件都可能會有漏洞,但是Mythos在發(fā)現(xiàn)并攻擊漏洞上的能力遠超人類水平。根據(jù)Anthropic的博文介紹,Mythos已經(jīng)在在操作系統(tǒng)、網(wǎng)絡(luò)瀏覽器和其他軟件中發(fā)現(xiàn)了“幾千個”重大漏洞,其中包括OpenBSD中一個存在27年的錯誤,以及FFmpeg中一個存在16年、在自動測試工具運行500萬次后仍未被檢測到的漏洞。

可以說,全世界所有的軟件和系統(tǒng)在Mythos面前都顯得漏洞百出,脆弱不堪。假如Mythos的能力在當(dāng)下被黑客掌握,無疑會有無數(shù)數(shù)字基礎(chǔ)設(shè)施會遭殃。

Anthropic的CEO達里奧·阿莫迪(Dario Amodei)Mythos發(fā)布的同時也在X上表達了自己的擔(dān)憂和信心。他表示:“網(wǎng)絡(luò)安全是前沿AI模型帶來的首個明確且現(xiàn)實的危險,但絕不會是最后一個。若我們能共同迎接挑戰(zhàn)、應(yīng)對這一風(fēng)險,這或?qū)⒊蔀橐环菟{圖,用以解決未來更為艱巨的挑戰(zhàn)。”

達里奧隨后又進一步解釋:“一旦應(yīng)對失誤,其危險顯而易見;但倘若應(yīng)對得當(dāng),我們將真正迎來機遇:建造一個比AI網(wǎng)絡(luò)安全能力出現(xiàn)之前更加安全的互聯(lián)網(wǎng)與世界。”


面對AI發(fā)展帶來的危險和機遇,Anthropic 提出的應(yīng)對方法是發(fā)起玻璃翼計劃(Project Glasswing)。這個項目將向特定組織開放其未公開發(fā)布的通用AI模型“Claude Mythos預(yù)覽版”,用于防御性網(wǎng)絡(luò)安全工作。12個合作伙伴包括亞馬遜、微軟、蘋果、谷歌、英偉達、CrowdStrike和Palo Alto Networks等科技與網(wǎng)絡(luò)安全公司。


這12家公司覆蓋了云計算、瀏覽器、芯片、金融基礎(chǔ)設(shè)施、操作系統(tǒng)等各個領(lǐng)域的巨頭。可以說,全球數(shù)字基礎(chǔ)設(shè)施的核心參與者都在其中了。而這些參與者將作為防守方搶先一步用上頂級的AI模型,補上現(xiàn)有的系統(tǒng)漏洞。

一直以來,Anthropic都被認為是最重視安全的AI的科技公司,不過與之伴隨的也有不少爭議,很多人認為Anthropic只是說說漂亮話,真實目的是想通過提升AI安全標(biāo)準來提升中小公司的入場門檻。

但就此次的玻璃翼計劃(Project Glasswing)而言,Anthropic的行動無疑是值得人們贊許的。在研發(fā)出了最強模型后,Anthropic沒有將它第一時間推向市場謀取最大曝光,而是先讓全球信息基礎(chǔ)設(shè)施來完善自己,為全球軟件安全筑起新一代屏障,也為為未來高風(fēng)險 AI 治理提供了可復(fù)制的藍圖。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4848866.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
拒不報銷?國民黨主席鄭麗文訪問花費480萬元新臺幣

拒不報銷?國民黨主席鄭麗文訪問花費480萬元新臺幣

小馬姨
2026-04-17 11:30:29
終于等來一個“足夠愚蠢”的總統(tǒng)!內(nèi)塔尼亞胡笑了,美國人民哭了

終于等來一個“足夠愚蠢”的總統(tǒng)!內(nèi)塔尼亞胡笑了,美國人民哭了

歷史人文2
2026-04-17 08:00:09
解放后損失最大俘虜逃跑事件,劫走一架飛機帶走3名我軍中層干部

解放后損失最大俘虜逃跑事件,劫走一架飛機帶走3名我軍中層干部

鶴羽說個事
2026-04-16 22:07:31
震驚!面館“免費加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

震驚!面館“免費加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

火山詩話
2026-04-17 07:28:41
不卑微!一新生坦誠告知室友家窮,聚餐不必叫自己,宿舍衛(wèi)生全包

不卑微!一新生坦誠告知室友家窮,聚餐不必叫自己,宿舍衛(wèi)生全包

火山詩話
2026-04-17 09:22:03
林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實厲害,但真不合適

林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實厲害,但真不合適

浩渺青史
2026-04-17 13:55:15
林肯號航母伙食曝光:沒有龍蝦牛排,美國大兵在海上挨餓

林肯號航母伙食曝光:沒有龍蝦牛排,美國大兵在海上挨餓

小星球探索
2026-04-17 09:07:39
胡錫進給沃爾沃汽車做廣告,評論區(qū)全翻車了……

胡錫進給沃爾沃汽車做廣告,評論區(qū)全翻車了……

麥杰遜
2026-04-17 11:51:26
中越聯(lián)合聲明:加快推進兩國鐵路、公路、口岸基礎(chǔ)設(shè)施互聯(lián)互通 將鐵路合作作為兩國戰(zhàn)略合作新亮點

中越聯(lián)合聲明:加快推進兩國鐵路、公路、口岸基礎(chǔ)設(shè)施互聯(lián)互通 將鐵路合作作為兩國戰(zhàn)略合作新亮點

財聯(lián)社
2026-04-17 10:42:13
巴基斯坦陸軍元帥阿西姆·穆尼爾:美伊停火談判的關(guān)鍵斡旋者

巴基斯坦陸軍元帥阿西姆·穆尼爾:美伊停火談判的關(guān)鍵斡旋者

參考消息
2026-04-16 14:51:07
油價一夜突變!今天4月17日調(diào)整后,全國加油站92、95汽油最新售價

油價一夜突變!今天4月17日調(diào)整后,全國加油站92、95汽油最新售價

沙雕小琳琳
2026-04-17 10:39:22
印尼正考慮允許美軍機飛越其領(lǐng)空,外交部:國家間防務(wù)安全合作不應(yīng)針對第三方

印尼正考慮允許美軍機飛越其領(lǐng)空,外交部:國家間防務(wù)安全合作不應(yīng)針對第三方

澎湃新聞
2026-04-17 15:48:29
突發(fā)!勇士核心格林的一則令人擔(dān)憂的消息曝出,戰(zhàn)太陽狀態(tài)成疑

突發(fā)!勇士核心格林的一則令人擔(dān)憂的消息曝出,戰(zhàn)太陽狀態(tài)成疑

夜白侃球
2026-04-17 11:01:31
零食包裝上寫著“勿忘國恥是每個中國人的出廠設(shè)置”,廠家回應(yīng):這是老板的情懷,希望傳達正能量

零食包裝上寫著“勿忘國恥是每個中國人的出廠設(shè)置”,廠家回應(yīng):這是老板的情懷,希望傳達正能量

極目新聞
2026-04-17 09:51:27
極大反差:中國人暴跌55%,日本外國游客又創(chuàng)新高,俄羅斯人增26%

極大反差:中國人暴跌55%,日本外國游客又創(chuàng)新高,俄羅斯人增26%

壹只灰鴿子
2026-04-15 22:41:48
廣州公布一起4死2傷爆燃事故調(diào)查報告:審計發(fā)現(xiàn)謊報,提出處理建議

廣州公布一起4死2傷爆燃事故調(diào)查報告:審計發(fā)現(xiàn)謊報,提出處理建議

上游新聞
2026-04-17 12:02:03
中國人真喝不動了?茅臺,歷史首次負增長

中國人真喝不動了?茅臺,歷史首次負增長

說財貓
2026-04-17 05:05:56
青年藝術(shù)家易連因病逝世,年僅38歲,他曾視力受損,仍堅持創(chuàng)作

青年藝術(shù)家易連因病逝世,年僅38歲,他曾視力受損,仍堅持創(chuàng)作

極目新聞
2026-04-17 15:29:23
大快人心!許家印結(jié)局已定,3個女人被他連累,才懂白珊珊有多冤

大快人心!許家印結(jié)局已定,3個女人被他連累,才懂白珊珊有多冤

風(fēng)信子的花
2026-04-16 16:37:45
間諜策反中企員工致項目停工停產(chǎn) 國安機關(guān)披露詳情

間諜策反中企員工致項目停工停產(chǎn) 國安機關(guān)披露詳情

極目新聞
2026-04-17 07:00:50
2026-04-17 16:23:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26118文章數(shù) 687678關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

男子與父母吵架住酒店飲酒后死亡 父母向酒店索賠99萬

頭條要聞

男子與父母吵架住酒店飲酒后死亡 父母向酒店索賠99萬

體育要聞

遭網(wǎng)暴后,22歲大滿貫冠軍反擊:我的頭發(fā)足夠好

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

又快又穩(wěn)的開掛動力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

房產(chǎn)
手機
健康
時尚
軍事航空

房產(chǎn)要聞

2600億砸向城更,海南要巨變!

手機要聞

iPhone用戶忠誠度高達96.4% 吸引Android用戶轉(zhuǎn)投可能性高出四倍

干細胞抗衰4大誤區(qū),90%的人都中招

假期,怎么拍照最出片?

軍事要聞

美宣布黎以停火10天 以方稱不會撤軍

無障礙瀏覽 進入關(guān)懷版