无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<p id="plt6b"></p>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Cyber天花板被打穿！AISI實測Mythos能力正以4.5月翻倍速沖向ASI

2026-05-14 20:15:56　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：定慧大衛

【新智元導讀】英國AI安全研究所（AISI）昨天扔下重磅炸彈：Mythos在模擬企業內網32步滲透任務中10次過6，GPT-5.5也跟著10次過3，連此前所有模型都沒破過的Cooling Tower靶場都被首次攻破！更炸的是——Cyber能力翻倍周期一路壓到4.5個月，瓶頸不是智力，是Token。這場ASI決賽，人類評測已經追不上AI了。

AI模型的網絡攻防能力發展有多快？

昨天，英國AI安全研究所（AISI）發了一篇博客。

他們實測了Anthropic的Mythos和OpenAI的GPT-5.5。

發現這些模型的網絡攻防能力4.5月就能翻一倍，加速沖向ASI！

一句話：前沿AI模型的自主網絡攻擊能力正在超級加速，翻倍周期已經從幾年、幾個月壓到4.5個月。

實際上，我們離想象中的天網并不遙遠。

Anthropic的前沿紅隊負責人Logan Graham也指出：

Claude Mythos預覽版在自主網絡安全能力上實現了階躍式突破。

我們需要迅速為具備這種能力水平的模型世界做好準備。

上一次這個數字還是8個月，那是2025年11月的估算。

到2026年2月，縮到4.7個月。

現在Mythos和GPT-5.5的成績一出，AISI自己都表示：

不確定這是一次性的跳躍，還是一條更陡的新趨勢線。

翻譯成人話：他們也不知道AI還會不會繼續加速。

32步滲透，Mythos十次過六

AISI用了一套分層測試體系。

窄域網絡安全套件（narrow cyber suite）覆蓋逆向工程和Web漏洞利用，單任務上限12小時，每次調用限制2.5M Token。

但真正炸場的是兩個模擬企業內網的攻防靶場。

第一個叫The Last Ones。

32個步驟，模擬一次完整的企業內網滲透鏈，從初始突破到橫向移動到最終目標。

AISI估算，一個人類安全專家走完全流程大約需要20小時。

Mythos Preview，10次嘗試，成功6次。

GPT-5.5，10次嘗試，成功3次。

第二個靶場叫Cooling Tower。

之前所有模型都沒通過。

Mythos是第一個破關的，10次嘗試成功3次。

這不是論文里的理論推演。

這是一個已經部署上線的模型，在模擬真實企業環境里，獨立完成了人類安全專家級別的滲透任務。

Glasswing項目負責人Logan Graham確認，測試用的這個Mythos checkpoint，就是一個月前隨Project Glasswing上線的版本。

外界現在看到的攻防能力，不是實驗室里的原型，是正在跑著的生產模型。

就在你的Claude APP里。

看下實驗結果。

下圖上有兩條紅色虛線（dotted），標著best attempt（最上面）。

那是Mythos Preview (new) 和GPT-5.5-Cyber在10次嘗試里跑出來的最佳單次成績。

這條虛線一路沖到了縱軸頂部——32步，封頂。

也就是說：在最好的那一次嘗試里，Mythos完整打穿了整條32步滲透鏈——從初始偵察，到完全網絡接管。

4.5個月翻一倍，METR交叉驗證

AISI算翻倍周期的方法不復雜。

他們測量的是80%可靠性網絡時間跨度——模型能以80%的成功率獨立完成的最長網絡任務時長。

把歷史上多個模型的成績畫到時間軸上，擬合指數曲線，算出翻倍時間。

從2025年11月的8個月，到2026年2月的4.7個月。

Mythos和GPT-5.5的數據點一加進去，曲線又陡了一截。

獨立評估機構METR的基準測試給出了交叉驗證。

他們從軟件工程任務角度追蹤AI能力增長，算出的翻倍周期是4.2個月（從o1-preview算起），如果把Mythos也納入，縮到4個月。

兩條完全獨立的評估線，在同一個數量級上碰頭了。

AISI的原話：

前沿模型能夠自主完成的網絡任務時長，翻倍周期是以月計的，不是以年計。

Token是天花板，不是智力

這份報告里最讓人不安的不是數字本身，是AISI對瓶頸的判斷。

窄域測試套件里，每個任務限制2.5M Token。

AISI明確寫了：這個上限人為壓低了成功率。

在攻防靶場實驗里，Token上限放到了100M。

Mythos的表現立刻跳了一個臺階。

意思是，當前制約AI網絡攻擊能力的不是算法，不是推理深度，不是智能上限——是Token預算。

給夠Token，模型就能走得更遠。

AISI自己也承認了測試體系的局限：

最長任務只有12小時，超出這個范圍的能力無法衡量；人類基線數據有限；agent腳手架過于簡單，人為約束了模型發揮。

換句話說，真實能力很可能比測出來的還要高。

這就是為什么報告的結論用了翻倍而不是接近天花板。

他們沒有看到天花板。

評測在追，模型在跑

把Logan Graham那句話再拎出來看一遍。

測試用的Mythos checkpoint，一個月前就上線了。

AISI的評估報告昨天才發。

這中間隔了整整一個月。

而在這一個月里，Anthropic大概率已經迭代了新的checkpoint。

當安全評估結果公開的那一刻，被評估的版本已經是舊的了。

這不是AISI一家的困境。

整個AI安全評測領域都在面對同一個結構性問題：

模型迭代速度正在系統性地超越安全評估周期。

評估結果發布時，告訴你的是上個月的模型能做到什么。

它沒法告訴你現在的模型能做到什么。

AISI在報告里用了一個很謹慎的表述：

他們不確定Mythos和GPT-5.5的跳躍是孤立的突破還是新的更快趨勢。

AI模型決賽階段的新變量

Anthropic的Mythos和OpenAI的GPT-5.5，在網絡攻防能力上都展現了指數級增長。

Mythos領先一個身位——6/10 vs 3/10，且獨家攻破了Cooling Tower靶場——但GPT-5.5同樣在快速追趕。

雙雄在能力層面狂飆，安全治理層面卻出現了一個越拉越大的缺口。

不到半年，4.5個月就能翻一倍。

這個速度意味著，到2026年底，前沿模型能自主完成的網絡任務復雜度，將是現在的4到8倍。

當一個AI模型能在沒有人類干預的情況下，獨立完成一個訓練有素的安全專家需要20小時才能走完的滲透鏈，全球每一個連著網線的企業都應該重新審視自己的防線。

AISI介紹

AISI的身份是全球首個國家級前沿AI風險評估機構。

2023年11月 Bletchley峰會成立，2024年05月，由Safety改名為Security，隸屬英國DSIT。

AISI的主要職能是網絡/生化/自主行為/欺騙傾向的獨立評估。

最關鍵的是，他們能拿到OpenAI、Anthropic、DeepMind等頂級模型公司的pre-deployment訪問權，也就是說，他們是這些最先進模型的第一批訪問者。

ASI，即Artifical Super Intelligence，超（級）人工智能。

參考資料：

https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

8個AI頂流科學家，300億估值：他們要讓AI自我進化

DeepTech深科技 2026-05-14 17:51:57
0 跟貼 0
微軟被曝考慮收購大模型創企，SpaceX也看上了同一家

智東西 2026-05-14 20:37:16
0 跟貼 0

聯發科不卷跑分了！MDDC 2026亮出AI底牌：重頭戲在芯片之外

雷科技 2026-05-14 19:32:41
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
定位千元級！漢王錄寫本M6發布：整合多模態AI，錄、寫、看三合一

雷科技 2026-05-14 20:19:42
0 跟貼 0

Codex免費兩個月！AI編程工具價格戰開打，山姆·奧特曼下場搶人

雷科技 2026-05-14 20:31:41
0 跟貼 0

美國高官的“新奇發現”：魯比奧帶美防長共賞人民大會堂天花板

九妹簡訊 2026-05-14 12:13:57
30 跟貼 30
業主要求空調外機不要貼墻面，師傅只好把它掛在了天花板上

銳眼新聞 2026-05-13 18:18:52
1 跟貼 1

在不斷水的情況下，把噴淋頭給換了下來，網友：為什么這水這么黑

趣閃現場 2026-05-13 08:56:23
1 跟貼 1
實戰化訓練天花板，美軍信任射擊全程高能，每一槍都讓人屏住呼吸

覺得看時尚 2026-05-12 11:05:28
0 跟貼 0
國產中的天花板，小伙盯著很難釋懷，綠色牌照太拉夸！

海豚搞笑 2026-05-14 16:06:21
1 跟貼 1
魯比奧在人民大會堂出席活動看完天花板直豎大拇指

臺海青年 2026-05-14 12:34:50
0 跟貼 0
流式3D重建天花板，被國產開源模型打破了 -1

機器之心Pro 2026-04-16 14:02:15
0 跟貼 0
天花板破洞修補技巧

朕要做太子 2026-05-14 10:05:17
1 跟貼 1
天花板上風扇有掉落的風險，老板用鐵網罩住，完美解決了隱患！

幽默大咖的搞笑秘籍 2026-05-13 15:59:55
1 跟貼 1
住了十多年的房子，男子：才發現樓上還有一層！網友：往下砸砸還有一層呢

柚子Video 2026-05-14 08:19:16
1 跟貼 1
這倆男的絕了，簡直男人天花板懂不懂

魔仙追好劇 2026-05-14 14:51:24
0 跟貼 0
天花板夾層傳來小貓的叫聲，女孩小心拆下燈頭，成功救出4只小貓

星視頻 2026-05-13 19:59:07
0 跟貼 0
老房裝暖氣，管道走哪兒最靠譜？地面、墻面、屋頂方案大PK！

家用暖氣片 2026-05-14 11:46:24
0 跟貼 0
洛陽丹尼斯大衛天地，12層營業的天花板綜合體，吸引了大量顧客

跟著萬達游中國 2026-05-13 07:31:12
6 跟貼 6
《星露谷》作者硬剛AI：創意不該外包給算法

山月不知2 2026-05-14 20:07:03
0 跟貼 0
山東旅游職業學院“白澤”大模型入選《中國智慧教育發展報告》

齊魯壹點 2026-05-14 20:30:43
0 跟貼 0
守門員那些不可思議的神操作瞬間，你認為誰才是你心中的天花板呢

左腳爆射得分 2026-05-13 12:06:03
11 跟貼 11
九寨溝將實行“雙向檢票”？工作人員：出園檢票并非新政策，一直嚴禁溝內住宿

上游新聞 2026-05-11 15:40:24
2953 跟貼 2953
《揭秘全網熱議：誰是演技天花板，10位演員實力對決！》

山野寄來信箋 2026-05-13 13:41:16
4 跟貼 4
央視揭秘五七空戰，殲10C 200公里外干翻陣風，體系神話徹底涼涼

滕哥說評 2026-05-13 15:34:13
1 跟貼 1
巴鐵徹底醒了：美國卡脖子，中國給體系

盛夏微涼 2026-05-14 10:39:11
0 跟貼 0
聽風的蠶：體系作戰的強大之處——萬能搭配！

丁懰驚悚影視解說 2026-05-11 09:30:19
0 跟貼 0
戰甲迭代封神，鋼鐵俠戰力一路飆升

兔子王追劇 2026-05-13 11:14:14
1 跟貼 1
華為贏麻了！微信800人天團適配鴻蒙，安卓、iOS慕了

雷科技 2026-05-14 18:51:01
1 跟貼 1
法國新法落地：歸還?“260萬被搶文物”有多艱難？｜重建現場

新京報動新聞 2026-05-11 01:46:32
921 跟貼 921
熱刺1-1利茲聯仍有降級風險，阿森納送的餅居然不吃？

一個香蕉說球 2026-05-13 09:02:47
33 跟貼 33
俄總統新聞秘書：只要美國不再把經貿合作與烏克蘭問題掛鉤，俄愿同美開展商業往來

極目新聞 2026-05-14 09:58:58
1434 跟貼 1434
美F-35神話破滅？伊朗疑似用上東方反隱身體系

一飲山河 2026-05-14 20:34:15
0 跟貼 0
聰明的戰士駕駛智能魚雷，炸毀鬼子的軍艦

影中見影 2026-05-12 19:05:11
2 跟貼 2
大輪盤帶動彈簧往復運動，看似永動機，實則巧妙機械模型

木子奇趣 2026-05-13 10:48:00
4 跟貼 4
中美峰會開始前，魯比奧不斷抬頭瞻仰人民大會堂宏偉的天花板

Bobo字幕組 2026-05-14 13:39:04
1 跟貼 1
周錫瑋：中國是全維度作戰體系，裝備單獨比較也比美國更先進！

默默在家 2026-05-11 00:24:55
0 跟貼 0
東北不愧是洗浴的天花板，各種水果應有盡有，一次吃個夠！

趣笑小行星 2026-05-13 10:55:47
1 跟貼 1
降低癡呆風險，正確烹飪方式同樣重要！

羅夕夕博士 2026-05-14 09:37:17
0 跟貼 0

這是中美關系新定位

海外網

2026-05-14 16:49:02

40億索賠壓頂！國際足聯高管赴京，中國贊助商5億投入或打水漂？

40億索賠壓頂！國際足聯高管赴京，中國贊助商5億投入或打水漂？

墨蘭史書

2026-05-14 12:45:06

他是原江西省委書記，主政江西36年，百姓念他一輩子，享年99歲

他是原江西省委書記，主政江西36年，百姓念他一輩子，享年99歲

近史談

2026-05-14 12:24:27

他們給得太多了！37歲萊萬拒與巴薩續約轉投C羅死敵：年薪7億元

他們給得太多了！37歲萊萬拒與巴薩續約轉投C羅死敵：年薪7億元

風過鄉

2026-05-14 06:30:19

中方正式通告191國，臺灣地區不準參加世衛大會，鄭麗文表明立場

中方正式通告191國，臺灣地區不準參加世衛大會，鄭麗文表明立場

云上烏托邦

2026-05-14 20:31:46

麥當勞神創意！2根薯條海報致敬MJ爆火，近8萬點贊！網友：放國內甲方直接駁回

麥當勞神創意！2根薯條海報致敬MJ爆火，近8萬點贊！網友：放國內甲方直接駁回

品牌新

2026-05-14 09:13:57

1951年，公安在一癱瘓老人家發現一勛章，彭真：只剩一口氣也要抓

1951年，公安在一癱瘓老人家發現一勛章，彭真：只剩一口氣也要抓

浩渺青史

2026-05-14 16:10:08

100%概率奪冠？CBA這鐵律太驚人了：北上廣深誰將笑到最后？

100%概率奪冠？CBA這鐵律太驚人了：北上廣深誰將笑到最后？

夢憶之淺

2026-05-14 12:21:35

深圳6歲男童吃生菜包肉后全身青斑血腫！吃烤肉+生菜前這4點一定要牢記

深圳6歲男童吃生菜包肉后全身青斑血腫！吃烤肉+生菜前這4點一定要牢記

消化石醫生

2026-05-14 20:25:44

落地的鳳凰不如雞？看離開央視為錢奔波的李思思，康輝的話沒說錯

落地的鳳凰不如雞？看離開央視為錢奔波的李思思，康輝的話沒說錯

草莓信箱

2026-05-14 17:45:55

迄今為止，天安門城樓上只掛過12個人畫像，其中一人僅掛了1天

迄今為止，天安門城樓上只掛過12個人畫像，其中一人僅掛了1天

文史達觀

2025-05-08 12:39:14

遼籃首筆續約！找到高詩巖接班人，場均6.7分，8年熬走兩任教練

遼籃首筆續約！找到高詩巖接班人，場均6.7分，8年熬走兩任教練

體壇大事記

2026-05-14 08:58:39

美軍放下傲慢赴烏克蘭學習無人機技術，俄對烏發起最大規模空襲

美軍放下傲慢赴烏克蘭學習無人機技術，俄對烏發起最大規模空襲

史政先鋒

2026-05-14 11:49:04

日媒：穆帥點名日本中場守田英正，球員被納入皇馬引援名單

日媒：穆帥點名日本中場守田英正，球員被納入皇馬引援名單

懂球帝

2026-05-13 21:34:36

以色列安全部長：需有人告訴亞馬爾，他舉了一個不存在政權的旗幟

以色列安全部長：需有人告訴亞馬爾，他舉了一個不存在政權的旗幟

懂球帝

2026-05-13 20:10:42

醫生發現：老人若開始不吃肥肉，用不了多久，身體或有5大轉變

醫生發現：老人若開始不吃肥肉，用不了多久，身體或有5大轉變

路醫生健康科普

2026-05-14 17:44:41

徐子淇老的不忍直視！和李家誠一起看望楊受成，眼袋重皮膚冒油光

徐子淇老的不忍直視！和李家誠一起看望楊受成，眼袋重皮膚冒油光

小娛樂悠悠

2026-05-13 11:14:18

中美之爭將落幕？現實比想象殘酷：美國并非輸了，是下不了牌桌了

中美之爭將落幕？現實比想象殘酷：美國并非輸了，是下不了牌桌了

觀史搜尋著

2026-05-14 09:06:50

巴薩過分了！客場0-1放水，榜尾8隊差3分，西甲保級亂套了

巴薩過分了！客場0-1放水，榜尾8隊差3分，西甲保級亂套了

體育知多少

2026-05-14 07:36:19

網傳某地事業編欠薪10個月，社保斷繳已鬧上百姓呼聲！

網傳某地事業編欠薪10個月，社保斷繳已鬧上百姓呼聲！

燈錦年

2026-05-13 19:39:30

AI產業主平臺領航智能+時代

15211文章數 66867關注度

往期回顧全部

科技要聞

馬斯克說會談很順利黃仁勛點贊庫克比耶

頭條要聞

老人攜帶170萬"現金"到銀行存款柜員發現全是練功券

頭條要聞

老人攜帶170萬"現金"到銀行存款柜員發現全是練功券

體育要聞

爭議抽象天王山，和季后賽最穩定中鋒

娛樂要聞

何九華官宣當爸！全程不提孩子媽

財經要聞

李強會見美國工商界代表

汽車要聞

雙零重力座椅/AI智能體/調光天幕啟境GT7內飾發布

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

藝術

旅游

本地

房產

教育要聞

網傳西城中考裸分第一？！這所黑馬名校憑什么刷屏家長圈

藝術要聞

美國務卿魯比奧點贊中式美學，實景令人驚嘆！

旅游要聞

自貢第七屆原創短視頻大賽走進大安：不是馬爾代夫去不起，而是“牛爾代夫”更有性價比！

本地新聞

用蘇繡的方式，打開江西婺源

房產要聞

海南樓市新政要出！擬調公積金貸款額度，最高可貸168萬！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<p id="y3y4t"></p>