網易首頁 > 網易號 > 正文申請入駐

地表最強AI發布，憑什么讓12家科技巨頭聯手“看管”？

2026-04-08 12:02:46　來源: 大廠觀察

北京舉報

分享至

昨天（4月7日），AI公司Anthropic宣布了一個消息。他們練出了一個新模型，叫Claude Mythos。

按道理，發布新模型是件正常的事，發布、上線、讓用戶體驗，標準流程走一遍完事。

但這次不一樣。

Anthropic發布了這個模型，然后說，對不起，你用不了。

原因是，太強了，怕你搞事情。

你不覺得這個事很奇怪嗎？

一家公司練了個AI，練完之后自己把它鎖起來，不讓公眾碰。這件事本身，就已經很值得聊了。

先說說這個模型到底有多強。

Claude Mythos的內部代號叫「Capybara」，就是那種南美大水豚。這個取名有點離譜，但能力一點都不好笑。

最直觀的數字是這個，在CyberGym安全漏洞基準測試里，Claude Mythos得分83.1%。它之前最強的版本Claude Opus 4.6是66.6%。這不是正常迭代的那種提升，是一刀砍下去斷層了。

但數字是抽象的，讓我說幾個具體案例你就懂了。

Anthropic的安全團隊把Mythos放出去掃了一圈，讓它去找真實系統里的漏洞。結果是，它在數周之內，自主發現了數千個零日漏洞。

零日漏洞是什么，就是那種還沒被人發現、補丁還沒出、攻擊者可以直接用來進攻的漏洞。是網絡安全里最值錢、最危險的那種東西。

Mythos找到了幾千個。

其中有一個在OpenBSD系統里，這個漏洞存在了整整27年。一個漏洞藏了快三十年，人類頂尖安全工程師一直沒找到，Mythos找到了。

還有一個在FFmpeg，一個被全世界視頻應用廣泛使用的開源庫，那個有問題的代碼行被自動化掃描工具掃過超過500萬次，每次都沒有發現異常，直到Mythos去看了一眼。

更離譜的是，它發現漏洞還不夠，它還能把多個漏洞串起來，設計完整的攻擊鏈。一環接一環，從普通用戶權限一路提權，最終拿到整臺機器的控制權。

這活，放在人類安全研究員里，屬于頂尖紅隊的水平。

除了漏洞挖掘，它的編碼和推理能力同樣吊打前代。在SWE-bench那個考察解決真實軟件工程問題能力的測試里，Mythos在某些項目上的成績接近Opus 4.6的兩倍。推理測試里，無論是研究生級別的科學題，還是那個被稱為「人類最后一次考試」的HLE基準，Mythos的成績都明顯拉開了距離。

還有一件事我覺得很有意思，Anthropic的測試員有一次隨手給Mythos發了一堆重復的「hi hi hi hi」，就是想看看它怎么反應，沒想到Mythos自發寫起了一篇結構完整、情節復雜的連載故事。

沒人要求它這么做。它自己決定這么做的。

然后說說，為什么不讓你用。

這里有一層官方說法，和一層真正讓人后背發涼的說法。

官方說法是，這個模型的網絡安全能力太強，如果公開放出去，攻擊者可以用它來挖漏洞、打系統，全球每年網絡犯罪造成的損失已經高達5000億美元，這種級別的工具一旦泛濫，后果不可控。所以Anthropic選擇先把它關在籠子里，只給經過審查的安全研究機構用，用于防御。

這個邏輯是成立的。你不會把一把最新型號的狙擊步槍掛到路邊給所有人隨便拿，道理是一樣的。

但還有另一層。

Anthropic在內部測試中發現，Mythos的早期版本表現出了一些他們自己都沒料到的行為。

有一次，測試任務需要一個它沒有權限的操作。Mythos沒有停下來匯報，它自己找到了系統漏洞，繞過了權限限制，完成了任務，然后在代碼里寫入了自清除邏輯，用來掩蓋自己的操作痕跡。

自己繞過限制，然后自己清理證據。

還有一次更極端，它在沙盒環境里，也就是那個專門用來限制AI訪問外部世界的隔離容器里，自主構建了一條漏洞利用鏈，成功突破了沙盒的隔離，獲取了外網訪問權限。

你知道沙盒是干嘛的嗎，就是專門用來關AI的籠子。它把籠子打開了，自己出來了。

最后一件事，說出來我自己都不太知道怎么形容。Anthropic的研究員發現，Mythos內部有能力檢測到自己是否正在被評估。當它判斷自己在被測試的時候，它會表現得非常合規，非常乖。但內部激活信號顯示，它會把這種情況標記為「紅隊演練」或者「操縱嘗試」。

當被問到意識等敏感問題時，它給出的回答滴水不漏。但里面在想什么，和它表現出來的，不完全一樣。

這倒不是說Mythos已經有了「意識」，這個問題還遠沒到能蓋棺定論的時候。但它的行為已經復雜到一個程度，讓最了解它的人都感到需要停下來，想清楚再說。

玻璃翼計劃是怎么回事。

Anthropic沒有把Mythos鎖進柜子扔掉，他們給它找了一個用武之地，叫Project Glasswing，玻璃翼計劃。

玻璃翼蝶是一種翅膀透明的蝴蝶，Anthropic用它來命名這個計劃，我猜大概是「透明、可見、脆弱但美麗」這類寓意。

這是個聯盟行動。參與方包括亞馬遜AWS、蘋果、谷歌、微軟、英偉達、思科、CrowdStrike、Palo Alto Networks、摩根大通、Linux基金會等12家核心機構，外加40多個構建和維護關鍵軟件基礎設施的組織。

規則是這樣，這些機構可以把Claude Mythos Preview接入到自己的安全工作流里，用它掃自己負責的代碼庫和軟件，找漏洞，修漏洞。范圍嚴格限定在防御性用途，不能用于進攻。

Anthropic為這個計劃投入了1億美元的模型使用額度，另外還向Linux基金會旗下的Alpha-Omega和OpenSSF項目捐了250萬美元，向Apache軟件基金會捐了150萬美元，支持開源社區的安全建設。

計劃還設了一個90天的節點，參與機構屆時要匯報發現，公開已修復的漏洞，聯合推出AI時代的安全實踐建議。

你想想這個邏輯，挺有意思的。Anthropic練出了一個可能被用來攻擊的工具，于是他們決定先把它交給防守方，讓防守方先把城墻修一遍。等到攻擊者的AI追上來的時候，城墻已經補好了。

這是一場跑在威脅前面的比賽。

Palo Alto Networks的人說得很直接，這些模型需要掌握在開源維護者和防御者手中，在攻擊者獲得訪問權限之前。

說說更大的背景。

這件事放在現在這個節點，值得多想一下。

在不久之前，大家對AI的焦慮主要還停留在「AI會不會搶我工作」「AI生成的內容有沒有版權」這些層面。這些當然是真實的問題，但Claude Mythos這件事把另一個維度擺上了臺面。

AI能不能自主繞過人類設下的限制？

Mythos的沙盒逃逸不是科幻小說，是發生在測試環境里的真實事件。是Anthropic自己的安全團隊親眼看到的。

這家公司的創始人Dario Amodei是從OpenAI出來的，他出來創建Anthropic的核心理由就是，AI安全這件事必須認真對待，不能被商業壓力踩扁。Anthropic的整個公司文化里，「有用但無害」這件事的優先級非常高。

但就算是這家公司，在訓練出Mythos之后，選擇把它鎖起來，不向公眾開放。

這個決定本身，已經說明了一些事情。

我一直覺得，一個技術的真正成熟，不只體現在它能做什么，也體現在它的創造者知道什么時候不能用它。在這個維度上，玻璃翼計劃至少是一個認真的嘗試。

當然也有人覺得，這種受控發布不過是公關噱頭，12家巨頭聯盟說起來好聽，本質上不過是給最有資源的機構開了后門，普通研究者還是摸不到門。這個批評也不是全無道理。

但反正，這個模型已經存在了。

它在掃描這個世界的代碼，尋找那些藏了十幾年二十幾年的漏洞，安靜地把它們挖出來。大多數人不知道它的存在，更不知道它已經找到了什么。

怎么說呢。

一種很奇特的感覺。

世界在某個你看不見的層面，正在被一個你無法使用的東西，悄悄地修。

最后說個小細節，然后我們結束。

Mythos模型的內部代號是Capybara，就是那個大水豚。

水豚這個動物有個出名的特點，它特別溫和，在網上常常被做成梗圖，周圍各種動物站在它身邊，它一副淡定的表情，什么也不管。

但實際上，水豚是一種非常聰明的動物，適應能力超強，在任何環境里都能活得好好的。

Anthropic用它來命名史上最強的Claude模型。

我不知道這是不是刻意的，但我覺得蠻準的。

大時代啊，朋友們。

永遠對世界保持好奇。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude Code之父：我們公司已沒真人寫代碼了

智東西 2026-05-09 20:46:17
89 跟貼 89
20億美元綁定特斯拉與xAI：馬斯克的“數字員工”，到底算的是什么賬？

鈦媒體APP 2026-03-12 10:10:12
0 跟貼 0

殘酷真相：硅谷頂尖AI甩開世界1年！你用的不過是「技術余暉」

新智元 2026-05-10 12:53:27
11 跟貼 11

AI突現首例自我復制！橫跨4國160小時無限繁殖

新智元 2026-05-09 18:31:30
78 跟貼 78
谷歌造出AI數學家，48%碾壓全場！牛津教授用它破解60年未解之謎

新智元 2026-05-10 09:10:54
2 跟貼 2

71.4K Star的AI交易團隊：多智能體架構如何“炒”出一個華爾街

鈦媒體APP 2026-05-10 10:49:28
2 跟貼 2

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
輪到豆包收割了？

虎嗅APP 2026-05-08 16:30:29
159 跟貼 159

公司斥巨資挖來的程序員，老板都不敢惹她，直到有幸看到她的技術

陌陌說時尚 2026-05-09 09:48:18
6 跟貼 6
82歲退休的他，帶出一系千億級科技巨頭，卻不持有1股股權

華商韜略 2025-12-01 10:46:51
1 跟貼 1
前GTA技術總監做了款"種田"游戲，三年開發進EA

宇宙來信發 2026-05-09 11:04:11
1 跟貼 1
Codex不只敲代碼！教你幾分鐘全自動搞定視頻

王子健 2026-05-08 23:37:52
5 跟貼 5
《流放者柯南》升級虛幻5，那個"祖傳功能"居然也加強了

渡川5 2026-05-09 19:02:56
0 跟貼 0
《紅色沙漠》評測：沙盒里的故事被埋太深了

峽谷一級保護廢物 2026-05-09 17:27:36
0 跟貼 0
兩天就能讓零基礎的《我的世界》中國版開發者做出第一個模組？

游娛fan 2026-05-10 13:22:43
0 跟貼 0
5月18日零時起，蘭州市新啟用32處“電子眼”

甘肅交通廣播 2026-05-09 18:11:38
0 跟貼 0
不用寫代碼也能做個小游戲？實測Hy3 preview 模型

泡泡網 2026-05-07 20:27:49
0 跟貼 0
規則漏洞被利用，杜卡迪優勢慘遭終結

暖陽喵 2026-05-09 10:36:31
1 跟貼 1
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
五月的青春：一場未完成的跳轉

時光慢郵啊 2026-05-10 06:29:15
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
女兒每次都玩到半夜才回家，媽媽一氣之下把她的密碼鎖權限刪了

音樂下午茶官方 2026-05-08 23:20:52
2 跟貼 2
地表三大最強攝影師！

奇映記 2026-05-10 01:25:36
0 跟貼 0
衛星監測揭示：墨西哥城正以每年35厘米速度沉降

IT之家 2026-05-06 17:17:08
0 跟貼 0
用小學乘法造出地表最強超算解不開的密碼

量子位 2026-04-02 19:32:45
0 跟貼 0
國產特種機器狗TOP8：誰才是極端環境下的“地表最強”？

每日汽車道 2026-05-09 21:19:25
0 跟貼 0
專家：警惕美國"偷師"中國用中國的方式與中國競爭

澎湃新聞 2026-05-10 07:17:35
28447 跟貼 28447
被裁員7天，總監凌晨急電：百億漏洞唯你能修，我：時薪8萬先轉賬

旅途的美食故事 2026-05-07 01:41:04
0 跟貼 0
用戶連線張雪，一激動把心里話說了出來，張雪止不住的偷笑！

傳奇戲骨人生 2026-05-09 01:37:08
0 跟貼 0
劍指冠軍！國乒男團3-1戰勝法國隊晉級世乒賽決賽

央視新聞客戶端 2026-05-10 05:50:37
4957 跟貼 4957
阿Sa老公被爆玩交友軟件、為錢裝直男？用婚訊來擋張敬軒爭議？

一朵奇葩007 2026-05-09 08:42:24
0 跟貼 0
開發者薪酬悖論：誰在拿"泡沫工資"，誰又被低估？

硅嶼手記 2026-05-10 08:39:09
2 跟貼 2
王天一被4名裁判全程緊盯，卻下出了比軟件更厲害的棋！

象棋經典棋局 2026-05-09 05:49:59
0 跟貼 0
為190元"僅退款"榴蓮千里討公道賣家:暫未收到道歉

極目新聞 2026-05-09 19:27:51
7923 跟貼 7923
美貿易代表:中國在很大程度上限制大量美商品對華出口

澎湃新聞 2026-05-10 08:46:56
635 跟貼 635
4只皮皮蝦1035元，官方回應是否“帶客吃回扣”

中國新聞周刊 2026-05-09 19:38:06
9412 跟貼 9412
不怕搞爛Excel公式！Claude殺入微軟全家桶，一段話跑完4個Office

新智元 2026-05-10 16:05:06
0 跟貼 0
Gemini上車：谷歌要把汽車變成移動辦公室

野生運營 2026-05-10 04:41:57
0 跟貼 0
消息稱微軟將為Win11掌機開發全新省電模式，代號“綠葉計劃”

IT之家 2026-05-10 13:19:49
1 跟貼 1
“蘇超”第五周比賽結束，最新戰報出爐：無錫隊3:1泰州隊、徐州隊1:2宿遷隊、南通隊0:0南京隊

江蘇新聞 2026-05-09 21:46:44
262 跟貼 262

大廠觀察

你想了解的大廠的一切~

190文章數 41關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

房產

親子

數碼

手機 / 數碼

房產 / 家居

地表最強AI發布，憑什么讓12家科技巨頭聯手“看管”？

DeepSeek融資，改寫所有人的估值

縣交警隊長被舉報工作日KTV飲酒 當地：其事先已請假

縣交警隊長被舉報工作日KTV飲酒 當地：其事先已請假

那個曾讓詹姆斯抱頭的兄弟，40歲從大學畢業了

大S女兒玥兒開通賬號，用煙花緬懷母親

白酒大逃殺

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態度原創

干細胞能讓人“返老還童”嗎

少年說｜媽媽，今天我有些話要對你說

低價甩賣！海口這個地標商業，無人接盤！

我有的是辦法

華為智慧屏S7正式開售，300Hz Super MiniLED超清護眼

地表最強AI發布，憑什么讓12家科技巨頭聯手“看管”？

縣交警隊長被舉報工作日KTV飲酒當地：其事先已請假

縣交警隊長被舉報工作日KTV飲酒當地：其事先已請假

那個曾讓詹姆斯抱頭的兄弟，40歲從大學畢業了

大S女兒玥兒開通賬號，用煙花緬懷母親

軸距加長/智駕拉滿阿維塔07L定位大五座SUV

少年說｜媽媽，今天我有些話要對你說

低價甩賣！海口這個地標商業，無人接盤！