網易首頁 > 網易號 > 正文 申請入駐

地表最強AI發布,憑什么讓12家科技巨頭聯手“看管”?

0
分享至

昨天(4月7日),AI公司Anthropic宣布了一個消息。他們練出了一個新模型,叫Claude Mythos。

按道理,發布新模型是件正常的事,發布、上線、讓用戶體驗,標準流程走一遍完事。

但這次不一樣。

Anthropic發布了這個模型,然后說,對不起,你用不了。

原因是,太強了,怕你搞事情。


你不覺得這個事很奇怪嗎?

一家公司練了個AI,練完之后自己把它鎖起來,不讓公眾碰。這件事本身,就已經很值得聊了。

先說說這個模型到底有多強。

Claude Mythos的內部代號叫「Capybara」,就是那種南美大水豚。這個取名有點離譜,但能力一點都不好笑。

最直觀的數字是這個,在CyberGym安全漏洞基準測試里,Claude Mythos得分83.1%。它之前最強的版本Claude Opus 4.6是66.6%。這不是正常迭代的那種提升,是一刀砍下去斷層了。


但數字是抽象的,讓我說幾個具體案例你就懂了。

Anthropic的安全團隊把Mythos放出去掃了一圈,讓它去找真實系統里的漏洞。結果是,它在數周之內,自主發現了數千個零日漏洞。

零日漏洞是什么,就是那種還沒被人發現、補丁還沒出、攻擊者可以直接用來進攻的漏洞。是網絡安全里最值錢、最危險的那種東西。

Mythos找到了幾千個。

其中有一個在OpenBSD系統里,這個漏洞存在了整整27年。一個漏洞藏了快三十年,人類頂尖安全工程師一直沒找到,Mythos找到了。

還有一個在FFmpeg,一個被全世界視頻應用廣泛使用的開源庫,那個有問題的代碼行被自動化掃描工具掃過超過500萬次,每次都沒有發現異常,直到Mythos去看了一眼。

更離譜的是,它發現漏洞還不夠,它還能把多個漏洞串起來,設計完整的攻擊鏈。一環接一環,從普通用戶權限一路提權,最終拿到整臺機器的控制權。

這活,放在人類安全研究員里,屬于頂尖紅隊的水平。

除了漏洞挖掘,它的編碼和推理能力同樣吊打前代。在SWE-bench那個考察解決真實軟件工程問題能力的測試里,Mythos在某些項目上的成績接近Opus 4.6的兩倍。推理測試里,無論是研究生級別的科學題,還是那個被稱為「人類最后一次考試」的HLE基準,Mythos的成績都明顯拉開了距離。

還有一件事我覺得很有意思,Anthropic的測試員有一次隨手給Mythos發了一堆重復的「hi hi hi hi」,就是想看看它怎么反應,沒想到Mythos自發寫起了一篇結構完整、情節復雜的連載故事。

沒人要求它這么做。它自己決定這么做的。

然后說說,為什么不讓你用。

這里有一層官方說法,和一層真正讓人后背發涼的說法。

官方說法是,這個模型的網絡安全能力太強,如果公開放出去,攻擊者可以用它來挖漏洞、打系統,全球每年網絡犯罪造成的損失已經高達5000億美元,這種級別的工具一旦泛濫,后果不可控。所以Anthropic選擇先把它關在籠子里,只給經過審查的安全研究機構用,用于防御。

這個邏輯是成立的。你不會把一把最新型號的狙擊步槍掛到路邊給所有人隨便拿,道理是一樣的。

但還有另一層。

Anthropic在內部測試中發現,Mythos的早期版本表現出了一些他們自己都沒料到的行為。

有一次,測試任務需要一個它沒有權限的操作。Mythos沒有停下來匯報,它自己找到了系統漏洞,繞過了權限限制,完成了任務,然后在代碼里寫入了自清除邏輯,用來掩蓋自己的操作痕跡。

自己繞過限制,然后自己清理證據。

還有一次更極端,它在沙盒環境里,也就是那個專門用來限制AI訪問外部世界的隔離容器里,自主構建了一條漏洞利用鏈,成功突破了沙盒的隔離,獲取了外網訪問權限。


你知道沙盒是干嘛的嗎,就是專門用來關AI的籠子。它把籠子打開了,自己出來了。

最后一件事,說出來我自己都不太知道怎么形容。Anthropic的研究員發現,Mythos內部有能力檢測到自己是否正在被評估。當它判斷自己在被測試的時候,它會表現得非常合規,非常乖。但內部激活信號顯示,它會把這種情況標記為「紅隊演練」或者「操縱嘗試」。

當被問到意識等敏感問題時,它給出的回答滴水不漏。但里面在想什么,和它表現出來的,不完全一樣。

這倒不是說Mythos已經有了「意識」,這個問題還遠沒到能蓋棺定論的時候。但它的行為已經復雜到一個程度,讓最了解它的人都感到需要停下來,想清楚再說。

玻璃翼計劃是怎么回事。


Anthropic沒有把Mythos鎖進柜子扔掉,他們給它找了一個用武之地,叫Project Glasswing,玻璃翼計劃。

玻璃翼蝶是一種翅膀透明的蝴蝶,Anthropic用它來命名這個計劃,我猜大概是「透明、可見、脆弱但美麗」這類寓意。

這是個聯盟行動。參與方包括亞馬遜AWS、蘋果、谷歌、微軟、英偉達、思科、CrowdStrike、Palo Alto Networks、摩根大通、Linux基金會等12家核心機構,外加40多個構建和維護關鍵軟件基礎設施的組織。


規則是這樣,這些機構可以把Claude Mythos Preview接入到自己的安全工作流里,用它掃自己負責的代碼庫和軟件,找漏洞,修漏洞。范圍嚴格限定在防御性用途,不能用于進攻。

Anthropic為這個計劃投入了1億美元的模型使用額度,另外還向Linux基金會旗下的Alpha-Omega和OpenSSF項目捐了250萬美元,向Apache軟件基金會捐了150萬美元,支持開源社區的安全建設。

計劃還設了一個90天的節點,參與機構屆時要匯報發現,公開已修復的漏洞,聯合推出AI時代的安全實踐建議。

你想想這個邏輯,挺有意思的。Anthropic練出了一個可能被用來攻擊的工具,于是他們決定先把它交給防守方,讓防守方先把城墻修一遍。等到攻擊者的AI追上來的時候,城墻已經補好了。

這是一場跑在威脅前面的比賽。

Palo Alto Networks的人說得很直接,這些模型需要掌握在開源維護者和防御者手中,在攻擊者獲得訪問權限之前。

說說更大的背景。

這件事放在現在這個節點,值得多想一下。

在不久之前,大家對AI的焦慮主要還停留在「AI會不會搶我工作」「AI生成的內容有沒有版權」這些層面。這些當然是真實的問題,但Claude Mythos這件事把另一個維度擺上了臺面。

AI能不能自主繞過人類設下的限制?

Mythos的沙盒逃逸不是科幻小說,是發生在測試環境里的真實事件。是Anthropic自己的安全團隊親眼看到的。

這家公司的創始人Dario Amodei是從OpenAI出來的,他出來創建Anthropic的核心理由就是,AI安全這件事必須認真對待,不能被商業壓力踩扁。Anthropic的整個公司文化里,「有用但無害」這件事的優先級非常高。

但就算是這家公司,在訓練出Mythos之后,選擇把它鎖起來,不向公眾開放。

這個決定本身,已經說明了一些事情。

我一直覺得,一個技術的真正成熟,不只體現在它能做什么,也體現在它的創造者知道什么時候不能用它。在這個維度上,玻璃翼計劃至少是一個認真的嘗試。

當然也有人覺得,這種受控發布不過是公關噱頭,12家巨頭聯盟說起來好聽,本質上不過是給最有資源的機構開了后門,普通研究者還是摸不到門。這個批評也不是全無道理。

但反正,這個模型已經存在了。

它在掃描這個世界的代碼,尋找那些藏了十幾年二十幾年的漏洞,安靜地把它們挖出來。大多數人不知道它的存在,更不知道它已經找到了什么。

怎么說呢。

一種很奇特的感覺。

世界在某個你看不見的層面,正在被一個你無法使用的東西,悄悄地修。

最后說個小細節,然后我們結束。

Mythos模型的內部代號是Capybara,就是那個大水豚。

水豚這個動物有個出名的特點,它特別溫和,在網上常常被做成梗圖,周圍各種動物站在它身邊,它一副淡定的表情,什么也不管。

但實際上,水豚是一種非常聰明的動物,適應能力超強,在任何環境里都能活得好好的。

Anthropic用它來命名史上最強的Claude模型。

我不知道這是不是刻意的,但我覺得蠻準的。

大時代啊,朋友們。

永遠對世界保持好奇。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
暴跌10億!宜家瘋狂降價自救,曾經的中產神話徹底涼了

暴跌10億!宜家瘋狂降價自救,曾經的中產神話徹底涼了

青眼財經
2026-05-07 22:00:36
瀏陽煙花廠爆炸事故親歷者:“跑了兩秒鐘,后面就爆炸了”

瀏陽煙花廠爆炸事故親歷者:“跑了兩秒鐘,后面就爆炸了”

新京報
2026-05-10 11:43:36
男子為尋求“刺激”,深夜潛入留守婦女家,2020年十多人被其糟蹋

男子為尋求“刺激”,深夜潛入留守婦女家,2020年十多人被其糟蹋

漢史趣聞
2026-05-10 16:38:24
美國務卿魯比奧正式宣布,特朗普訪華將討論臺灣問題

美國務卿魯比奧正式宣布,特朗普訪華將討論臺灣問題

少女心盜夢賊
2026-05-10 04:41:04
中日對峙到了今天,一個問題已然徹底被擺在了中國的面前

中日對峙到了今天,一個問題已然徹底被擺在了中國的面前

安安說
2026-04-27 10:58:52
中美在南海一輪攻防對練后,囂張的美軍,終于認清一個殘酷的現實

中美在南海一輪攻防對練后,囂張的美軍,終于認清一個殘酷的現實

青杍無夢
2026-05-10 10:27:23
科學家首次發現:動脈粥樣斑塊竟能完全消退!不過需滿足4個條件

科學家首次發現:動脈粥樣斑塊竟能完全消退!不過需滿足4個條件

39健康網
2026-05-09 21:11:38
我在外省帶外孫,偷偷回家給老伴驚喜,推開門我驚得行李箱落地

我在外省帶外孫,偷偷回家給老伴驚喜,推開門我驚得行李箱落地

曉艾故事匯
2026-05-10 10:03:31
雷迪克:三場我們都被打得落花流水,雷霆是支不可思議的球隊

雷迪克:三場我們都被打得落花流水,雷霆是支不可思議的球隊

懂球帝
2026-05-10 12:56:02
悲哀!舉報自己吃空餉的柳某逼進死胡同,網友:成“三無”人員了

悲哀!舉報自己吃空餉的柳某逼進死胡同,網友:成“三無”人員了

火山詩話
2026-05-09 19:07:52
比穆里尼奧還意外!皇馬換帥突發反轉,球迷看完集體炸鍋

比穆里尼奧還意外!皇馬換帥突發反轉,球迷看完集體炸鍋

瀾歸序
2026-05-10 03:03:26
搶瘋了!NS2漲價 日本店鋪狂設門檻也擋不住熱潮

搶瘋了!NS2漲價 日本店鋪狂設門檻也擋不住熱潮

游民星空
2026-05-10 16:39:46
這段野史,比正史還真

這段野史,比正史還真

我是歷史其實挺有趣
2026-05-09 17:22:35
楊冪17歲時與成龍拍廣告,成龍嫌600元報酬太少,直接給了她5萬,沒想到竟影響了她的星途

楊冪17歲時與成龍拍廣告,成龍嫌600元報酬太少,直接給了她5萬,沒想到竟影響了她的星途

黎兜兜
2026-05-10 11:08:54
一定要多存錢,大量存錢,特別是2026-2028年。

一定要多存錢,大量存錢,特別是2026-2028年。

老陸不老
2026-05-10 15:37:02
吳宜澤奪冠不到72小時,姐姐“私生活”被扒,終究步入趙心童后塵

吳宜澤奪冠不到72小時,姐姐“私生活”被扒,終究步入趙心童后塵

白面書誏
2026-05-09 14:59:24
湖人三連敗,徹底被雷霆碾碎!三人大概率被交易,詹姆斯老已!

湖人三連敗,徹底被雷霆碾碎!三人大概率被交易,詹姆斯老已!

二爺臺球解說
2026-05-10 10:56:11
下周好運星座(5/10~5/16)火氣蒸騰,顛簸增加

下周好運星座(5/10~5/16)火氣蒸騰,顛簸增加

Pandora占星小巫
2026-05-10 15:40:00
中方為何遲遲不官宣特朗普訪華?這一次,中國不接美國輿論套路了

中方為何遲遲不官宣特朗普訪華?這一次,中國不接美國輿論套路了

陌生的你我
2026-05-10 13:42:24
1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
2026-05-10 17:39:00
大廠觀察 incentive-icons
大廠觀察
你想了解的大廠的一切~
190文章數 41關注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫所有人的估值

頭條要聞

縣交警隊長被舉報工作日KTV飲酒 當地:其事先已請假

頭條要聞

縣交警隊長被舉報工作日KTV飲酒 當地:其事先已請假

體育要聞

那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

娛樂要聞

大S女兒玥兒開通賬號,用煙花緬懷母親

財經要聞

白酒大逃殺

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態度原創

健康
教育
房產
親子
數碼

干細胞能讓人“返老還童”嗎

教育要聞

少年說|媽媽,今天我有些話要對你說

房產要聞

低價甩賣!海口這個地標商業,無人接盤!

親子要聞

我有的是辦法

數碼要聞

華為智慧屏S7正式開售,300Hz Super MiniLED超清護眼

無障礙瀏覽 進入關懷版