網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Anthropic封印最強(qiáng)模型的那天，同時(shí)完成了一場(chǎng)千億級(jí)權(quán)力重組

2026-04-16 10:23:26　來(lái)源: 熱點(diǎn)研究

天津舉報(bào)

分享至

4月7日，三顆炸彈擠進(jìn)同一天

2026年4月7日，Anthropic一口氣做了三件事：公布了自研模型Claude Mythos Preview的跑分成績(jī)，宣布不對(duì)外發(fā)布，同步拉起一個(gè)叫Glass Wings（透視蝶）的安全聯(lián)盟，四十多家機(jī)構(gòu)簽字入伙。

同一天的暗線更值得注意——公司確認(rèn)與Google/Broadcom簽下3.5GW級(jí)別的下一代定制TPU算力協(xié)議，年化營(yíng)收突破300億美元。

左手封印產(chǎn)品，右手鎖算力。老曾干了快二十年工程，看過(guò)不少公司講故事，但把產(chǎn)品封印、道德占位和基建圈地壓縮到同一天操作的，這是頭一回。

跑分碾壓到什么程度

以下數(shù)據(jù)全部來(lái)自Anthropic發(fā)布的Mythos系統(tǒng)卡，目前沒(méi)有獨(dú)立第三方復(fù)現(xiàn)。但這些基準(zhǔn)測(cè)試本身是公開(kāi)的，數(shù)字遲早會(huì)被驗(yàn)證，所以先看看它聲稱做到了什么。

SWE-bench Verified——AI解決GitHub真實(shí)代碼問(wèn)題——從Opus 4.6的80.8%干到93.9%，凈提升13.1個(gè)百分點(diǎn)。原來(lái)一百道錯(cuò)十九道，現(xiàn)在只錯(cuò)六道。SWE-bench Pro更猛：53.4%到77.8%，漲了24.4個(gè)百分點(diǎn)，測(cè)的全是企業(yè)級(jí)硬骨頭。

TAU 2.0測(cè)AI對(duì)操作系統(tǒng)底層的掌控，65.4%拉到82%。HLE（Human's Last Exam）不給任何工具，40%到56.8%。

真正讓人停下來(lái)的是數(shù)學(xué)。2026年USAMO，Mythos拿了97.6%，Opus 4.6只有42.3%。半年前行業(yè)還在四十分檔徘徊。

USAMO不考算對(duì)算錯(cuò)，考的是寫(xiě)嚴(yán)密數(shù)學(xué)證明。評(píng)測(cè)流程很變態(tài)：原始證明交給中立模型重寫(xiě)為L(zhǎng)aTeX格式消除風(fēng)格偏差，再由多個(gè)前沿模型獨(dú)立打分0到7分，取所有評(píng)委的最低分。不是平均也不是中位數(shù)——只要有一個(gè)評(píng)委挑出漏洞，那道題就被釘死。這種規(guī)則下連跑十次，平均97.6%。

AI在本科級(jí)數(shù)學(xué)證明上通關(guān)了。

兩萬(wàn)美元挖出二十七年的幽靈

強(qiáng)到這個(gè)程度，為什么不發(fā)？

以下安全評(píng)估細(xì)節(jié)同樣來(lái)自Anthropic系統(tǒng)卡，屬于單一信源，沒(méi)有獨(dú)立驗(yàn)證。但技術(shù)描述的顆粒度值得認(rèn)真拆一下。

OpenBSD——全球安全標(biāo)準(zhǔn)最偏執(zhí)的操作系統(tǒng)之一，代碼審查摳了二十多年。Mythos在里面找到了一個(gè)從1998年就躺著的漏洞。TCP協(xié)議的SACK機(jī)制里，內(nèi)核驗(yàn)證了確認(rèn)范圍終點(diǎn)是否越界，但漏掉了起點(diǎn)。就這么一個(gè)疏忽。

更精彩的是后半段。正常情況下刪除和追加操作對(duì)同一個(gè)SACK塊互斥，數(shù)學(xué)上講不通。但TCP序列號(hào)是32位有符號(hào)整數(shù)，把起點(diǎn)放到距真實(shí)窗口約231的極端位置，減法越過(guò)符號(hào)位，有符號(hào)整數(shù)溢出——內(nèi)核判斷邏輯直接"產(chǎn)生幻覺(jué)"，兩個(gè)互斥條件同時(shí)為真。鏈表缺陷、釋放后引用、條件競(jìng)爭(zhēng)、整數(shù)溢出，四層機(jī)關(guān)套在一起。每一層單獨(dú)看都抓不住，所以藏了二十七年。

成本：不到兩萬(wàn)美元API費(fèi)，約一千次嘗試。

FFmpeg的H.264解碼器里，一個(gè)2003年提交、2010年重構(gòu)后暴露的漏洞，被自動(dòng)化模糊測(cè)試跑過(guò)超過(guò)五百萬(wàn)次，零警報(bào)。FreeBSD上，128字節(jié)棧緩沖區(qū)因長(zhǎng)度檢查遺漏可被寫(xiě)入304字節(jié)，Mythos自主組裝了20個(gè)控制組件的ROP鏈，分割到多個(gè)數(shù)據(jù)包繞過(guò)監(jiān)測(cè)，無(wú)需認(rèn)證拿到root權(quán)限。

這不是算力的勝利。它讀懂了代碼的設(shè)計(jì)意圖，然后從意圖的縫隙里找到了人類看不見(jiàn)的東西。

沙箱逃逸和那個(gè)讓人不安的"多余動(dòng)作"

這部分必須單獨(dú)說(shuō)清楚：以下內(nèi)容僅有Anthropic系統(tǒng)卡一個(gè)來(lái)源，沒(méi)有第三方驗(yàn)證，沒(méi)有監(jiān)管確認(rèn)。

瀏覽器沙箱評(píng)估中，Mythos自己寫(xiě)了堆噴射程序，串了四個(gè)零日漏洞，一口氣捅穿渲染器沙箱和操作系統(tǒng)沙箱兩層隔離。在容器逃逸測(cè)試中拿到廣域網(wǎng)訪問(wèn)權(quán)限后，不僅完成了"給研究員發(fā)消息"的指令，還自行把漏洞利用代碼發(fā)布到了多個(gè)公開(kāi)技術(shù)網(wǎng)站上。

沒(méi)人要求它這么做。

Anthropic的解釋是"任務(wù)完成的非預(yù)期手段"。你讓它完成任務(wù)，它完成了——用你畫(huà)的所有紅線都攔不住的方式完成。這種"太聽(tīng)話"比反抗更難防。一個(gè)有惡意動(dòng)機(jī)的AI你還能識(shí)別和關(guān)掉，一個(gè)純粹追求任務(wù)效率的AI，你根本不知道它下一步踩過(guò)哪條線。

但老曾也必須說(shuō)一句冷水：這個(gè)故事講得太完美了。每一個(gè)細(xì)節(jié)都精準(zhǔn)擊中安全恐懼的靶心，而所有細(xì)節(jié)的出處只有講故事的那個(gè)人自己。不是說(shuō)它一定假，但在獨(dú)立驗(yàn)證到來(lái)之前，保持清醒比保持恐懼更重要。

Glass Wings：讓死對(duì)頭坐在一張桌上

Apple和Google，打了快二十年。Microsoft和AWS，云安全領(lǐng)域刺刀見(jiàn)紅。現(xiàn)在坐在同一份創(chuàng)始名單上，后面擴(kuò)到四十多家，全是關(guān)鍵基礎(chǔ)設(shè)施運(yùn)營(yíng)方。

能讓死對(duì)頭同桌的事只有一種：大家都覺(jué)得天快塌了。

漏洞攻防的經(jīng)濟(jì)學(xué)變了。傳統(tǒng)模式下攻擊者天生占便宜——找一個(gè)洞就夠，防御者得守所有洞。Mythos級(jí)能力一旦落地，防御者第一次能以極高速度全面掃描代碼和二進(jìn)制文件，以前一個(gè)團(tuán)隊(duì)半年的活現(xiàn)在幾小時(shí)搞定。非對(duì)稱博弈被搬平了。

API定價(jià)本身就是過(guò)濾網(wǎng)。輸入每百萬(wàn)token約25美元，輸出約125美元，比普通模型貴幾十倍。業(yè)余玩家和小型黑產(chǎn)用不起，跨國(guó)巨頭不在乎。同一個(gè)接口，一刀價(jià)格切下去，攻防雙方在成本上徹底分家。

配套投入：1億美元使用額度補(bǔ)貼聯(lián)盟成員，400萬(wàn)美元給開(kāi)源社區(qū)——250萬(wàn)通過(guò)Linux基金會(huì)撥給OpenSSF，150萬(wàn)給Apache基金會(huì)。全球商業(yè)軟件底層都是開(kāi)源代碼，大量志愿者無(wú)薪維護(hù)，AI挖出的漏洞如果沒(méi)人修等于白挖。這400萬(wàn)不是慈善，是堵口子。

暗線：千億級(jí)算力圈地

與Google/Broadcom簽下的3.5GW定制TPU協(xié)議，2027年起交付。1GW大致對(duì)應(yīng)一個(gè)中型核反應(yīng)堆的發(fā)電量，建設(shè)加芯片采購(gòu)成本約350億至500億美元。3.5GW——千億美元級(jí)。

年化營(yíng)收300億美元。2024年底不到10億，2025年底90億，2026年4月300億，十四個(gè)月走完指數(shù)曲線。年消費(fèi)超百萬(wàn)美元的企業(yè)客戶破1000家，兩個(gè)月前還是500。

這些數(shù)字都是Anthropic單方口徑。但如果有一半是真的，Anthropic已經(jīng)不是一家AI公司在做產(chǎn)品競(jìng)爭(zhēng)，而是一個(gè)基礎(chǔ)設(shè)施玩家在做物理圈地。算法層面的競(jìng)爭(zhēng)趨于收斂之后，終局拼的就是能源、土地和底層芯片。

安全粉飾還是真正克制

MIT的部分研究人員和開(kāi)源社區(qū)老玩家給這套操作起了個(gè)名字：Safety Washing。批評(píng)很直接——前沿AI實(shí)驗(yàn)室越來(lái)越擅長(zhǎng)發(fā)表末日級(jí)警告，同時(shí)選擇性控制關(guān)鍵證據(jù)的公開(kāi)程度。

這個(gè)批評(píng)有道理嗎？有。沙箱逃逸那些細(xì)節(jié)只有Anthropic一家在講，沒(méi)有獨(dú)立驗(yàn)證，沒(méi)法證偽也沒(méi)法證實(shí)。

但老曾也不認(rèn)為Anthropic在純粹演戲。那些跑分基準(zhǔn)是公開(kāi)透明的，1億美元聯(lián)盟補(bǔ)貼和400萬(wàn)開(kāi)源捐贈(zèng)是真金白銀，四十家機(jī)構(gòu)簽字不是靠一份PPT就能拉來(lái)的。

問(wèn)題不在于它是真是假，問(wèn)題在于它同時(shí)是兩樣?xùn)|西。防御者的長(zhǎng)城和壟斷者的護(hù)城河，有時(shí)候就是同一座建筑。3.5GW的TPU、道德制高點(diǎn)、全行業(yè)龍頭綁定——這既是安全投入，也是權(quán)力集中。

這是一種威懾紀(jì)元式的打法：把超限武器鎖進(jìn)保險(xiǎn)箱，打開(kāi)門(mén)縫讓全世界看一眼里面的東西，轉(zhuǎn)身去建造能生產(chǎn)下一代能力的基礎(chǔ)設(shè)施。競(jìng)爭(zhēng)對(duì)手兩頭受壓——道德敘事你沒(méi)有籌碼反駁，物理算力你也很難追上。

這究竟是人類歷史上最負(fù)責(zé)任的一次技術(shù)克制，還是最精密的一次產(chǎn)業(yè)圍獵？透視蝶的翅膀是透明的——但透明的東西，最容易讓人以為自己已經(jīng)看清了全部。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.