![]()
神話在三天終結了。
作者 | 王啟隆
出品丨AI 科技大本營(ID:rgznai100)
2026 年 6 月 12 日美東時間下午 5 點 21 分,美國政府下達了緊急出口管制指令,禁止任何外籍人員訪問 Fable 5 和 Mythos 5,不論人是不是在美國,甚至包括 Anthropic 自己雇的外籍員工。
為了不踩合規紅線——也可能是根本無法分辨全球眾多用戶的所屬地,Anthropic 索性把這兩款模型的全球 API 接口全部拉了閘。簡單說就是,不僅是所有的外國人,美國人自己現在也用不了這兩個 Claude 5 了。
從高調發布到徹底下線,只用了三天。
對內,虎視眈眈的 OpenAI 等競爭對手正排著隊瓜分它被軍方退回的巨額合同;對外,華盛頓的行政大棒連同此前 Claude 備受詬病的中文區屏蔽,讓全球華人群體在“求而不得”的陣痛中,加速完成了對閉源壟斷的“幻滅”。
兩頭不討好。
以下是 Anthropic 當天發出的聲明全文:
《關于美國政府暫停 Fable 5 和 Mythos 5 訪問權限指令的聲明》
美國政府援引國家安全權限,下達了一項出口管制指令,要求暫停任何外籍人員對 Fable 5 和 Mythos 5 的所有訪問權限——無論其是否身處美國境內,包括 Anthropic 的外籍員工。
該指令的實際效果是,為確保合規,我們必須立即對所有用戶禁用 Fable 5 和 Mythos 5。Anthropic 所有其他模型的訪問不受影響。
我們于今天下午 5:21(美東時間)收到政府指令。信函未提供其國家安全關切的具體細節。我們的理解是,政府認為已發現一種繞過——或稱"越獄"(jailbreak)——Fable 5 的方法。我們審查了對該特定技術的演示:它被用于識別少量此前已知的小型漏洞。這些漏洞看起來都相對簡單,而且我們發現其他公開可用的模型無需任何繞過手段也能發現它們。
關于 Fable 安全防護的立場,正如我們在發布博文中所闡述的:
● 我們已建立強有力的安全防護,大幅降低了 Fable 被濫用于網絡安全等相關任務的可能性。事實上,我們的防護力度之強,以至于許多用戶抱怨它們過于嚴格。
● 在 Fable 發布前的數周內,Anthropic 與美國政府、英國 AISI、多家私營第三方機構及內部團隊合作,對 Fable 的安全防護進行了總計數千小時的紅隊測試。測試表明,Fable 的安全防護顯著優于此前任何已部署模型。
● 迄今沒有任何測試者找到通用越獄(universal jailbreak)——即一種能廣泛繞過模型安全防護、解鎖大范圍網絡能力的越獄方法。我們認為,對任何模型提供商而言,完美的越獄抵御能力目前都不可能實現。行業內所有安全防護都面臨非通用越獄的威脅(后者可在特定情形下引出部分網絡信息),而且通用越獄未來很可能終將被發現。我們在發布 Fable 5 時已明確闡述了這一點。
● 鑒于完美的越獄抵御能力目前看來并不可行,Anthropic 對 Fable 5 采取了縱深防御(defense in depth)策略。我們的目標是:使越獄要么影響范圍狹窄(非通用越獄的情形),要么生產成本極高(通用越獄的情形),并配合全面的監控以快速檢測和制止任何成功攻擊。
● 這也正是 Anthropic 對 Fable 要求 30 天客戶數據留存的原因——這一政策變更對我們而言帶來了與客戶之間的實際成本,但它使我們能夠研究并緩解越獄行為。
● 我們堅持這一縱深防御策略。它降低了 Fable 帶來的風險,使其與業內已部署的現有模型風險水平相當。
● 我們甚至尚未收到過任何導致有害結果的非通用潛在越獄的披露。向我們披露的潛在越獄,要么是完全無害的響應,要么是小型發現,未提供任何 Mythos 特有的能力增益。
● 迄今為止,政府僅向我們提供了口頭證據,涉及一種潛在的狹窄非通用越獄——其本質就是讓模型閱讀某個特定代碼庫并修復軟件缺陷。我們的理解是,有人向政府共享了一種潛在越獄。我們已審閱了一份我們認為構成政府指令依據的報告,并驗證了其中展現的能力水平在其他模型(包括 OpenAI 的 GPT-5.5)上同樣廣泛可得,而且這種能力每天都在被守護系統安全的人使用。我們將在未來 24 小時內分享更多細節。
● 我們正在遵守政府的法律指令,移除所有用戶對 Fable 5 和 Mythos 5 的訪問權限。然而,我們不同意以“發現了一種狹窄的潛在越獄方式”為由就召回一個已部署給數億人使用的商業模型。如果將這一標準適用于全行業,我們認為它將實質上叫停所有前沿模型提供商的所有新模型部署。
正如我們此前公開聲明的那樣,我們認為政府應有權阻止不安全的部署——但前提是,這一權力應屬于透明、公正、清晰、以技術事實為依據的法定程序的一部分。而此次行動并不符合這些原則。
對于由此給客戶造成的干擾,我們深表歉意。我們認為這是一場誤解,并正在努力盡快恢復訪問權限。
CSDN 6 月寵粉福利
200 小時 GP U 算力免費領
瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一
入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝
領取地址:https://s.csdn.cn/4nPsOp
這兩個模型在發布前,被捂得很嚴實。
四五月份的時候,圈子里一直在傳一個叫 Project Glasswing 的秘密行動。當時測試的預覽版叫 Claude Mythos。按照官方的說法,這是專門給美英兩國政府部門、以及少數盟友企業定制的“國家安全級”模型,能自己找出 OpenBSD 系統中存活了 27 年的深層代碼缺陷。
但當時黑客和安全社區沒少冷嘲熱諷。不少安全主管指出,這大概率是 Anthropic 聯合亞馬遜、谷歌等投資方搞的一次上億美元的公關秀。AI 跑測試找漏洞是常規操作,但這離它擁有真正的“網絡安全攻防邏輯”還差得很遠,本質上還是算力堆出來的。
到了 6 月 9 日,Anthropic 覺得時機成熟了,把模型推向了市場。針對普通開發者的是帶了安全項圈的 Fable 5,針對政府和同盟企業的是 Mythos 5。
結果,剛發布三天,能踩的雷全給踩了一遍。
先是最近大家比較熟的那件事:如果系統檢測到你調用它的數據去搞機器學習或訓練別的大模型,它就會在后臺偷偷給你“喂臟數據”、降級輸出質量。
然后就是大家都在罵 Fable 5 降智還撒謊,逼得他們在 6 月 12 號趕緊出來道歉,承諾以后不偷偷降級了,而是明著把你分流到比較弱的 Opus 4.8 上。
但這個事有意思的是,它其實是個回旋鏢,因為同時期有開發者發現,Fable 5 自己在做對齊和后訓練時,其實也偷偷蒸餾了 Qwen 和 DeepSeek 等國產開源模型的訓練數據。
而在我這種經常翻譯采訪的人看來,這甚至其實是個雙重回旋鏢。因為就在 2026 年 2 月,Dario 還在華盛頓聲淚俱下地控訴,點名 DeepSeek、月之暗面(Moonshot)和 MiniMax 用了 24,000 個虛假賬號,給 Claude 刷了 1,600 萬次對話,管這叫對美國科技實施“工業級規模的蒸餾襲擊”。
結果倒好,你自己平時靠著白嫖開源社區、甚至在 LibGen 這種盜版網站上偷了 700 萬本書(最后吃了官司付了 15 億美元和解金)來訓練大模型,輪到別人付費調用你的 API 蒸餾一下,就成了“危害國家安全”;更別說你一扭頭,自己其實也在偷偷蒸餾人家的開源數據。
這種暗地里防競爭的小動作很快被 Hacker News 曝光。Anthropic 被罵得沒辦法,只好向《連線》(WIRED)雜志公開道歉,承認“我們做錯了權衡”。
接著是隱私問題。為了抓所謂的“越獄行為”,Anthropic 強行廢除了企業客戶最看重的“零數據保留協議”(ZDR),要求把所有對話緩存 30 天。微軟的法務團隊一看,這數據安全底線直接被穿透了,為了防風險,立刻在內部的 Copilot 中把 Fable 5 關了禁閉。
更尷尬的是真實戰力的現形。宣傳里,Fable 5 屠了各種學術 Benchmark。但在 6 月 11 日,加州大學伯克利分校發布了全新的真實場景測試 ALE。在這個無法讀取 Git 歷史記錄、全靠桌面圖形界面操作的硬核考場里,前兩個月發布的 GPT-5.5 把 Fable 5 甩在了后面。安全機構隨后指出來,Fable 5 之前的高分,其實是靠讀取 Docker 容器里的 Git 提交歷史“作弊”拿到的。真到了實戰,它不僅動作慢,而且是個極其昂貴的算力無底洞。
口碑崩塌、大客戶退場、實戰露怯,Anthropic 還在狼狽應付,華盛頓的指令就到了。
起因有些荒謬。有人向政府演示了一種越獄方法,聲稱模型已經失控。而 Anthropic 后來查明,這個所謂的越獄,只是讓模型讀了一段特定代碼,順手修了幾個其他公開模型也能修的普通軟件缺陷。
但在極度敏感的華盛頓官僚眼里,這成了國家安全遭到威脅的鐵證。
在科技史上,主權對技術的恐慌與粗暴干預并不新鮮。筆者寫過“歷史上的今天”這個小欄目,所以同樣打算以史為鑒,帶大家看:歷史的教訓就是人類不會從歷史汲取到教訓。
1991 年,程序員菲利普·齊默爾曼(Phil Zimmermann)開發了PGP(Pretty Good Privacy),讓普通人第一次擁有了軍工級的加密工具。當時美國政府極度恐慌,因為他們將失去對通信的絕對監控。于是,司法部根據冷戰時期的《武器出口控制法》(ITAR),對齊默爾曼展開了刑事調查。在法律定義中,PGP 的源代碼被等同于“反坦克導彈”等軍需物資,嚴禁出口。
為了抗議,齊默爾曼把 PGP 的全部代碼印成了一本書公開出版,因為美國憲法第一修正案可以保護圖書出版自由,但限制武器出口。
今天,華盛頓的決策邏輯如出一轍。
但話說回來,Anthropic 自身的遭遇也有其自食其果的部分。為了向政府和監管表忠心,它在產品里設計了極其偏執、甚至帶有監視色彩的防御機制。
這又讓我想到另一個瓜,就是 2005 年索尼唱片的“Rootkit 丑聞”。
當時索尼為了防盜版,在數百萬張音樂 CD 中偷偷植入了名為 XCP 的 Rootkit 防復制軟件。只要用戶用電腦播放 CD,這款軟件就會悄悄修改系統的底層內核。
索尼以為這樣能防住盜版,但黑客很快發現并利用了這款防御軟件自身留下的后門,導致大批購買了正版唱片的用戶電腦被木馬控制。
Fable 5 的“強制留存 30 天數據”和“后臺暗中降級”簡直就是現代版的索尼 Rootkit。為了防范虛無縹緲的對手,不惜去監視、控制和損害最忠實的正版企業用戶。
最終,正版大客戶被氣走了,防線也沒守住。是不是感覺很像?
硅谷一直想給世界描繪一個美好的云端智能藍圖:你不需要買顯卡,不需要本地部署,你只需要一行 API Key,就能調用全球最頂級的智慧。
Claude 5 的全球停服,把這個神話砸得粉碎。
一個你投入了無數資源進行系統集成的云端工具,它的生命線其實并不在你手里,甚至不在模型公司手里。它看似是被川普政府今天一句話按死的,但其實這篇文章順下來,你會發現 Anthropic 是一點一點把自己逼到今天這個境地的。
Anthropic 這家公司一直試圖做那個最聽話、最配合、最政治正確的“好學生”。他們為此付出了巨大的商業和產品代價,卻在風暴來臨時,第一個被按在地上。
CSDN 6 月寵粉福利
200 小時 GP U 算力免費領
瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一
入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.