網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Anthropic"關(guān)于美國(guó)政府下令停用Fable和Mythos 5的聲明"全文

2026-06-13 11:31:05　來(lái)源: AI先鋒官

北京舉報(bào)

分享至

剛剛，Anthropic 發(fā)布聲明稱，美國(guó)政府以國(guó)家安全為由，下達(dá)出口管制指令，要求暫停所有外國(guó)公民訪問(wèn) Fable 5 和 Mythos 5。

甚至連Anthropic 內(nèi)部的外籍員工，也被納入限制范圍。

Anthropic稱，會(huì)遵照政府的法定指令，關(guān)停所有用戶對(duì)Fable 5和Mythos 5的訪問(wèn)權(quán)限。

但同時(shí)表示，對(duì)于美國(guó)政府“僅憑發(fā)現(xiàn)一種局限性較強(qiáng)的潛在破解手段，就下架面向數(shù)億用戶的商用模型”的做法，“我們并不認(rèn)同”。

以下為聲明全文：

美國(guó)政府援引國(guó)家安全部門相關(guān)意見(jiàn)，發(fā)布出口管制指令，禁止所有外籍人士（無(wú)論身處美國(guó)境內(nèi)還是境外）使用Fable 5與Mythos 5模型，Anthropic公司外籍員工也在限制范圍內(nèi)。

為遵守該指令，我們不得不立即為全體用戶關(guān)停上述兩款模型，Anthropic旗下其他所有模型的使用權(quán)限均不受影響。

美國(guó)東部時(shí)間今日下午5點(diǎn)21分，我們收到了這份政府指令，文件并未詳細(xì)說(shuō)明具體的國(guó)家安全隱患。

據(jù)我們了解，美方稱發(fā)現(xiàn)了可繞過(guò)Fable 5安全防護(hù)機(jī)制（即“越獄破解”）的方法。我們查看了相關(guān)演示，該手段僅能找出少量此前已被發(fā)現(xiàn)的輕微漏洞。

這些漏洞本身難度較低，市面上其他公開(kāi)模型無(wú)需破解也能檢測(cè)出同類問(wèn)題。

結(jié)合產(chǎn)品上線博客中的說(shuō)明，Anthropic針對(duì)Fable系列模型的安全防護(hù)立場(chǎng)如下：

我們?yōu)镕able設(shè)置了嚴(yán)密的安全防護(hù)機(jī)制，大幅降低其被濫用于網(wǎng)絡(luò)安全相關(guān)違規(guī)操作的風(fēng)險(xiǎn)。

事實(shí)上，這套防護(hù)規(guī)則限制范圍較廣，不少用戶也曾對(duì)此提出不滿。

在Fable正式上線前數(shù)周，Anthropic聯(lián)合美國(guó)政府、英國(guó)人工智能安全研究所、多家第三方機(jī)構(gòu)及內(nèi)部團(tuán)隊(duì)，對(duì)Fable的安全防護(hù)體系開(kāi)展了累計(jì)數(shù)千小時(shí)的攻防測(cè)試。

測(cè)試結(jié)果證明，F(xiàn)able的安全防護(hù)效果遠(yuǎn)優(yōu)于以往所有已落地的模型。

截至目前，測(cè)試人員尚未找到通用破解手段——也就是能夠大范圍繞過(guò)模型防護(hù)、解鎖各類網(wǎng)絡(luò)攻擊能力的越獄方法。

我們認(rèn)為，現(xiàn)階段沒(méi)有任何一家模型廠商能做到徹底防范越獄破解。行業(yè)內(nèi)所有防護(hù)機(jī)制都無(wú)法規(guī)避非通用型破解手段（這類手段僅能在特定場(chǎng)景下獲取部分網(wǎng)絡(luò)相關(guān)信息），且未來(lái)終究會(huì)出現(xiàn)通用破解方法。我們?cè)诎l(fā)布Fable 5時(shí)就已明確說(shuō)明這一點(diǎn)。

鑒于當(dāng)下無(wú)法實(shí)現(xiàn)絕對(duì)防破解，Anthropic為Fable 5采用了縱深防御策略：

一方面讓非通用型破解手段的作用范圍受限，另一方面大幅提升研發(fā)通用破解手段的成本；同時(shí)搭配全流程監(jiān)控，一旦發(fā)現(xiàn)破解攻擊行為，可第一時(shí)間識(shí)別并阻斷。

這也是我們要求留存用戶使用Fable相關(guān)數(shù)據(jù)30天的原因。這項(xiàng)政策調(diào)整給公司和用戶都帶來(lái)了實(shí)際成本，但能幫助我們研究破解手段并進(jìn)行風(fēng)險(xiǎn)修復(fù)。

我們始終堅(jiān)持這套縱深防御策略。該策略有效管控了Fable的潛在風(fēng)險(xiǎn)，使其風(fēng)險(xiǎn)水平與行業(yè)內(nèi)現(xiàn)有已投入使用的主流模型持平。

目前，我們并未收到任何會(huì)造成危害的非通用型破解漏洞通報(bào)。已向我們披露的相關(guān)破解嘗試，要么只會(huì)生成無(wú)害內(nèi)容，要么只是一些無(wú)關(guān)緊要的小問(wèn)題，并不會(huì)對(duì)Mythos模型造成針對(duì)性威脅。

迄今為止，美方僅口頭告知我們存在一種范圍有限的非通用型破解方式，其原理大致是指令模型讀取特定代碼庫(kù)并修復(fù)軟件漏洞。

據(jù)悉，相關(guān)破解案例已提交至美國(guó)政府。我們核查了這份作為本次管制指令依據(jù)的報(bào)告，確認(rèn)報(bào)告中展現(xiàn)的能力，其他主流模型（包括OpenAI的GPT-5.5）均已具備，網(wǎng)絡(luò)安全防護(hù)人員日常也一直在使用同類功能。未來(lái)24小時(shí)內(nèi)，我們會(huì)公布更多細(xì)節(jié)。

我們將遵照政府的法定指令，關(guān)停所有用戶對(duì)Fable 5和Mythos 5的訪問(wèn)權(quán)限。

但我們并不認(rèn)同：僅憑發(fā)現(xiàn)一種局限性較強(qiáng)的潛在破解手段，就下架面向數(shù)億用戶的商用模型。倘若全行業(yè)都執(zhí)行這一標(biāo)準(zhǔn)，前沿AI模型廠商的新模型落地工作基本都會(huì)陷入停滯。

我們此前公開(kāi)表態(tài)過(guò)，支持政府依據(jù)透明、公平、規(guī)則清晰、以技術(shù)事實(shí)為依據(jù)的法定流程，叫停存在安全隱患的模型上線。但本次管控舉措并不符合上述原則。

對(duì)于此次服務(wù)中斷，我們向所有用戶致歉。我們認(rèn)為這是一場(chǎng)誤解，目前正全力推進(jìn)相關(guān)工作，爭(zhēng)取盡快恢復(fù)模型訪問(wèn)權(quán)限。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.