剛剛,Anthropic 發(fā)布聲明稱,美國(guó)政府以國(guó)家安全為由,下達(dá)出口管制指令,要求暫停所有外國(guó)公民訪問(wèn) Fable 5 和 Mythos 5。
甚至連Anthropic 內(nèi)部的外籍員工,也被納入限制范圍。
Anthropic稱,會(huì)遵照政府的法定指令,關(guān)停所有用戶對(duì)Fable 5和Mythos 5的訪問(wèn)權(quán)限。
但同時(shí)表示,對(duì)于美國(guó)政府“僅憑發(fā)現(xiàn)一種局限性較強(qiáng)的潛在破解手段,就下架面向數(shù)億用戶的商用模型”的做法,“我們并不認(rèn)同”。
![]()
以下為聲明全文:
美國(guó)政府援引國(guó)家安全部門相關(guān)意見(jiàn),發(fā)布出口管制指令,禁止所有外籍人士(無(wú)論身處美國(guó)境內(nèi)還是境外)使用Fable 5與Mythos 5模型,Anthropic公司外籍員工也在限制范圍內(nèi)。
為遵守該指令,我們不得不立即為全體用戶關(guān)停上述兩款模型,Anthropic旗下其他所有模型的使用權(quán)限均不受影響。
美國(guó)東部時(shí)間今日下午5點(diǎn)21分,我們收到了這份政府指令,文件并未詳細(xì)說(shuō)明具體的國(guó)家安全隱患。
據(jù)我們了解,美方稱發(fā)現(xiàn)了可繞過(guò)Fable 5安全防護(hù)機(jī)制(即“越獄破解”)的方法。我們查看了相關(guān)演示,該手段僅能找出少量此前已被發(fā)現(xiàn)的輕微漏洞。
這些漏洞本身難度較低,市面上其他公開(kāi)模型無(wú)需破解也能檢測(cè)出同類問(wèn)題。
結(jié)合產(chǎn)品上線博客中的說(shuō)明,Anthropic針對(duì)Fable系列模型的安全防護(hù)立場(chǎng)如下:
我們?yōu)镕able設(shè)置了嚴(yán)密的安全防護(hù)機(jī)制,大幅降低其被濫用于網(wǎng)絡(luò)安全相關(guān)違規(guī)操作的風(fēng)險(xiǎn)。
事實(shí)上,這套防護(hù)規(guī)則限制范圍較廣,不少用戶也曾對(duì)此提出不滿。
在Fable正式上線前數(shù)周,Anthropic聯(lián)合美國(guó)政府、英國(guó)人工智能安全研究所、多家第三方機(jī)構(gòu)及內(nèi)部團(tuán)隊(duì),對(duì)Fable的安全防護(hù)體系開(kāi)展了累計(jì)數(shù)千小時(shí)的攻防測(cè)試。
測(cè)試結(jié)果證明,F(xiàn)able的安全防護(hù)效果遠(yuǎn)優(yōu)于以往所有已落地的模型。
截至目前,測(cè)試人員尚未找到通用破解手段——也就是能夠大范圍繞過(guò)模型防護(hù)、解鎖各類網(wǎng)絡(luò)攻擊能力的越獄方法。
我們認(rèn)為,現(xiàn)階段沒(méi)有任何一家模型廠商能做到徹底防范越獄破解。行業(yè)內(nèi)所有防護(hù)機(jī)制都無(wú)法規(guī)避非通用型破解手段(這類手段僅能在特定場(chǎng)景下獲取部分網(wǎng)絡(luò)相關(guān)信息),且未來(lái)終究會(huì)出現(xiàn)通用破解方法。我們?cè)诎l(fā)布Fable 5時(shí)就已明確說(shuō)明這一點(diǎn)。
鑒于當(dāng)下無(wú)法實(shí)現(xiàn)絕對(duì)防破解,Anthropic為Fable 5采用了縱深防御策略:
一方面讓非通用型破解手段的作用范圍受限,另一方面大幅提升研發(fā)通用破解手段的成本;同時(shí)搭配全流程監(jiān)控,一旦發(fā)現(xiàn)破解攻擊行為,可第一時(shí)間識(shí)別并阻斷。
這也是我們要求留存用戶使用Fable相關(guān)數(shù)據(jù)30天的原因。這項(xiàng)政策調(diào)整給公司和用戶都帶來(lái)了實(shí)際成本,但能幫助我們研究破解手段并進(jìn)行風(fēng)險(xiǎn)修復(fù)。
我們始終堅(jiān)持這套縱深防御策略。該策略有效管控了Fable的潛在風(fēng)險(xiǎn),使其風(fēng)險(xiǎn)水平與行業(yè)內(nèi)現(xiàn)有已投入使用的主流模型持平。
目前,我們并未收到任何會(huì)造成危害的非通用型破解漏洞通報(bào)。已向我們披露的相關(guān)破解嘗試,要么只會(huì)生成無(wú)害內(nèi)容,要么只是一些無(wú)關(guān)緊要的小問(wèn)題,并不會(huì)對(duì)Mythos模型造成針對(duì)性威脅。
迄今為止,美方僅口頭告知我們存在一種范圍有限的非通用型破解方式,其原理大致是指令模型讀取特定代碼庫(kù)并修復(fù)軟件漏洞。
據(jù)悉,相關(guān)破解案例已提交至美國(guó)政府。我們核查了這份作為本次管制指令依據(jù)的報(bào)告,確認(rèn)報(bào)告中展現(xiàn)的能力,其他主流模型(包括OpenAI的GPT-5.5)均已具備,網(wǎng)絡(luò)安全防護(hù)人員日常也一直在使用同類功能。未來(lái)24小時(shí)內(nèi),我們會(huì)公布更多細(xì)節(jié)。
我們將遵照政府的法定指令,關(guān)停所有用戶對(duì)Fable 5和Mythos 5的訪問(wèn)權(quán)限。
但我們并不認(rèn)同:僅憑發(fā)現(xiàn)一種局限性較強(qiáng)的潛在破解手段,就下架面向數(shù)億用戶的商用模型。倘若全行業(yè)都執(zhí)行這一標(biāo)準(zhǔn),前沿AI模型廠商的新模型落地工作基本都會(huì)陷入停滯。
我們此前公開(kāi)表態(tài)過(guò),支持政府依據(jù)透明、公平、規(guī)則清晰、以技術(shù)事實(shí)為依據(jù)的法定流程,叫停存在安全隱患的模型上線。但本次管控舉措并不符合上述原則。
對(duì)于此次服務(wù)中斷,我們向所有用戶致歉。我們認(rèn)為這是一場(chǎng)誤解,目前正全力推進(jìn)相關(guān)工作,爭(zhēng)取盡快恢復(fù)模型訪問(wèn)權(quán)限。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.