![]()
來源:賽博研究院
當地時間6月12日,人工智能公司Anthropic發布聲明稱,已收到美國政府以國家安全為由下達的出口管制指令,要求暫停所有外國籍人士對其人工智能模型Fable 5和Mythos 5的訪問權限。
![]()
據悉,限制覆蓋美國境內外所有外國籍用戶,甚至包括Anthropic的外籍員工。受此影響,Anthropic表示將立即禁用上述兩款模型以確保合規,其他Anthropic模型的訪問不受影響。
Anthropic在聲明中表示,公司于美國東部時間當日下午5時21分收到政府指令,但信件未提供國家安全關切的具體細節。據公司了解,美國政府聲稱已掌握一種可繞過Fable 5安全防護的“越獄”方法。Anthropic稱已對相關技術報告進行審查,發現該技術僅能識別少量已知的輕微漏洞,且其他公開可用模型無需繞過防護即可發現同類漏洞。
針對Fable 5的安全防護體系,Anthropic重申了此前公布的多項核心原則:公司已建立嚴格的防護措施,大幅降低了模型被濫用于網絡安全相關任務的風險,部分用戶甚至反饋防護規則過于寬泛;在模型發布前,Anthropic已與美國政府、英國人工智能安全研究所(AISI)及多家第三方機構合作,對Fable 5的防護機制開展了數千小時的紅隊測試。測試結果顯示,其防護效果顯著優于此前已部署的所有模型,且未發現可廣泛繞過防護、解鎖大量網絡能力的通用越獄方法。
值得一提的是,Anthropic同時坦言,當前任何模型提供商都無法實現完全的防越獄能力——行業內所有防護措施都可能遭遇非通用越獄攻擊,未來也不排除出現通用越獄方法的可能。
為此,公司對Fable 5采用了縱深防御策略,一方面限制非通用越獄的適用范圍,另一方面大幅提高了通用越獄的實現成本;同時結合客戶數據30天留存政策,通過持續監控快速檢測并阻斷攻擊。Anthropic強調,通過這一策略,Fable 5的風險已降至與行業內現有已部署模型相當的水平。目前,公司尚未收到任何可能導致有害結果的非通用越獄情況披露。
Anthropic指出,美國政府僅以口頭證據表明存在一種潛在的窄范圍非通用越獄方法,其核心機制是誘導模型讀取特定代碼庫并修復軟件缺陷。經公司核查,該演示所展現的能力在OpenAI GPT-5.5等其他模型中同樣普遍存在,且正是網絡安全防護人員日常用于維護系統安全的功能。Anthropic表示,將在未來24小時內分享更多細節。
盡管已按政府指令執行限制措施,Anthropic仍明確表達了對該決定的異議,認為僅憑窄范圍潛在越獄的發現,不應召回已面向數億用戶部署的商業模型,并強調若這一標準在全行業推行,將基本導致所有前沿模型提供商停止新模型部署。
此前,Anthropic曾公開表示,支持政府通過透明、公平、清晰且基于技術事實的法定程序阻止不安全的模型部署,但認為此次政府行動不符合這些原則。
Anthropic在聲明中向受影響的客戶致歉,稱此次限制源于誤解,并表示正在積極與相關方面溝通,爭取盡快恢復Fable 5和Mythos 5的訪問權限。
文章由AI輔助生成,參考來源Anthropic,互聯網公開信息
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.