網易首頁 > 網易號 > 正文申請入駐

美國政府以國家安全為由限制Anthropic兩款AI模型的訪問權限

2026-06-13 15:35:25　來源: 人工智能學家

北京舉報

分享至

來源：賽博研究院

當地時間6月12日，人工智能公司Anthropic發布聲明稱，已收到美國政府以國家安全為由下達的出口管制指令，要求暫停所有外國籍人士對其人工智能模型Fable 5和Mythos 5的訪問權限。

據悉，限制覆蓋美國境內外所有外國籍用戶，甚至包括Anthropic的外籍員工。受此影響，Anthropic表示將立即禁用上述兩款模型以確保合規，其他Anthropic模型的訪問不受影響。

Anthropic在聲明中表示，公司于美國東部時間當日下午5時21分收到政府指令，但信件未提供國家安全關切的具體細節。據公司了解，美國政府聲稱已掌握一種可繞過Fable 5安全防護的“越獄”方法。Anthropic稱已對相關技術報告進行審查，發現該技術僅能識別少量已知的輕微漏洞，且其他公開可用模型無需繞過防護即可發現同類漏洞。

針對Fable 5的安全防護體系，Anthropic重申了此前公布的多項核心原則：公司已建立嚴格的防護措施，大幅降低了模型被濫用于網絡安全相關任務的風險，部分用戶甚至反饋防護規則過于寬泛；在模型發布前，Anthropic已與美國政府、英國人工智能安全研究所（AISI）及多家第三方機構合作，對Fable 5的防護機制開展了數千小時的紅隊測試。測試結果顯示，其防護效果顯著優于此前已部署的所有模型，且未發現可廣泛繞過防護、解鎖大量網絡能力的通用越獄方法。

值得一提的是，Anthropic同時坦言，當前任何模型提供商都無法實現完全的防越獄能力——行業內所有防護措施都可能遭遇非通用越獄攻擊，未來也不排除出現通用越獄方法的可能。

為此，公司對Fable 5采用了縱深防御策略，一方面限制非通用越獄的適用范圍，另一方面大幅提高了通用越獄的實現成本；同時結合客戶數據30天留存政策，通過持續監控快速檢測并阻斷攻擊。Anthropic強調，通過這一策略，Fable 5的風險已降至與行業內現有已部署模型相當的水平。目前，公司尚未收到任何可能導致有害結果的非通用越獄情況披露。

Anthropic指出，美國政府僅以口頭證據表明存在一種潛在的窄范圍非通用越獄方法，其核心機制是誘導模型讀取特定代碼庫并修復軟件缺陷。經公司核查，該演示所展現的能力在OpenAI GPT-5.5等其他模型中同樣普遍存在，且正是網絡安全防護人員日常用于維護系統安全的功能。Anthropic表示，將在未來24小時內分享更多細節。

盡管已按政府指令執行限制措施，Anthropic仍明確表達了對該決定的異議，認為僅憑窄范圍潛在越獄的發現，不應召回已面向數億用戶部署的商業模型，并強調若這一標準在全行業推行，將基本導致所有前沿模型提供商停止新模型部署。

此前，Anthropic曾公開表示，支持政府通過透明、公平、清晰且基于技術事實的法定程序阻止不安全的模型部署，但認為此次政府行動不符合這些原則。

Anthropic在聲明中向受影響的客戶致歉，稱此次限制源于誤解，并表示正在積極與相關方面溝通，爭取盡快恢復Fable 5和Mythos 5的訪問權限。

文章由AI輔助生成，參考來源Anthropic，互聯網公開信息

閱讀最新前沿科技趨勢報告，請訪問21世紀關鍵技術研究院的“未來知識庫”

未來知識庫是 “21世紀關鍵技術研究院”建立的在線知識庫平臺，收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能，數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

（加入未來知識庫，全部資料免費閱讀和下載）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.