无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易科技 > IT業界 > 正文

Fable 5上線方案公布,Anthropic想給AI越獄定一把尺

0
分享至

7月1日消息,當地時間周二,Anthropic宣布恢復Claude Fable 5訪問。公告里的新信息不止模型重新上線:公司第一次系統解釋,什么樣的AI越獄應被視為嚴重風險。

Anthropic在官網發布長文稱,美國政府已解除對Claude Fable 5和Claude Mythos 5的出口管制。Fable 5將從7月1日起重新面向全球用戶開放,覆蓋Claude Platform、Claude.ai、Claude Code和Claude Cowork。Pro、Max、Team和部分Enterprise用戶在7月7日前可把Fable 5用于最多50% 的每周使用額度;之后將通過用量積分繼續使用。Anthropic還稱,將盡快在AWS、Google Cloud和Microsoft Foundry上重新啟用訪問。

Fable 5上線方案公布,Anthropic想給AI越獄定一把尺

Mythos 5則已在美國政府6月26日批準后,先向一批美國機構恢復訪問,并將繼續與政府協調,擴大到Glasswing項目中的更多國內和國際合作伙伴。

如果只看結果,這像是一場模型下架風波的收尾。但Anthropic這篇文章的重點其實在后半段:它想把 “AI模型越獄到底有多嚴重” 變成一套行業評分標準,并把前沿模型發布納入更深的政府預發布測試。

為什么一份越獄報告會讓模型下架

這場風波始于6月12日。

Anthropic稱,美國政府當天對Fable 5和Mythos 5實施出口管制,要求限制外國國民訪問這兩款模型。這里的外國國民不只包括美國境外用戶,也包括在美國境內的非美國國民。由于指令立即生效,而Anthropic無法實時核驗每個用戶的國籍,公司最后選擇暫停所有用戶訪問。

政府介入的直接導火索,是一份來自亞馬遜研究人員的報告。報告稱,研究人員找到一種繞過Fable 5安全防護的方法,讓模型識別出若干軟件漏洞;其中一個案例里,模型還生成了演示如何利用漏洞的代碼。

Anthropic的反駁很明確:這不是Fable 5突然釋放出獨有的高級攻擊能力。

公司稱,自己復測后發現,Claude Opus 4.8、GPT-5.5、Kimi K2.7等較低能力模型,也能識別同樣漏洞;在生成單個漏洞利用演示時,Haiku、Sonnet、Opus、GPT和Kimi的多個版本也能給出類似結果。Anthropic認為,這更像是Fable 5安全分類器里的一個邊界案例,而不是Mythos級別網絡攻擊能力外泄。

換句話說,爭議核心不是 “模型有沒有風險”,而是:一個繞過技巧到底嚴重到什么程度,是否足以讓政府要求模型停服。

新防護能攔99% 以上,但代價是誤傷

為了恢復訪問,Anthropic訓練了新的安全分類器,專門攔截亞馬遜報告中的繞過行為。公司稱,新分類器能在超過99% 的情況下阻止相關技巧;如果Fable 5請求被攔截,系統會把請求轉給Claude Opus 4.8處理。

美國商務部下屬的AI標準與創新中心也測試了Anthropic的新舊防護。

但這不是一個 “修好就完事” 的問題。Anthropic承認,新分類器會讓日常編程和調試任務中更多良性請求被誤判。也就是說,用戶正常做安全研究、漏洞分析或代碼調試時,可能更容易碰到拒答。

這才是前沿模型安全的難點:廠商既要證明模型不會被輕易拿去做攻擊,又不能把正常開發者和安全研究人員擋在門外。Fable 5的恢復,實際上是一次能力、可用性和政策風險之間的重新平衡。

Anthropic想給AI越獄分級

這篇文章最有價值的部分,是Anthropic提出的 “AI越獄嚴重程度框架”。

Fable 5上線方案公布,Anthropic想給AI越獄定一把尺

Anthropic認為,現在行業缺少統一標準。每次有人發現新的繞過方法,廠商不知道該多快修,政府也缺少一致尺度判斷是否該介入。

它提出用四個維度判斷一個越獄是否嚴重:能力增益、能力范圍、武器化難度和可發現性。

這個框架的意義在于,它把 “AI越獄” 從一個容易引發恐慌的詞,拆成了可以排序、可以處置的問題。一個只能觸碰安全邊界、還需要很多技巧才能復現的越獄,和一個一兩句提示就能穩定解鎖危險能力的越獄,不應該被同等對待。

Fable 5上線方案公布,Anthropic想給AI越獄定一把尺

Anthropic正在與亞馬遜、微軟、谷歌和其他Glasswing合作伙伴起草一套框架。它建議從四個維度給越獄風險打分:

第一,能力增益。越獄后,模型能不能做出現有公開工具和較弱模型做不到的事情。如果只是達到其他工具已有能力,風險較低;如果能顯著加速專家級攻擊,風險就高。

第二,能力范圍。同一種越獄方法,是只能解鎖一個很窄的任務,還是能覆蓋多類攻擊目標和技術路線。

第三,武器化難度。把這個越獄轉成真實攻擊,需要多少人工努力、提示技巧和反復嘗試。如果一兩次提示就能穩定成功,風險更高。

第四,可發現性。這個方法是需要專業知識才能找到,還是已經在網上廣泛傳播。

這套框架的意義在于,它試圖把 “AI越獄” 從籠統恐慌,拆成可溝通、可排序、可修復的問題。以后模型被發現漏洞時,廠商和政府可以先判斷:這是低風險邊界案例,還是必須立即部署緩解措施的高危越獄。

Anthropic還計劃推出新的HackerOne項目,讓安全研究人員提交Fable 5潛在網絡安全越獄案例。

前沿模型發布以后更難 “只按產品節奏走”

Fable 5這次恢復訪問,也說明前沿模型發布正在多一層外部變量。

Anthropic表示,對涉及國家安全相關前沿能力的模型,將向指定美國政府伙伴提供更早訪問權限,讓政府在廣泛發布前測試模型和配套防護;當出現重要越獄或濫用模式時,也會更快向政府共享信息;同時投入專門團隊和算力,參與AI安全評測與研究。

這意味著,前沿模型不再只是 “訓練完成、評測通過、上線銷售”。越靠近網絡安全、生物安全、國家安全這些高風險能力,模型發布越可能進入政府預審、信息共享和風險協商流程。

對用戶來說,Fable 5恢復訪問是好消息。但對企業客戶來說,這件事留下的提醒更現實:最強模型的可用性,不只取決于能力、價格和接口,也取決于政策狀態。一款模型即使已經上線,也可能因為安全爭議突然暫停,再通過補防護、復測和政府協調恢復。

對Anthropic來說,這次復盤既是在解釋下架原因,也是在爭奪話語權:公司希望外界相信,Fable 5不是失控模型,而是一個被過度謹慎處理的邊界案例;同時,它也希望把行業焦點從 “模型能不能被越獄” 轉到 “越獄嚴重程度該怎么判斷”。

所以,這篇公告表面上是在宣布Fable 5重新上線,實際上是在給前沿模型行業立一套新問題:AI越獄該怎么分級,政府該什么時候介入,模型公司又該怎樣證明自己既能放出能力,也能管住風險。(易句)

(本文由AI翻譯,網易編輯負責校對)

相關推薦
熱點推薦
五發三中,“火烈鳥”重創“街壘”工廠!荷蘭贈送700枚巡航導彈

五發三中,“火烈鳥”重創“街壘”工廠!荷蘭贈送700枚巡航導彈

鷹眼Defence
2026-06-28 16:30:10
外蒙古獨立的影響是什么?毛主席曾兩次提出收回,為何都沒有成功

外蒙古獨立的影響是什么?毛主席曾兩次提出收回,為何都沒有成功

凡人侃史
2026-06-13 16:35:21
今日重要賽事!7月1日,CCTV5,CCTV5+節目表

今日重要賽事!7月1日,CCTV5,CCTV5+節目表

薇說體育
2026-07-01 09:55:31
山東最失敗的決策就是把煙臺一分為二

山東最失敗的決策就是把煙臺一分為二

娛樂的硬糖吖
2026-07-01 09:57:59
中紀委怒批:公務員也是人,正常生活不應問責處理!

中紀委怒批:公務員也是人,正常生活不應問責處理!

細說職場
2026-06-24 10:55:30
中國已經成為全球第一個集體拒接電話的國家

中國已經成為全球第一個集體拒接電話的國家

黯泉
2026-06-26 10:44:35
外交部:巴拉圭政府應早日站到歷史正確一邊,不要再自陷孤立

外交部:巴拉圭政府應早日站到歷史正確一邊,不要再自陷孤立

澎湃新聞
2026-07-01 17:30:10
解放軍首次官宣六代機,美軍絕望,中國六代機殲36離服役不遠了!

解放軍首次官宣六代機,美軍絕望,中國六代機殲36離服役不遠了!

胖福的小木屋
2026-06-30 23:32:12
苗原:卡多索5月就和浙江談過,最近要求放低所以穩步推進中

苗原:卡多索5月就和浙江談過,最近要求放低所以穩步推進中

懂球帝
2026-07-01 10:34:17
梅艷芳母親100歲大壽留影,四個孩子離世仨,如今過的比誰都瀟灑

梅艷芳母親100歲大壽留影,四個孩子離世仨,如今過的比誰都瀟灑

情感大頭說說
2026-07-01 15:35:57
伊朗議會議長:美國已全面解除對伊朗的海上封鎖;伊朗總統:若美國遵守協議,伊方也將履行承諾

伊朗議會議長:美國已全面解除對伊朗的海上封鎖;伊朗總統:若美國遵守協議,伊方也將履行承諾

極目新聞
2026-07-01 07:55:58
ESPN:杰倫-杜倫將在自由市場開啟后與湖人隊進行會面

ESPN:杰倫-杜倫將在自由市場開啟后與湖人隊進行會面

北青網-北京青年報
2026-06-30 19:23:14
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
兒媳過生日我轉6666,結果被兒子退回,我去兒子家一看,當場愣住

兒媳過生日我轉6666,結果被兒子退回,我去兒子家一看,當場愣住

千秋文化
2026-06-26 19:48:58
公司新招了個211的研究生,結果培訓一結束,他就辭職了。只因公司停車場沒有30萬以上的車,這種公司雖然大,但是對員工摳門,沒前途

公司新招了個211的研究生,結果培訓一結束,他就辭職了。只因公司停車場沒有30萬以上的車,這種公司雖然大,但是對員工摳門,沒前途

不二大叔
2026-07-01 00:48:40
中方不見日大使,日企警告災難將至,中日一旦開戰,結果早已注定

中方不見日大使,日企警告災難將至,中日一旦開戰,結果早已注定

鐵錘侃侃而談
2026-07-01 12:21:28
奧迪A6L暴跌20萬!創20年歷史最低,豪華信仰崩塌?

奧迪A6L暴跌20萬!創20年歷史最低,豪華信仰崩塌?

音樂時光的娛樂
2026-06-30 19:46:32
豐田5月在華銷量下滑超30%,但還不是降幅最大的區域……

豐田5月在華銷量下滑超30%,但還不是降幅最大的區域……

觀察者網
2026-07-01 17:11:04
從加價六十萬降到一年之內降價六十萬,LX570神話就此終結

從加價六十萬降到一年之內降價六十萬,LX570神話就此終結

三農老歷
2026-06-26 19:21:56
跨境圈炸鍋!美國海外倉疑似暴雷,賣家損失慘重

跨境圈炸鍋!美國海外倉疑似暴雷,賣家損失慘重

跨境派Pro
2026-06-30 14:17:26
2026-07-01 18:08:49

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

"霉霉"婚禮慶典細節披露:千人出席禁用手機 封街3天

頭條要聞

"霉霉"婚禮慶典細節披露:千人出席禁用手機 封街3天

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

半程收官 上汽集團銷量突破200萬輛

態度原創

手機
家居
房產
本地
公開課

手機要聞

消息稱新一輪漲價AOVMHh都逃不掉,驍龍8E6旗艦預計起步6K+

家居要聞

傳奇筑 日常詩

房產要聞

洋房盛大交付,中海丨南?!と栐韩I映世界海岸的人居答案

本地新聞

強烈建議,全國高校都向這所大學看齊!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版
×