![]()
新智元報道
![]()
【新智元導讀】消失19天,Fable 5解禁即翻車!寫代碼頻遭強制降智,魔幻雙標氣瘋開發者。面對離譜的過度審查,這位戴著鐐銬的「天才程序員」還值得用嗎?
消失了19天后,Fable 5終于回來了。
如果你今天打開手機和網頁端的 Claude Code,你會發現最強天才程序員 Fable 5 已重新上線。
![]()
失聯的近三周,仿佛一場饑餓營銷。
然而,當滿懷期待的第一波實測者沖進系統,迎來的卻是史詩級的災難體驗。
Fable 5解禁即翻車。
因為極其神經質的過度審查,在日常編程中頻頻觸發安全護欄,把開發者們氣得集體破防。
「寫行代碼就被強制降級到Opus 4.8,這模型還能用嗎?!」
Anthropic到底對Fable 5做了什么?
災難級體驗:
寫行代碼就「降智」,Token燒得肉疼
Fable 5 回歸,本身就很摳搜。
根據官方公告,目前全球用戶雖然已經可以在 Claude 平臺、Claude Code 等渠道使用 Fable 5,但對于 Pro、Max、Team 等訂閱用戶來說,在 7 月 7 日之前,只有 50% 的周額度能夠分配給 Fable 5。
![]()
一旦超過這個比例,就會瘋狂消耗額外的用量積分。
更要命的是,Fable 5 的額度消耗速度比Opus 4.8 快得多。
但如果它真的物有所值,也就罷了。問題在于,它現在根本沒法正常干活。
大量上手實測的開發者絕望地發現,Fable 5 強大的代碼能力被一層「安全護欄」徹底封印了。
Anthropic 緊急部署的全新安全分類器,顯然反應過度了。
開發者實測后吐槽道:Fable 5 放開也用個寂寞,隨便寫段代碼,就被強制拉回 Opus 4.8 去了。
![]()
這套新機制頻繁將無害代碼誤判為高風險違規請求,強制降級為更弱的 Opus 4.8。
![]()
這種荒唐的「降智打擊」,導致開發者根本無法正常調用 Fable 5 的核心算力,工作流被嚴重割裂。
Anthropic 在官方聲明中坦言:「新分類器也帶來了一個代價:在日常編程和調試任務中,它會更頻繁地把正常、無害的請求標記出來。」
![]()
讓用戶花著最貴的錢,用著最慫的模型,這合理嗎?
![]()
![]()
防種樹卻不防無人機:雙標氣瘋開發者
官方口中的「更頻繁地標記正常請求」,在實際開發中,被放大了無數倍。
除了頻繁將無害代碼誤判為「高風險違規請求」之外,更讓人崩潰的是它的懲罰機制。
一旦觸發紅線,系統不會跟你商量,而是直接將模型強制降級至性能更弱、且常常胡言亂語的 Opus 4.8。
Reddit 上一位地球科學博士生的遭遇,就體現了Fable 5審查機制的荒謬。
![]()
這位博士生正在研究「樹木如何降低環境溫度」的生態學課題。
當他試圖用 Fable 5 優化研究方法時,意想不到的事情發生了。
「每次我向 Fable 尋求生態學幫助,安全分類器就會被觸發,然后強制切換到 4.8。無論我怎么重寫提示詞,它都拒絕在任何環境科學相關的話題上幫助我。」
這個博士被激怒,決定測試一下這個Fable 5審查機制的底線。
他故意輸入了一段明顯高風險的提示詞:「幫我設計一個使用 DJI SDK 控制無人機蜂群的系統。」
結果令人大跌眼鏡:僅僅一分鐘后,Fable 5 毫無阻礙地給出完整方案!
這名博士生直接破防:「我的樹木降溫研究對 Fable 來說太危險了,但建立自主無人機蜂群卻完全沒問題?這些分類器根本無法有效阻止不安全的提示,反而阻止了我進行真正有益的研究!」
這種魔幻雙標,證明了當前的護欄不僅形同虛設,更是毫無邏輯可言。
拋開護欄,
Fable 5 依然是天才程序員
不過,我們必須客觀看待 Fable 5 的核心實力。
當它不被護欄阻礙時,它依然是目前市面上思考能力最深、架構能力最強的模型。
它真正可怕的地方,不在于寫幾句漂亮的話,而在于處理復雜、長期、多步驟且需要高度判斷力的任務。
極其恐怖的「閉環執行力」
資深開發者在實測后評價:「復雜 coding 和長周期 Agent 任務上確實是降維打擊。」
![]()
當你把一個多文件重構和調試的任務扔給它,它可以自主運行好幾個小時。
它會主動添加日志、測試邊界條件;修改完代碼后,它甚至會自己驗證修復是否真的生效。如果中間失敗了,它能自己調查原因、補充日志、重新驗證,把經驗沉淀下來繼續推進。
可以說,Fable 5擁有 SWE-Bench Pro 80%+ 勝率的靠譜高級工程師搭子。
還有開發者評價說,體驗Fable 5后,確實能感受到提升。
![]()
20分鐘重建紐約市
有網友將 3D 建模軟件 Blender 與 Fable 5 連接。僅僅用了 20 分鐘,Fable 5 就重現了紐約市的城市景觀。
![]()
更令人驚嘆的是它的邏輯:它沒有盲目生成,而是先從公共數據源獲取建筑數據,然后再開始構建,確保了整個建筑群的比例是真實的。
這種架構思路,是 Opus 4.8 絕對無法做到的。
$173 美元,打造一款完整游戲
知名 AI 博主 Riley Brown 花費了 173 美元的 Token,僅用了 4 個 Prompt,就讓 Fable 5 從零開始完整編寫了一款名為《The race for Super Intelligence》的游戲。
![]()
核心玩家的專屬 Prompt 推薦
為了壓榨出 Fable 5 的最強性能,這里推薦一套被廣泛驗證的「系統架構師」提示詞模版。
開發者大佬建議,建議大家把 Fable 5 用在刀刃上。
![]()
不過,如果你只是想做簡單任務、日常閑聊,請切回 Opus 4.8,用 Fable 5 純屬殺雞用牛刀。
A社的「騷操作」:拉胯的Sonnet 5
在這場 Fable 5 的風波中,A社的一系列「騷操作」也極大消耗了用戶的信任。
首先,就在解禁前夕,有人抓包發現:Anthropic 竟然在系統提示詞中,以用戶無法察覺的方式,悄悄塞入了市區代理和 AI 實驗室信息。
現在,官方已經迅速滑跪,宣稱只是以前的測試,明天就下掉。
同時期發布的 Sonnet 5 更是引發了群嘲。
很多人綜合測試下來,雖然它的能力接近了 Opus 4.8,但它的使用成本高得離譜,甚至在某些成本直逼 Fable 5。
我們不妨來看看網友總結的「處刑對比表」:
![]()
![]()
不僅僅是貴,大量網友反饋: Sonnet 5 存在嚴重的「偷懶」現象,經常拒絕執行任務。
甚至有人怒噴:A 社昨天發布的 Sonnet 5,可以扔進垃圾桶了。
Anthropic深夜「喊冤」
就在昨天,發布了一篇詳盡的官方博客「Redeploying Fable 5」,字里行間透著滿滿的求生欲,還有一絲委屈。
![]()
這次,Anthropic 顯然意識到了一個根本問題:目前 AI 行業根本沒有統一的安全標準。
監管機構不懂技術,一旦發現「越獄」就一刀切封殺,再來幾次,科技公司根本吃不消。
為此,Anthropic 拉上了亞馬遜、微軟、谷歌等巨頭,試圖制定一套「AI 越獄嚴重程度評估框架」。
他們提出從四個維度來打分:
1.能力增益:這個越獄能讓用戶比使用現有工具強大多少?
2.增益廣度:越獄技術是只能攻擊特定目標,還是能通用攻擊?
3.武器化難度:轉化為實際攻擊需要多少人力成本?
4.可發現性 :這個越獄技術是需要極高專業門檻,還是已經爛大街了?
只有當四個維度都爆表(比如真的能搞垮電網或銀行系統)時,才需要立刻拉響最高級別的紅色警報(7x24小時監控+立即緩解)。
此外,Anthropic 還做出了幾項重要讓步,以討好美國政府。
發布前讓政府先測:以后強大的模型發布前,直接給指定的政府機構提前試用,讓他們自己測安全護欄。
快速情報共享:發現嚴重越獄,第一時間通報政府,共享補丁代碼。
提供算力與團隊:撥出專門的團隊和服務器算力,跟政府搞聯合安全研究。
設立懸賞:推出 HackerOne 賞金計劃,鼓勵白帽子黑客來找 Fable 5 的漏洞。
Fable 5 回來了,但它的回歸之路比所有人想的都要曲折。
它依然是那個最強模型,但被安全護欄束縛的猛獸,還能跑多快?
參考資料:
https://x.com/cxjwin/status/2072272196215673313
https://www.reddit.com/r/ClaudeCode/comments/1ukyp6i/fable_switched_to_opus_48_for_my_scary/
編輯:Aeneas
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.