![]()
最強模型也最貴。
AIX財經(AIXcaijing)原創
作者 | 雷晶
編輯 | 金玙璠
4月,Anthropic推出Mythos模型預覽版。這個模型沒有面向公眾開放,因為在測試中它展現出極強的網絡安全與漏洞挖掘能力,能自主發現數千個高危零日漏洞,一旦流出,容易被用于惡意攻擊。
為了把這種能力鎖定在防御場景內,Anthropic推出了玻璃翼計劃(Project Glasswing),僅向蘋果、谷歌、微軟等12家核心安全伙伴及40余家關鍵基礎設施提供商開放訪問權限,并全程受控使用。
先鎖起來再發布,這套操作本身就制造了話題。
兩個月后,北京時間6月10日凌晨,Anthropic正式推出Fable 5和Mythos 5。
從跑分來看,它們幾乎在所有基準測試中拿到了最高分,尤其在軟件工程和長任務執行上,與其他模型拉開了明顯差距。
但圍繞這個模型的討論,很快就不止于它有多強。
Fable 5和Mythos 5實際上共享同一個底層模型。區別在于,Fable 5面向普通用戶,Mythos 5則繼續鎖在受信任的安全合作伙伴手中。同一個模型,兩套規則,面向兩個群體,這在Anthropic的產品線里是第一次。
而且,普通用戶拿到的也并非完整版本。Anthropic在Fable 5外層加了一道安全分類器,一旦請求觸及網絡安全、生物化學、模型蒸餾等敏感方向,系統會自動切換到能力更弱的上代模型Opus 4.8響應。
定價同樣值得注意,輸入10美元、輸出50美元/百萬Token,官方稱約為Opus 4.8的兩倍。6月23日起,Fable 5還將從Pro、Max等訂閱計劃中移出,用戶想繼續使用,需要額外消耗credits。
這套組合拳拆開來看很合理。能力太強所以做安全限制,成本更高所以提價,風險敏感所以分級發布。但放到一起,釋放的信號就變得微妙了。這和過去幾年大模型公司拼速度、拼開放的競爭邏輯不同,各家都在想辦法讓自家模型觸達更多用戶,而Anthropic選擇主動收窄入口,把限制變成了產品策略的一部分。
那么,這個號稱前所未有的“最強模型”,是被神化了嗎?
01.能力提升明顯,自動降級成爭議
分級歸分級,先看實力到底如何。
![]()
軟件工程是Anthropic這次更新的核心亮點。在SWE-Bench Pro測試中,Fable 5拿到80.3%的成績。這個測試主要是看模型能不能在真實的GitHub倉庫里定位bug、理解上下文、寫出能用的修復代碼,80.3%意味著每5個真實工程問題,Fable 5能解決4個。
在Terminal-Bench 2.1榜單上,Fable 5得分88.0%,超過了Open AI的Codex CLI。值得注意的是,Fable 5是通用模型,Codex CLI是專為編程場景打造的垂直工具,二者的差距更能體現其編程實力。
但真正能看出差距的是FrontierCode Diamond,這項測試考察模型的產出的代碼能不能達到生產級代碼庫的質量標準。Fable 5拿到29.3%,Opus 4.8只有13.4%,GPT-5.5只有5.7%。三個數據均來自Anthropic官方公布,GPT-5.5的數據為其內部測試結果。
過去幾年,AI模型寫代碼的能力一直在進步,但長期卡在一個瓶頸上:代碼能跑,但不好維護;能夠通過基準測試,但落地真實項目中仍會問題頻發。
Fable 5在這個維度上的突破,說明Anthropic這次升級的不只是解題能力,而是把模型往真正的工程交付方向推進。
程序員李夏告訴「AIX財經」,AI生成代碼很容易出現上下文不連貫的問題,初期能精準理解需求,長時間任務中容易遺忘信息,后期維護成本很高。
在他看來,Fable 5在長任務里的邏輯連貫性有明顯進步,同類編碼任務可一次性完成,準確率更高。不過,Fable 5相比Opus4.8生成速度較慢,思考鏈更長,整體響應速度有所下降。
視覺能力也有提升。Anthropic稱,Fable 5能從復雜科學圖表中提取精確數字,也能根據網頁截圖直接重建應用源碼。官方還演示了實操案例,Fable 5只靠游戲畫面截圖就通關《寶可夢火紅》,不需要搭配輔助工具。前代模型做類似任務時,還需要配備復雜的輔助系統。
長上下文和記憶方面,官方給出的說法是,任務越長越復雜,Fable 5的優勢越明顯。
此外,生命科學是另一個被重點提及的方向。Anthropic透露基于Mythos 5搭建的單細胞數據分析模型,覆蓋138個物種,性能優于《Science》近期刊發的同類型模型,參數量卻僅為后者的百分之一。
單從跑分成績來看,綜合能力確實上了一個臺階。
再來看看跑分之外。
Fable 5搭載了一套安全分類器,只要用戶請求涉及網絡安全、生物化學或模型蒸餾方向,系統會自動切換為Opus 4.8來響應,并告知用戶發生了模型降級。官方表示,超過95%的日常對話不會觸發,寫作、編程、分析等任務大多不受影響。不過,實際體驗可能因使用場景有所差異。
在實際使用中,這條界限實際上很容易被觸發。李夏提到,他想在國內Mac上體驗蘋果Siri AI的功能,需要修改一些系統級的序列號參數,Fable 5直接拒絕了操作。目前,分類器設定比較保守,存在誤判,官方稱后續會持續調整。
但Anthropic還披露了另一層限制,對于大模型開發相關的請求,比如構建預訓練流水線、設計分布式訓練基礎設施等,模型會在后臺主動降低輸出質量,且不會告知用戶。
綜合來看,Fable 5在各項硬指標上確實有了進步,但自動降級機制在一定程度上會影響使用體驗。
02.最強模型,不是人人用得上
Anthropic這次的模型升級,用同一個底層模型,包裝成了兩款產品,面向兩類群體。
Mythos 5留在玻璃翼計劃的框架內,只面向蘋果、谷歌、微軟等12家核心安全伙伴及40余家關鍵基礎設施提供商開放,網絡安全和生物方向的限制被解除,Fable 5則面向C端訂閱用戶。
后續Anthropic還計劃向經過審核的研究人員開放一個生物方向的受信通道,提供去掉了生物和化學限制的Fable 5版本。
這涉及到過去大模型行業沒有面對過的問題,當模型能力足夠自主發現漏洞,全量發布就變成了一種風險。
![]()
圖源 / pexels
這解釋了Fable 5和Mythos 5為什么要拆成兩個版本。過去模型分級靠參數,大小之間是能力差距,現在同參數的模型也要分級,分的是信任門檻。
獨立開發者展波認為,從安全角度來看這個邏輯很合理。Mythos級別的漏洞挖掘能力如果不加限制地開放給個人,會大幅降低攻擊成本,容易被濫用于惡意攻擊。先鎖住、再逐步放開受信訪問,是目前最穩妥的路徑。
但安全只解釋了為什么要分層。另一個問題在于,能用上Fable 5的普通用戶,是不是都從中獲益?
從Anthropic發布的跑分和案例來看,這一輪升級,優先服務的是程序員和工程團隊。
展波用Fable 5協助優化了自己用Rust編寫的解釋型語言項目。在同等Web服務場景下,他將其與基于Python的FastAPI和基于Node.js的Hono做了對比。使用Fable 5的解釋器駐留內存僅9.8MB,而FastAPI 和Hono分別為43.3MB和63.0MB,吞吐和延遲指標同樣領先。
他認為同樣一個任務,用Fable 5可能很快就完成,且效果更好。相比于價格,開發者更看重產出質量。只要模型能顯著提升項目效果,高價是可以接受的。
李夏也提到,對程序員來說,模型生成質量和收入正相關。產出質量越高,提效越明顯,回報越大。模型能力的提升可以直接換算成項目質量和時間節省,付費意愿自然會更強。
但換一個使用場景,結論就不一樣了。
AI博主徐子龍以他的日常使用為例,他的日常工作分為寫代碼、做數據分析和寫論文。他認為目前的大模型代碼能力過剩,文字能力欠佳。對于科研工作者、內容創作者、法律和金融從業者等群體來說,對AI的核心需求集中在中文理解、長文寫作和文檔處理上。
展波提到,現在的趨勢不是用戶在挑模型,是模型在挑用戶。編程重度用戶被高端模型篩選出來,日常輕度用戶被推向更有性價比的替代品。這說明,AI不再是一個普惠工具,而是一層層篩出不同支付能力和使用強度的用戶。
即便是最強模型,也要在有需求的人手中才能物有所值。
03.用不起AI的時代,要來了嗎?
Fable 5的API定價是輸入10美元、輸出50美元每百萬Token,是Opus 4.8的兩倍,也是目前全球公開可用的前沿模型中最貴的。
![]()
主流大模型API價格對比
但真正值得關注的不是價格翻了一倍,是付費方式變了。
Fable 5上線后,Pro、Max、Team等訂閱用戶可以免費使用兩周。6月23日起,模型將從訂閱計劃中移出,繼續使用需要額外購買credits,按API費率結算。訂閱期內使用Fable 5,消耗的用量額度也是Opus 4.8的兩倍。
先免費試用再移出訂閱,也是在釋放一種信號,把用戶從固定月費推向按量計費。訂閱制的好處是確定性,用戶知道每月花多少錢;按量計費對平臺更有利,用得多收得多,用戶的花費上限被打開了。說白了,Anthropic想告訴用戶:最先進的東西,本來就不該是包月的。
這個轉變發生的時間點也值得注意。6月1日,Anthropic剛剛向SEC秘密提交了IPO招股書,估值達到9650億美元,目標最早今年10月上市。從年初到5月底,Anthropic的年化收入從90億美元增長至470億美元,其中Claude Code貢獻超過25億美元,企業客戶貢獻了絕大部分收入。
一個即將上市的公司,需要向資本市場證明營收增長能力和定價權。把最強模型從固定訂閱中拆出來、引導高價值用戶按量付費,從財務敘事上看邏輯是通的。
而國產模型正在做完全相反的事。
5月底,DeepSeek宣布V4-Pro API永久降價75%。小米緊隨其后,MiMo-V2.5-Pro降幅高達99%,價格幾乎對齊DeepSeek。
一邊是DeepSeek把價格打到地板,一邊是Anthropic把天花板往上抬,不同玩家有不同的打法。
國產模型的降價一方面是技術紅利的釋放,底層架構發生了變化,省下的空間被用來換更大的市場。
Anthropic的邏輯正好反過來。它不需要靠低價搶市場,高價本身也是篩選器,把愿意為前沿能力付費的高價值用戶留下來。
徐子龍認為未來AI會越來越貴,因為需求的擴張遠遠大于供給的擴張,算力涉及到電、芯片、模型訓練,增長速度太慢。AI算力未來會像5G一樣成為基礎設施,但和5G不同,算力的供給遠比帶寬緊張,價格也就相應的增長。
從商業模式上看,AI行業正在出現類似云計算早期的分層結構。底層是高度標準化、價格趨近于零的通用能力,誰都能調用,靠走量變現;頂層是少數廠商把持的前沿能力,定價權集中,靠客單價變現。通用能力的價格會被持續壓低,但前沿能力的溢價將長期存在。
從能力分級到付費分層,AI行業正在復制云計算走過的路。便宜的模型越來越多,最好的模型越來越貴。
*應受訪者要求,文中李夏為化名。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.