无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Anthropic發了“最強模型”,但大多數人用不上

0
分享至


最強模型也最貴。

AIX財經(AIXcaijing)原創

作者 | 雷晶

編輯 | 金玙璠

4月,Anthropic推出Mythos模型預覽版。這個模型沒有面向公眾開放,因為在測試中它展現出極強的網絡安全與漏洞挖掘能力,能自主發現數千個高危零日漏洞,一旦流出,容易被用于惡意攻擊。

為了把這種能力鎖定在防御場景內,Anthropic推出了玻璃翼計劃(Project Glasswing),僅向蘋果、谷歌、微軟等12家核心安全伙伴及40余家關鍵基礎設施提供商開放訪問權限,并全程受控使用。

先鎖起來再發布,這套操作本身就制造了話題。

兩個月后,北京時間6月10日凌晨,Anthropic正式推出Fable 5和Mythos 5。

從跑分來看,它們幾乎在所有基準測試中拿到了最高分,尤其在軟件工程和長任務執行上,與其他模型拉開了明顯差距。

但圍繞這個模型的討論,很快就不止于它有多強。

Fable 5和Mythos 5實際上共享同一個底層模型。區別在于,Fable 5面向普通用戶,Mythos 5則繼續鎖在受信任的安全合作伙伴手中。同一個模型,兩套規則,面向兩個群體,這在Anthropic的產品線里是第一次。

而且,普通用戶拿到的也并非完整版本。Anthropic在Fable 5外層加了一道安全分類器,一旦請求觸及網絡安全、生物化學、模型蒸餾等敏感方向,系統會自動切換到能力更弱的上代模型Opus 4.8響應。

定價同樣值得注意,輸入10美元、輸出50美元/百萬Token,官方稱約為Opus 4.8的兩倍。6月23日起,Fable 5還將從Pro、Max等訂閱計劃中移出,用戶想繼續使用,需要額外消耗credits。

這套組合拳拆開來看很合理。能力太強所以做安全限制,成本更高所以提價,風險敏感所以分級發布。但放到一起,釋放的信號就變得微妙了。這和過去幾年大模型公司拼速度、拼開放的競爭邏輯不同,各家都在想辦法讓自家模型觸達更多用戶,而Anthropic選擇主動收窄入口,把限制變成了產品策略的一部分。

那么,這個號稱前所未有的“最強模型”,是被神化了嗎?

01.能力提升明顯,自動降級成爭議

分級歸分級,先看實力到底如何。


軟件工程是Anthropic這次更新的核心亮點。在SWE-Bench Pro測試中,Fable 5拿到80.3%的成績。這個測試主要是看模型能不能在真實的GitHub倉庫里定位bug、理解上下文、寫出能用的修復代碼,80.3%意味著每5個真實工程問題,Fable 5能解決4個。

在Terminal-Bench 2.1榜單上,Fable 5得分88.0%,超過了Open AI的Codex CLI。值得注意的是,Fable 5是通用模型,Codex CLI是專為編程場景打造的垂直工具,二者的差距更能體現其編程實力。

但真正能看出差距的是FrontierCode Diamond,這項測試考察模型的產出的代碼能不能達到生產級代碼庫的質量標準。Fable 5拿到29.3%,Opus 4.8只有13.4%,GPT-5.5只有5.7%。三個數據均來自Anthropic官方公布,GPT-5.5的數據為其內部測試結果。

過去幾年,AI模型寫代碼的能力一直在進步,但長期卡在一個瓶頸上:代碼能跑,但不好維護;能夠通過基準測試,但落地真實項目中仍會問題頻發。

Fable 5在這個維度上的突破,說明Anthropic這次升級的不只是解題能力,而是把模型往真正的工程交付方向推進。

程序員李夏告訴「AIX財經」,AI生成代碼很容易出現上下文不連貫的問題,初期能精準理解需求,長時間任務中容易遺忘信息,后期維護成本很高。

在他看來,Fable 5在長任務里的邏輯連貫性有明顯進步,同類編碼任務可一次性完成,準確率更高。不過,Fable 5相比Opus4.8生成速度較慢,思考鏈更長,整體響應速度有所下降。

視覺能力也有提升。Anthropic稱,Fable 5能從復雜科學圖表中提取精確數字,也能根據網頁截圖直接重建應用源碼。官方還演示了實操案例,Fable 5只靠游戲畫面截圖就通關《寶可夢火紅》,不需要搭配輔助工具。前代模型做類似任務時,還需要配備復雜的輔助系統。

長上下文和記憶方面,官方給出的說法是,任務越長越復雜,Fable 5的優勢越明顯。

此外,生命科學是另一個被重點提及的方向。Anthropic透露基于Mythos 5搭建的單細胞數據分析模型,覆蓋138個物種,性能優于《Science》近期刊發的同類型模型,參數量卻僅為后者的百分之一。

單從跑分成績來看,綜合能力確實上了一個臺階。

再來看看跑分之外。

Fable 5搭載了一套安全分類器,只要用戶請求涉及網絡安全、生物化學或模型蒸餾方向,系統會自動切換為Opus 4.8來響應,并告知用戶發生了模型降級。官方表示,超過95%的日常對話不會觸發,寫作、編程、分析等任務大多不受影響。不過,實際體驗可能因使用場景有所差異。

在實際使用中,這條界限實際上很容易被觸發。李夏提到,他想在國內Mac上體驗蘋果Siri AI的功能,需要修改一些系統級的序列號參數,Fable 5直接拒絕了操作。目前,分類器設定比較保守,存在誤判,官方稱后續會持續調整。

但Anthropic還披露了另一層限制,對于大模型開發相關的請求,比如構建預訓練流水線、設計分布式訓練基礎設施等,模型會在后臺主動降低輸出質量,且不會告知用戶。

綜合來看,Fable 5在各項硬指標上確實有了進步,但自動降級機制在一定程度上會影響使用體驗。

02.最強模型,不是人人用得上

Anthropic這次的模型升級,用同一個底層模型,包裝成了兩款產品,面向兩類群體。

Mythos 5留在玻璃翼計劃的框架內,只面向蘋果、谷歌、微軟等12家核心安全伙伴及40余家關鍵基礎設施提供商開放,網絡安全和生物方向的限制被解除,Fable 5則面向C端訂閱用戶。

后續Anthropic還計劃向經過審核的研究人員開放一個生物方向的受信通道,提供去掉了生物和化學限制的Fable 5版本。

這涉及到過去大模型行業沒有面對過的問題,當模型能力足夠自主發現漏洞,全量發布就變成了一種風險。


圖源 / pexels

這解釋了Fable 5和Mythos 5為什么要拆成兩個版本。過去模型分級靠參數,大小之間是能力差距,現在同參數的模型也要分級,分的是信任門檻。

獨立開發者展波認為,從安全角度來看這個邏輯很合理。Mythos級別的漏洞挖掘能力如果不加限制地開放給個人,會大幅降低攻擊成本,容易被濫用于惡意攻擊。先鎖住、再逐步放開受信訪問,是目前最穩妥的路徑。

但安全只解釋了為什么要分層。另一個問題在于,能用上Fable 5的普通用戶,是不是都從中獲益?

從Anthropic發布的跑分和案例來看,這一輪升級,優先服務的是程序員和工程團隊。

展波用Fable 5協助優化了自己用Rust編寫的解釋型語言項目。在同等Web服務場景下,他將其與基于Python的FastAPI和基于Node.js的Hono做了對比。使用Fable 5的解釋器駐留內存僅9.8MB,而FastAPI 和Hono分別為43.3MB和63.0MB,吞吐和延遲指標同樣領先。

他認為同樣一個任務,用Fable 5可能很快就完成,且效果更好。相比于價格,開發者更看重產出質量。只要模型能顯著提升項目效果,高價是可以接受的。

李夏也提到,對程序員來說,模型生成質量和收入正相關。產出質量越高,提效越明顯,回報越大。模型能力的提升可以直接換算成項目質量和時間節省,付費意愿自然會更強。

但換一個使用場景,結論就不一樣了。

AI博主徐子龍以他的日常使用為例,他的日常工作分為寫代碼、做數據分析和寫論文。他認為目前的大模型代碼能力過剩,文字能力欠佳。對于科研工作者、內容創作者、法律和金融從業者等群體來說,對AI的核心需求集中在中文理解、長文寫作和文檔處理上。

展波提到,現在的趨勢不是用戶在挑模型,是模型在挑用戶。編程重度用戶被高端模型篩選出來,日常輕度用戶被推向更有性價比的替代品。這說明,AI不再是一個普惠工具,而是一層層篩出不同支付能力和使用強度的用戶。

即便是最強模型,也要在有需求的人手中才能物有所值。

03.用不起AI的時代,要來了嗎?

Fable 5的API定價是輸入10美元、輸出50美元每百萬Token,是Opus 4.8的兩倍,也是目前全球公開可用的前沿模型中最貴的。


主流大模型API價格對比

但真正值得關注的不是價格翻了一倍,是付費方式變了。

Fable 5上線后,Pro、Max、Team等訂閱用戶可以免費使用兩周。6月23日起,模型將從訂閱計劃中移出,繼續使用需要額外購買credits,按API費率結算。訂閱期內使用Fable 5,消耗的用量額度也是Opus 4.8的兩倍。

先免費試用再移出訂閱,也是在釋放一種信號,把用戶從固定月費推向按量計費。訂閱制的好處是確定性,用戶知道每月花多少錢;按量計費對平臺更有利,用得多收得多,用戶的花費上限被打開了。說白了,Anthropic想告訴用戶:最先進的東西,本來就不該是包月的。

這個轉變發生的時間點也值得注意。6月1日,Anthropic剛剛向SEC秘密提交了IPO招股書,估值達到9650億美元,目標最早今年10月上市。從年初到5月底,Anthropic的年化收入從90億美元增長至470億美元,其中Claude Code貢獻超過25億美元,企業客戶貢獻了絕大部分收入。

一個即將上市的公司,需要向資本市場證明營收增長能力和定價權。把最強模型從固定訂閱中拆出來、引導高價值用戶按量付費,從財務敘事上看邏輯是通的。

而國產模型正在做完全相反的事。

5月底,DeepSeek宣布V4-Pro API永久降價75%。小米緊隨其后,MiMo-V2.5-Pro降幅高達99%,價格幾乎對齊DeepSeek。

一邊是DeepSeek把價格打到地板,一邊是Anthropic把天花板往上抬,不同玩家有不同的打法。

國產模型的降價一方面是技術紅利的釋放,底層架構發生了變化,省下的空間被用來換更大的市場。

Anthropic的邏輯正好反過來。它不需要靠低價搶市場,高價本身也是篩選器,把愿意為前沿能力付費的高價值用戶留下來。

徐子龍認為未來AI會越來越貴,因為需求的擴張遠遠大于供給的擴張,算力涉及到電、芯片、模型訓練,增長速度太慢。AI算力未來會像5G一樣成為基礎設施,但和5G不同,算力的供給遠比帶寬緊張,價格也就相應的增長。

從商業模式上看,AI行業正在出現類似云計算早期的分層結構。底層是高度標準化、價格趨近于零的通用能力,誰都能調用,靠走量變現;頂層是少數廠商把持的前沿能力,定價權集中,靠客單價變現。通用能力的價格會被持續壓低,但前沿能力的溢價將長期存在。

從能力分級到付費分層,AI行業正在復制云計算走過的路。便宜的模型越來越多,最好的模型越來越貴。

*應受訪者要求,文中李夏為化名。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
二手平臺出售超高價玩具人偶,標有身高體重性格等,平臺:不涉及兒童販賣

二手平臺出售超高價玩具人偶,標有身高體重性格等,平臺:不涉及兒童販賣

西游日記
2026-07-01 22:30:59
打下臺灣到底有多難?

打下臺灣到底有多難?

野書文
2026-07-02 07:02:04
蘇州一醫院現低矮“丁義珍式”窗口,院方回應

蘇州一醫院現低矮“丁義珍式”窗口,院方回應

界面新聞
2026-07-02 18:46:01
A股:今天午后加速跳水到4046,種種跡象表明,A股牛市已經開始熄火?

A股:今天午后加速跳水到4046,種種跡象表明,A股牛市已經開始熄火?

趨勢清風俠
2026-07-02 14:06:53
山東泰山這樣做,和窮瘋了有什么區別

山東泰山這樣做,和窮瘋了有什么區別

清書先生
2026-07-02 11:23:32
突發!以色列宣布:打死伊斯梅爾·馬斯里

突發!以色列宣布:打死伊斯梅爾·馬斯里

每日經濟新聞
2026-06-30 11:36:05
“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
浙江省紀委省監委:沈午衛,主動投案!

浙江省紀委省監委:沈午衛,主動投案!

都市快報橙柿互動
2026-07-02 19:25:37
從2026年7月1日起,全國將強制執行退休返聘及超齡員工,好事呀!

從2026年7月1日起,全國將強制執行退休返聘及超齡員工,好事呀!

福建睿平
2026-07-02 07:47:57
德布勞內:我和多庫同時被換下確實驚訝,最終證明教練是對的

德布勞內:我和多庫同時被換下確實驚訝,最終證明教練是對的

懂球帝
2026-07-02 11:48:10
安倍晉三“不務正業”的水彩畫,張張封神!

安倍晉三“不務正業”的水彩畫,張張封神!

國際藝術大觀
2026-07-01 20:40:08
當今社會內卷成什么樣了?網友說:5年刑期以下的生意都沒利潤了

當今社會內卷成什么樣了?網友說:5年刑期以下的生意都沒利潤了

燈錦年
2026-07-02 18:05:22
澤連斯基緊急回國!

澤連斯基緊急回國!

每日經濟新聞
2026-07-02 17:59:23
哈國緊急聯手美歐,亮出稀土底牌,以為中方沒辦法?西方高興早了

哈國緊急聯手美歐,亮出稀土底牌,以為中方沒辦法?西方高興早了

策前論
2026-07-02 14:53:42
四處樹敵可不是“蠢貨”能做到的

四處樹敵可不是“蠢貨”能做到的

律法刑道
2026-07-02 09:04:40
湖南省人民政府參事李大劍接受紀律審查和監察調查

湖南省人民政府參事李大劍接受紀律審查和監察調查

環球網資訊
2026-07-02 18:20:08
網曝浙江某工廠聘請很多印度勞工,食堂吃飯照曝光,網友:快舉報

網曝浙江某工廠聘請很多印度勞工,食堂吃飯照曝光,網友:快舉報

小徐講八卦
2026-07-02 11:43:38
賺著中國人錢,毒害中國人身體,日企在華收割萬億,至今仍在售賣

賺著中國人錢,毒害中國人身體,日企在華收割萬億,至今仍在售賣

云舟史策
2026-07-02 07:09:53
她預言了自己的死亡!!

她預言了自己的死亡!!

梳子姐
2026-07-01 20:01:45
京東方A大逆襲!493億天量創歷史記錄,95萬股民迎來股價18年新高,安徽合肥又贏了

京東方A大逆襲!493億天量創歷史記錄,95萬股民迎來股價18年新高,安徽合肥又贏了

金融界
2026-07-02 16:01:29
2026-07-02 19:55:00
AIX財經 incentive-icons
AIX財經
AI新時代,財經新觀察。
73文章數 23223關注度
往期回顧 全部

科技要聞

馬斯克不承認,但SpaceX就該造AI手機

頭條要聞

患罕見病被背進考場男生考出643分 想報考中醫藥專業

頭條要聞

患罕見病被背進考場男生考出643分 想報考中醫藥專業

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

小鵬MONA L03 智能化水平拉滿 還有玩法多樣的巧思大空間

態度原創

健康
家居
親子
旅游
數碼

這4類消化病患者 吃粘食管住嘴

家居要聞

傳奇筑 日常詩

親子要聞

分年齡段選購兒童被子指南:不同成長階段核心需求與選型方向梳理

旅游要聞

“帶著饸饹去旅行·重走秦直道”主題文旅交流活動走進榆林橫山

數碼要聞

珂芝推出Z1 mini無線辦公輕音鼠標,79元

無障礙瀏覽 進入關懷版