无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

公開版Mythos上線,Claude最強模型開始分層發售

0
分享至

來源:市場資訊

(來源:字母榜)

Anthropic終于把Mythos推向了公開市場,但分層發售。

凌晨,Anthropic正式發布Claude Fable 5和Claude Mythos 5。前者面向普通用戶開放,后者則繼續限制在“受信任的安全合作伙伴”范圍內。


新模型的命名可以說很符合Claude一貫的風格。

從Haiku(俳句)到Sonnet(十四行詩)再到Opus(藝術巨著),Anthropic一直在用文學和藝術概念給模型分層,到了Mythos,名字已經從文學作品膨脹到“神話”本身。

Fable來自拉丁語fabula,意思是“被講述之物”,和希臘語mythos同源,直譯過來的話一般被稱為“寓言”。這個名字正如新模型的定位,一個“Mythos級”的模型,一個“公開的神話”。

按照Anthropic的描述,Fable 5和Mythos 5共享同一個底層模型,只是被裝進了更適合公開分發的安全殼里。在官方給出的模型能力上,它們兩個被放在同一個位置。


但跑分歸跑分,如果Fable和Mythos的表現完全一樣,我想應該也不用分成兩個名字了。

01

被改寫的“神話”

神話被改寫、被壓縮、被加上訓誡之后,變成了寓言。

按照官方文檔,Fable 5是公開版本。它面向普通用戶和開發者開放,但在網絡安全、生物、化學以及模型蒸餾等高風險領域,會由額外的安全分類器介入。一旦系統判斷請求可能涉及這些敏感方向,回答就不會由Fable 5繼續完成,而是自動回退到Claude Opus 4.8。

Mythos 5基于同樣的底層模型,但在部分領域解除了Fable 5的護欄。Anthropic稱,Project Glasswing里的網絡安全合作伙伴可以使用“滿血版”Mythos 5;未來,部分生命科學研究者也可能通過受信任訪問計劃,使用解除生物和化學限制的版本。

用不到的Mythos我們暫時不提,先看點實在的東西。

首先是定價,一個字,貴。

Fable 5的定價是輸入10美元/百萬token,輸出50美元/百萬token。開發者現在就可以通過Claude API調用claude-fable-5(模型名)。

這個價格剛好是Opus 4.8的兩倍,和Opus 4.8的fast mode相同,Anthropic顯然把它放在了比Opus更高一檔的價格層級里。

不過Anthropic稱,這一價格不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非公開API模型,官方并未給出面向公眾的標準價,這句話也無從驗證。

訂閱用戶也需要注意,Fable 5不一定會長期直接包含在基礎訂閱包里。

Anthropic在官方說明中提到,6月23日以后,即使用戶已經訂閱Claude,Fable 5也可能根據算力情況按量提供,不一定會直接包含在基礎訂閱服務中。

這公司越來越吝嗇了,不過好歹還留了小半個月試用期。官方也留了一點余地:如果6月23日以后算力資源足夠,Anthropic會盡量把Fable 5繼續包含在Pro、Max等訂閱服務里。


定價高本身并非難以理解,但它最好保證它的能力配得上它的價格。

從跑分上看,Fable 5/Mythos 5基本是Anthropic目前公開表里最強的一檔。

不過官方表格有一個說明,Claude Fable 5和Claude Mythos 5的分數一般只差1–3個百分點(除了帶星號的網絡安全、生物相關測試),所以表里顯示的是兩者更高的分數。這一點很難不讓人想要吐槽。


Anthropic把Fable 5的重點放在幾個方向:軟件工程、知識工作、視覺、長上下文記憶和生命科學研究。

軟件工程是最突出的場景之一,根據表格,Fable/Mythos 5在SWE-Bench Pro上達到80.3%,明顯高于Opus 4.8的69.2%;在更難的FrontierCode Diamond上,它拿到29.3%,而Opus 4.8只有13.4%,GPT-5.5只有5.7%。



知識工作和視覺任務上,Anthropic給出了兩類證據。

一類是標準化benchmark。官方表格顯示,Fable/Mythos 5在GDPval-AA上得分1932,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro;在GDP.pdf這種帶視覺理解的文檔任務上,它達到29.8%,也超過其他主要模型。

另一類是早期客戶測試。Anthropic稱,Fable 5在Hebbia的高級金融推理基準上取得最高分,優勢集中在文檔推理、圖表和表格理解、問題求解;IMC也反饋,它在交易分析評估中幾乎全面通過。

為了展示Fable 5的視覺能力,Anthropic舉的例子是:此前Claude模型需要復雜輔助工具才能玩《寶可夢 火紅》,而Fable 5只靠視覺輸入就可以通關。


長任務和記憶能力上,Anthropic稱,Fable 5可以在數百萬token的長期任務中保持專注,并利用自己的筆記改進輸出。

在《殺戮尖塔》這類需要連續決策和長期策略的游戲里,如果給Fable 5接入持久文件記憶,讓它能記錄前面的選擇和經驗,它的表現會明顯提升。提升幅度是Opus 4.8的三倍,到達最終關卡的次數也提高了三倍。

順便一提,Fable也是一款經典RPG游戲的名字,中文譯作《神鬼寓言》——或許某天我們能看到Fable玩《Fable》。

另外,網絡安全能力方面,Fable/Mythos 5在ExploitBench Cap%上達到78.0%,超過Claude Mythos Preview的69.0%,接近Opus 4.8的兩倍。

這里用的應該是Mythos 5的得分,因為Fable 5在高風險請求上會回退到Opus 4.8。

02

強大的模型必須分層

Anthropic這次把模型能力的直觀展示放到了一個類似”作品集“的滑頁里,并且每個demo只給了一小段注釋。


比如,Fable 5寫了一個太陽系模擬,從物理第一性原理推導行星軌道運動,并用它預測日食。


又比如,它可以自主玩《異星工廠》。這是一款工程師很愛的工廠自動化游戲,玩家要采集資源、規劃生產線、搭建物流和能源系統。

Anthropic用這個例子說明,Fable 5可以在一個開放環境里制定策略,并持續推進一個復雜系統的建設。


在另一個demo里,Fable 5先做了一個基于瀏覽器的CAD編輯器,然后又使用這個由自己開發的CAD工具,設計了一個可以3D打印的完整模型。這個編輯器里還內置了AI copilot,用來輔助建模。

這個demo的重點在于Fable 5完成了一個閉環:先創造工具,再使用工具,最后完成一個實體設計任務。


最后一個demo,Anthropic展示了一個由Fable 5寫出來的流體模擬,運動節奏和一段古典音樂EDM remix同步。官方還特意提到,音樂也是Fable 5用代碼生成的。


這些案例看起來挺花哨,但意思是一樣的:Fable 5很擅長把代碼、視覺、物理、設計和長期規劃混在一起做任務。

如果說這部分展示的還是Fable 5在開發者手里能做到什么程度,后面的部分說的就是Mythos 5在研究者手里能做什么——以及Anthropic為什么要把Fable和Mythos分開。

Anthropic稱,在內部蛋白設計專家的評估中,Mythos 5把藥物設計流程中的部分環節加速了大約10倍。其中一個案例里,Mythos 5接入蛋白設計和生物信息學工具、沒有人類幫助,就可以匹配甚至超過熟練人類操作員。

在該任務中,Mythos 5做的不是簡單問答,而是完成一整套科學工作流:選擇結合位點,選擇并運行蛋白設計工具,在失敗后自己恢復。官方稱,在這項研究的14個蛋白靶點中,有9個產生了強候選分子,目前正在進一步研究。


Anthropic還提到,Mythos 5可以穩定提出新穎、有吸引力的分子生物學假設。在和Opus級模型的盲測對比中,內部科學家大約80%的時候更偏好Mythos提出的假設,其中一些已經進入實驗評估。

與此同時,Mythos 5的一個關于大腸桿菌蛋白的新機制的假設,在另一家獨立研究同一問題的實驗室的研究中得到了證實。

它甚至還做了一項基因組學研究。

Anthropic稱,Mythos 5在一周多的時間里,幾乎自主完成了一項新的基因組學研究。它整理了橫跨138種動物、數百萬個細胞的單細胞數據,并設計、訓練了一個定制機器學習模型,用來識別不同物種中執行相同角色的細胞。

更夸張的是,Anthropic稱,Mythos 5訓練出的模型性能超過了近期發表在《Science》上的一個模型,盡管它的規模只有后者的百分之一。Anthropic表示,計劃在未來幾個月發表這些結果。

當然,這部分還需要等待論文和外部復核。但如果只看Anthropic官方給出的信息,Mythos 5在生命科學里展示的能力已經接近科研Agent:能讀問題、用工具、處理數據、訓練模型、提出假設,并把一項研究推進到可以發表的程度。

而一旦模型可以在藥物設計、病毒載體、蛋白設計、基因組學研究這些方向里真正推進任務,它就天然具備雙重用途。

可以認為,生命科學這部分不是Fable 5的普通功能演示,而是Mythos 5的能力上限展示。

但它被展示出來,是為了說明Anthropic手里的這套底層模型,已經強到了必須通過受信任訪問來分發。

有意思的是,過去的模型發布更像是一件技術產品的事:參數、跑分、價格、上下文長度、API名稱。強就是強,發布就是發布。

但到了Mythos這里,事情開始變得復雜。同一個底層模型被分為兩個版本,普通用戶拿到的是Fable 5,安全研究者和部分生命科學研究者拿到的是Mythos 5;前者被裝進更嚴格的護欄里,后者則需要受信任訪問。

模型能力不再只有高低之分,也開始有權限、場景和責任之分。

某種意義上來講,可以看作前沿模型商業化進入新階段的信號——越強的模型,越不可能直接扔給所有人。它們會被拆成不同版本,放進不同安全邊界,再交給不同類型的用戶。

Anthropic先這么做了,因為它們的模型“強到不能完全公開”。未來其它想要講故事的公司,想要證明自己的模型也很強,或許也會效仿這種方式。(作者/袁心玥)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
來華30天就退學!印度留學生:受不了中國校園規矩與快節奏

來華30天就退學!印度留學生:受不了中國校園規矩與快節奏

戶外阿毽
2026-06-09 00:27:31
烏克蘭現在多厲害?你可能都想象不到,或許已成為世界頂尖強軍!

烏克蘭現在多厲害?你可能都想象不到,或許已成為世界頂尖強軍!

老范談史
2026-06-09 19:35:16
邵佳一道歉:國足欠缺運氣!球員接近完美 王鈺棟需要更專注足球

邵佳一道歉:國足欠缺運氣!球員接近完美 王鈺棟需要更專注足球

念洲
2026-06-10 07:06:21
高考賺了30萬,如今剛上大二的他,靠直播帶貨為母親在老家蓋新房

高考賺了30萬,如今剛上大二的他,靠直播帶貨為母親在老家蓋新房

米果說識
2026-06-09 14:41:50
中國14歲冰球少年毆打泰國裁判引眾怒,球隊被取消比賽資格

中國14歲冰球少年毆打泰國裁判引眾怒,球隊被取消比賽資格

曼谷陳大叔
2026-06-09 13:36:27
吳千語施伯雄在上海新家拍大片,4層別墅公開,老錢風裝修真高級

吳千語施伯雄在上海新家拍大片,4層別墅公開,老錢風裝修真高級

八怪娛
2026-06-09 11:03:36
從職業運動員到模特的米凱拉-德梅特

從職業運動員到模特的米凱拉-德梅特

喜歡歷史的阿繁
2026-06-10 09:19:05
中方重拳出擊:拒“政治小丑”于國門外

中方重拳出擊:拒“政治小丑”于國門外

小眼睛小世界
2026-06-09 06:18:50
為什么失業嚴重,社會卻安靜的可怕,沒有亂起來?答案扎心又現實

為什么失業嚴重,社會卻安靜的可怕,沒有亂起來?答案扎心又現實

王姐懶人家常菜
2026-06-04 13:00:46
2004年,中組部副部長對李力群說:高崗平反時機未到,請耐心等待

2004年,中組部副部長對李力群說:高崗平反時機未到,請耐心等待

帝哥說史
2026-06-01 22:04:40
貴州神泉谷旅游區遭洪水淹沒,多棟民宿被沖毀!游客已轉移

貴州神泉谷旅游區遭洪水淹沒,多棟民宿被沖毀!游客已轉移

南方都市報
2026-06-09 20:14:30
CBA最新消息!山東男籃更換教練,弗格正式離開上海男籃

CBA最新消息!山東男籃更換教練,弗格正式離開上海男籃

體壇瞎白話
2026-06-09 10:27:54
消息稱SpaceX獲4倍超額認購:認購資金超2500億美元

消息稱SpaceX獲4倍超額認購:認購資金超2500億美元

IT之家
2026-06-10 08:17:24
哈蘭德女友開通抖音:終于輪到我加入了,我非常興奮

哈蘭德女友開通抖音:終于輪到我加入了,我非常興奮

懂球帝
2026-06-09 18:49:46
阿爾瓦雷斯轉會陷僵局:馬競寸步不讓,皇馬巴薩各有算盤

阿爾瓦雷斯轉會陷僵局:馬競寸步不讓,皇馬巴薩各有算盤

樂道足球C
2026-06-10 09:58:48
醫藥代表,迎最難時刻!

醫藥代表,迎最難時刻!

醫療器械經銷商聯盟
2026-06-10 08:03:15
卡里克效仿巴黎打造曼聯中場,要求新帝星改變!巴萊巴積極求加盟

卡里克效仿巴黎打造曼聯中場,要求新帝星改變!巴萊巴積極求加盟

羅米的曼聯博客
2026-06-10 09:57:10
《跑男》索要850萬惹眾怒!導演囂張發文,挑釁觀眾,吃相難看

《跑男》索要850萬惹眾怒!導演囂張發文,挑釁觀眾,吃相難看

有范又有料
2026-06-09 12:07:08
俄媒女主持人曾言:若中國愿出兵300萬,俄軍很快就能打敗烏克蘭

俄媒女主持人曾言:若中國愿出兵300萬,俄軍很快就能打敗烏克蘭

南宗歷史
2026-03-17 16:53:10
馬斯克變身包租公:向全世界展示了,數據中心到底有多么暴利

馬斯克變身包租公:向全世界展示了,數據中心到底有多么暴利

民間胡扯老哥
2026-06-09 05:44:14
2026-06-10 10:24:49
新浪財經 incentive-icons
新浪財經
新浪財經是一家創建于1999年8月的財經平臺
3550136文章數 7948關注度
往期回顧 全部

科技要聞

凌晨突發!Anthropic神級模型向你開放

頭條要聞

牛彈琴:先進的戰機被伊朗干掉 美國惱羞成怒猛烈報復

頭條要聞

牛彈琴:先進的戰機被伊朗干掉 美國惱羞成怒猛烈報復

體育要聞

誰會花400萬,去看一場尼克斯的比賽?

娛樂要聞

吳文忻因癌癥惡化離世,女兒哭泣不舍

財經要聞

大盤股IPO終結行情盛宴?背后真相來了

汽車要聞

賽豆科技AIVA品牌發布 全系產品覆蓋20萬級市場/量產車年內亮相

態度原創

游戲
手機
家居
旅游
軍事航空

《紅色沙漠》稱只要玩家有需求就會一直更新

手機要聞

蘋果iOS 27調整鎖屏設置,縮小時鐘解決遮擋壁紙痛點

家居要聞

空間微調 移形換境

旅游要聞

河南應屆中、高考生部分免門票景區匯總

軍事要聞

特朗普證實美軍直升機墜毀霍爾木茲

無障礙瀏覽 進入關懷版