硅谷有個(gè)名字傳了很久——Mythos。Anthropic藏得最深的王牌,據(jù)說能力甩開市面上所有模型一個(gè)代際。
連谷歌創(chuàng)始人謝爾蓋·布林都說:"用過Mythos你就知道,那就是純粹的AGI。如果你覺得這都不算AGI,那我不知道什么才算AGI。"
Anthropic IPO在即,投資人要看彈藥庫(kù)有多大。憋了這么久,昨晚正式發(fā)布Mythos的公眾版:Claude Fable 5。
![]()
神話和寓言
這次同時(shí)扔出了兩個(gè)模型:Claude Mythos 5和Claude Fable 5,一個(gè)叫神話,一個(gè)叫寓言。
Mythos 5是全功率版本,沒有安全閹割。但這個(gè)模型不賣,只通過Project Glasswing配發(fā)給政府機(jī)構(gòu)、網(wǎng)絡(luò)安全團(tuán)隊(duì)和特定生物安全研究機(jī)構(gòu)。
而Fable 5,是Mythos 5加了安全護(hù)欄以后的公眾版。你的請(qǐng)求如果涉及網(wǎng)絡(luò)攻防、生物化學(xué)武器或者模型蒸餾這些敏感領(lǐng)域,系統(tǒng)會(huì)悄悄把請(qǐng)求降級(jí)到 Opus 4.8 來(lái)處理。據(jù)Anthropic說降級(jí)觸發(fā)率不到5%。
![]()
另外,這次計(jì)費(fèi)方式不一樣,6月9日到6月22日,所有Pro、Max、Team、Enterprise訂閱用戶都可以免費(fèi)試用Fable 5,不消耗積分。22號(hào)之后繼續(xù)用就要按2倍于Opus 的速度燒積分了,但管他呢,先爽兩周再說。
![]()
來(lái)看數(shù)據(jù)
SWE-bench Pro:80.3%,GPT-5.5 是 58.6%。22 個(gè)點(diǎn)的差距,不是"又進(jìn)步了一點(diǎn)",是隔了一代。
FrontierCode 鉆石難度:29.3%,GPT-5.5 只有 5.7%,差了五倍多。
人類最后的測(cè)試:64.5%,領(lǐng)先過往模型最高分十二個(gè)點(diǎn)。
![]()
還有一件事比這些數(shù)字更有力,Stripe把自家5000萬(wàn)行Ruby代碼丟給Fable 5做全庫(kù)遷移,一天干完了。 正常一個(gè)工程團(tuán)隊(duì)預(yù)計(jì)要搞兩個(gè)多月。
![]()
連卡帕西都說,未來(lái)的軟件就跟自來(lái)水一樣了,擰開水龍頭嘩嘩往外流。
![]()
我自己也試了試
激動(dòng)的心顫抖的手,我趕緊沖到辦公室把電腦打開升級(jí)了。
我最近在做一個(gè)健身APP,升級(jí)完之后第一件事,就是讓Fable 5看看我這些代碼,問它哪些功能可以加強(qiáng)。它自己推理了一會(huì)兒,列了幾個(gè)改進(jìn)優(yōu)先級(jí),邏輯很清楚,每個(gè)方案都給了解釋。我說"那你就干吧,我要出門了,給我按8小時(shí)干"。
![]()
然后我就干了一件特別手賤的事——出門前把手機(jī)插電腦上充電。等我回來(lái),整個(gè)人傻了。Fable 5自己檢測(cè)到了連接的設(shè)備,自己判斷可以部署,自己動(dòng)手改了,直接給我把APP更新了版本。
我翻了翻,一個(gè)小時(shí)優(yōu)化了好幾處功能,朋友圈分享、GPS軌跡等等都優(yōu)化了。以前我分享健身記錄的手寫評(píng)論、手動(dòng)配圖、選了朋友圈再發(fā);現(xiàn)在它自動(dòng)寫評(píng)論、自動(dòng)配圖,一鍵發(fā)朋友圈。前兩天我?guī)畠喝チ榴R河劃船的圖,就是用這個(gè)功能發(fā)出去的,效果特別好。
![]()
還有GPS軌跡也優(yōu)化了。以前用Opus寫的代碼總有幾十米偏差,我跑步、騎車的軌跡經(jīng)常飄到河里、穿過墻,這次它直接給修好了。我剛騎車出去轉(zhuǎn)了一圈,軌跡和真實(shí)路徑一致。
網(wǎng)友整了什么花活
Fable 5剛發(fā)布不到24小時(shí),推特上的網(wǎng)友已經(jīng)玩出花了。我看到的幾個(gè)案例,每一個(gè)都?jí)蚝纫粔亍?/p>
這次Anthropic放話,F(xiàn)able 5是目前最先進(jìn)的視覺任務(wù)模型。最直觀的證明就是Fable 5純靠截圖通關(guān)了《精靈寶可夢(mèng) 火紅版》。以前的Claude模型想打游戲,得配上復(fù)雜的輔助工具,F(xiàn)able 5是直接看圖,像人一樣根據(jù)屏幕上的像素來(lái)判定位置、理解對(duì)話、做出戰(zhàn)斗決策,視覺理解跟決策的耦合上了一個(gè)臺(tái)階。
當(dāng)然,它不止能玩游戲,還能當(dāng)場(chǎng)造一個(gè)。
有人讓Fable 5復(fù)刻做一個(gè)《寶可夢(mèng)》。一句話指令"Make a Pokémon clone",模型推理1小時(shí),一口氣輸出8000行代碼。151只寶可夢(mèng)的精靈圖、隊(duì)伍圖標(biāo)、真實(shí)叫聲、屬性、技能表、進(jìn)化、捕獲率、成長(zhǎng)曲線,該有的全都有。
![]()
有人用它復(fù)刻了一個(gè)《我的世界》,只需一句話“Make a Minecraft clone”,只用了20分鐘,完成度已經(jīng)非常高了。
![]()
還有人讓Fable 5直接手搓一個(gè)3D世界,純ThreeJS代碼,沒用任何現(xiàn)成游戲引擎。
![]()
這位玩了個(gè)更絕的——讓Fable 5抓自己電腦的網(wǎng)絡(luò)數(shù)據(jù)包,把它實(shí)時(shí)可視化成高速公路上跑的不同車型,每種車代表一種數(shù)據(jù)包類型。視頻一發(fā)出來(lái)41萬(wàn)播放,下面全是"這玩意一個(gè)人一晚上做出來(lái)"的驚呼。
![]()
讓Fable 5給自己寫個(gè)網(wǎng)站,效果也是手拿把掐。
![]()
能自我進(jìn)化的就是AGI
看完這些,我想跟大家聊兩個(gè)細(xì)節(jié)。
一個(gè)是 Fable 5《殺戮尖塔》通關(guān)率是Opus 4.8的三倍。這是個(gè)隨機(jī)性極強(qiáng)的 Roguelike卡牌游戲,沒法死記硬背。Fable 5會(huì)在文件系統(tǒng)里寫"策略筆記"——上一局怎么死的,這局就避坑。它在玩游戲,但它其實(shí)在自己訓(xùn)練自己。
![]()
另一個(gè):Fable 5配合Claude Code框架可以連續(xù)自主跑好幾天,跑完之后會(huì)主動(dòng)寫測(cè)試工具來(lái)驗(yàn)證自己的結(jié)果,不等人來(lái)查,它自己查自己。代碼不對(duì),自己改。
![]()
還記得文章開頭布林那句話嗎?
"Mythos 就是 AGI。如果你認(rèn)為這都不是 AGI,那我不知道什么是 AGI。"現(xiàn)在硅谷對(duì) AGI 越來(lái)越傾向一個(gè)判斷:能自我進(jìn)化的,才叫AGI。能從經(jīng)驗(yàn)里學(xué),能對(duì)自己的產(chǎn)出負(fù)責(zé)——這兩件事拼到一起,你給它一段時(shí)間,它會(huì)把自己變得更好。這就是布林說的"純粹 AGI"。
留給程序員的時(shí)間不多了
三年前我用AI編程做貪吃蛇,發(fā)推特說"留給人類程序員的時(shí)間不多了"。
當(dāng)時(shí)一幫程序員追著我抬杠:"你讓它寫個(gè)王者榮耀試試?"
說真的,當(dāng)時(shí)我也覺得這事還得等幾年。
今天我覺得,Fable 5 真的能做王者榮耀。但我沒讓它做王者。我讓它做了個(gè)更硬核的東西——網(wǎng)頁(yè)版紅色警戒。
![]()
我只說了一句:"做個(gè)網(wǎng)頁(yè)版紅警。"它馬上反問我:要紅警1還是2?要要什么風(fēng)格?甚至還問我要不要尤里的復(fù)仇。
![]()
現(xiàn)在它還在跑。
明天我把結(jié)果發(fā)出來(lái)。
是不是真的"傳說中的AGI",明天見分曉。
順便說一句,獵豹在推進(jìn)AI Native組織變革,很多經(jīng)驗(yàn)現(xiàn)在不光自己用,還在對(duì)外輸出,幫更多企業(yè)打造AI Native組織,幫助企業(yè)成為AI時(shí)代的新物種。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.