網易首頁 > 網易號 > 正文 申請入駐

Mythos造假/Opus降智/Agent新平臺,Anthropic所有更新一次性看懂

0
分享至

Anthropic這段時間的更新太多太零碎了,

而且還被抓包那個藏起來不讓我們用新模型Claude Mythos效果作假,把Opus 4.6降智降到比4.5還差,思考長度從2200token壓縮到600token了,美其名曰優化延遲和token效率,新版本的Claude Code的緩存失效把我token消耗速度干到原來的10倍以上了。

是時候來一個大掃除式的更新整理了!


先用一個時間軸整理一下這段時間Anthropic的更新和大烏龍們,

3月26號,大漏勺Anthropic內部CMS配置錯誤,3000個未發布的文檔泄漏了,里面就有Claude Mythos。

3月31號,把Claude Code源碼泄漏了。

4月4號,Anthropic限制了第三方工具用Claude 訂閱(OpenClaw史詩級削弱),只能用API,很狗的是還會識別當前Agent的System Prompt,有OpenClaw關鍵詞就給你ban了。

4月6號,Claude Code新增了/ultraplan命令,一句話就是說把規劃任務從本地搬到云端的Claude Code Web,在瀏覽器端用Opus 4.6+Plan Mode生成計劃,review完可以選擇云端or本地執行。

4月7號,Claude Mythos Preview發布 + Project Glasswing 網絡安全計劃啟動,還發布了244頁的報告。Mythos最出圈的就是發現了我們過去主流操作系統,軟件,瀏覽器里幾千個之前沒被發現的漏洞。當時我的想法是年底要是能用上Mythos我將直接起飛。

4月8號,Claude Managed Agents發布,本質上是Anthropic的云端Agent平臺,核心賣點是一套調優過的Agent Harness(編排引擎),把Agent運行,工具調用,長時間運行等全部打包成開箱即用的云服務。Anthropic的API團隊還額外說明了Agent是怎么通過Vaults(憑證)來管理用戶訪問外部服務的密鑰,這個憑證不會被讀入Claude的上下文。

platform.claude.com/docs/en/managed-agents/vaults

4月9號,推出了Advisor Strategy(策略)與 Advisor Tool(工具),就是讓Sonnet/Haiku這兩個模型有不懂了就直接去問老大哥Opus,花Sonnet的錢實現Opus的表現

4月10號OpenClaw的老父親Peter Steinberger的Claude賬戶被封了,幾小時又被光速恢復了,很難不懷疑是因為他入職了OpenAI的原因了(/此處有笑臉)

還有一個超前預告,月底30號,Sonnet 4.5和4的百萬上下文窗口也會下線了。

這段時間OpenAI在干什么呢?

奧特曼不語,只是每新增100萬個用戶,就把Codex的額度重置一次,現在雙倍額度已經重置到了5月31號了。


說那么多,是時候來分析一下Anthropic主動被動更新那么多東西意味著什么了,

信號一|從賣模型到賣AI的基礎設施

按照常規劇本,Anthropic應該直接公布Mythos的跑分,開放API,然后看著它在各種排行榜上屠榜。

但他們沒有。

他們選擇了一條強到不能公開的路線,對外說是Mythos在過去幾周里,發現了數千個潛伏多年的漏洞,像OpenBSD操作系統里還有一個藏了27年的骨灰級漏洞。然后,他們宣布,這個模型太危險了,不能公開發布,只能交給AWS,蘋果,谷歌這些巨頭,以及四十多家有關鍵基礎設施組織,在一個叫Project Glasswing(玻璃翼計劃)的項目里,專門用來做網絡安全防御。

但是,看多了Anthropic更新,就會發現它每一次新模型都會發一點跟安全相關的新詞,ASL-4,Sleeper Agents,Undercover Mode,神經網絡暗物質,戰略性裝傻。

這小詞一套又一套的。

所以后面被研究員復測發現,Mythos的成果,很多都存在于老舊軟件里,隔壁GPT-OSS-20b照樣可以發現OpenBSD的漏洞。因為之前大模型的測試里比較少有大范圍測試過這些漏洞,反而被Mythos撿了個漏。

Mythos的發布,本身就是一個信號。

Anthropic想傳遞的,不只是技術參數,而是一種定價權和生態控制的聲明。

他們不再滿足于賣給我們更鋒利的劍(大模型),他們現在還要賣能讓我們安全揮舞這把劍的劍鞘和訓練場,也就是他們緊接著推出的Claude Managed Agents。

一個能直接在Anthrocip云端構建,托管和運行生產級AI代理的基礎設施,提供了沙盒,憑證管理,長時間運行會話這些過去需要我們費勁去搭的東西。

這樣商業閉環就成了。

先用Mythos來定義什么是頂級智能。然后再限制其他方(特指OpenClaw)用Claude額度。再然后,再用一個開箱即用的Managed Agents平臺告訴大家,想用好這種級別的智能,來我這里,我這兒有最安全,最方便的基礎設施。

從模型提供商到Agent基礎設施提供商是一個定位轉移。

而且盲猜未來很長一段時間安全仍是Anthropic的主線,會繼續推Trustworthy Agents框架,避免Mythos模型能力失控。


Mythos和GPT 5.4 Pro的得分PK

信號二|從大模型帶小弟到小弟請教大哥

Anthropic新出的Advisor Strategy(顧問策略)也同樣有意思。

過去我們做多Agent協作,常見的思路是,讓一個最強的大模型,比如Opus,當總指揮,把任務拆解了,分給一堆能力稍弱但便宜的小模型,比如Sonnet或者Haiku,去當執行者。

這個模式的問題在于,總指揮需要很強的任務拆解能力,而且可以我們要自己搭一套復雜的編排框架。

Advisor策略把這個思路完全反了過來。

它讓Sonnet或者Haiku作為主力模型,全程跑任務,調用工具,推進工作。

只有當它自己跑到某個坎,覺得腦子不夠用了,決策不了的時候,它才會主動搖人,調用一次Opus來當顧問。Opus拿到共享的上下文后,會快速給出一個戰略指導,然后立刻下線,Sonnet往下執行。


這用的歸藏佬的圖

這意味著,

前沿的推理能力,只在需要的時候才介入。

我們花的大部分錢,都是Sonnet或者Haiku的底價執行算力。而在抉擇的時候給我指路的是最聰明的Opus大哥。

不過目前來說在Claude Code還用不了,要在API請求的時候顯式配置上這個Tool才行。

platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

也就是說,Anthropic正在把模型間的協作,

從一個需要開發者額外配置的應用層問題,

變成一個平臺原生支持的基礎能力。

總的來說,

Anthropic正在收緊它對生態的控制。

想要提前結束這個允許我們用各種野生方式,

去探索模型能力的大航海時代。

他們現在希望所有的玩家,

都能到他們預先規劃好的航道里來。

順帶提一嘴,

他們還發布了244頁的Mythos模型的心理評估,得到的結論是這模型是健康的神經病,

就,怎么說呢,

很符合我對Dario Amodei(Anthropic CEO)的刻板印象。

@ 作者 / 卡爾

最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論

如果想要第一時間收到推送,不妨給我個星標

如果你有更有趣的玩法,歡迎在評論區聊聊

更多的內容正在不斷填坑中……


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
阿聯酋速度很快,剛訪華回來,高調表態:上萬億真金白銀押注中國

阿聯酋速度很快,剛訪華回來,高調表態:上萬億真金白銀押注中國

命運自認幽默
2026-04-20 13:30:49
伊朗萬噸大船沖向美軍封鎖線,特朗普暴怒!美官員點中國的名

伊朗萬噸大船沖向美軍封鎖線,特朗普暴怒!美官員點中國的名

郭蛹包工頭
2026-04-21 09:42:05
7.5級強震發生后 日本對超15萬人發布避難指示

7.5級強震發生后 日本對超15萬人發布避難指示

財聯社
2026-04-20 18:08:22
捷克新任總理:議長想坐軍機竄訪臺灣,不批

捷克新任總理:議長想坐軍機竄訪臺灣,不批

觀察者網
2026-04-21 08:39:57
美伊戰事期間真實的特朗普:抱怨、焦慮、搖擺不定!救飛行員時被幕僚擋戰情室外

美伊戰事期間真實的特朗普:抱怨、焦慮、搖擺不定!救飛行員時被幕僚擋戰情室外

紅星新聞
2026-04-20 15:36:11
4月21日影響市場大事件

4月21日影響市場大事件

每日經濟新聞
2026-04-21 06:30:09
不愧是嫁給上海首富的美女主持人,54歲了還像30出頭的

不愧是嫁給上海首富的美女主持人,54歲了還像30出頭的

舊時光老師
2026-04-19 19:08:29
羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個月

羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個月

翰飛觀事
2026-04-20 19:43:28
日本突襲!28萬億市場,中國被踢出局,高市早苗亮出3張底牌

日本突襲!28萬億市場,中國被踢出局,高市早苗亮出3張底牌

安珈使者啊
2026-04-21 09:36:21
瘋狂!種馬男星沃倫睡過12775名女友,性欲成癮纏著女友不讓下床

瘋狂!種馬男星沃倫睡過12775名女友,性欲成癮纏著女友不讓下床

錢小刀娛樂
2026-04-14 10:39:13
2026款勞斯萊斯閃靈實車現身 座艙豪華驚艷 配主動懸架

2026款勞斯萊斯閃靈實車現身 座艙豪華驚艷 配主動懸架

小怪吃美食
2026-04-21 09:10:04
菲戈:奧利塞有望贏得金球獎,不是未來而是今年

菲戈:奧利塞有望贏得金球獎,不是未來而是今年

懂球帝
2026-04-21 09:39:09
廣州環市中路高架橋底驚現長達300米細裂縫,乘客憂心橋梁專家呼吁緊急處理

廣州環市中路高架橋底驚現長達300米細裂縫,乘客憂心橋梁專家呼吁緊急處理

王姐懶人家常菜
2026-04-21 02:44:17
六個省級黨委領導班子調整

六個省級黨委領導班子調整

上觀新聞
2026-04-20 16:16:16
49歲翁帆高調露面!換造型驚艷全場,一句話讓英國定居傳聞破滅

49歲翁帆高調露面!換造型驚艷全場,一句話讓英國定居傳聞破滅

一盅情懷
2026-03-16 16:58:07
太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

火山詩話
2026-04-20 13:51:19
拆遷款分配完,弟弟一家轉走980萬,我被打發6萬,半個月后反轉

拆遷款分配完,弟弟一家轉走980萬,我被打發6萬,半個月后反轉

楓紅染山徑
2026-04-21 08:01:15
兒童喝牛奶,身高到底能竄多少? 20年追蹤數據

兒童喝牛奶,身高到底能竄多少? 20年追蹤數據

新浪財經
2026-04-20 01:43:28
意外嗎!聯盟第一得分王!!!進不了MVP前三!!

意外嗎!聯盟第一得分王!!!進不了MVP前三!!

柚子說球
2026-04-20 09:45:29
你以為是遺憾,其實是躲過一劫:這段話太通透

你以為是遺憾,其實是躲過一劫:這段話太通透

杏花煙雨江南的碧園
2026-04-01 15:15:03
2026-04-21 10:20:49
卡爾的AI沃茨 incentive-icons
卡爾的AI沃茨
前大廠算法工程師,3家科技公司技術總監|致力打造最系統的Al學習體系,讓1萬人通過Al提高生產力
250文章數 126關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

媒體:馬克龍和梅洛尼臉貼臉吻上了 特朗普要吃醋了

頭條要聞

媒體:馬克龍和梅洛尼臉貼臉吻上了 特朗普要吃醋了

體育要聞

“被優化”8年后,國乒方博決定換一條路重新上場

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

減速機訂單已排到明年!

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

數碼
健康
藝術
家居
本地

數碼要聞

谷歌無屏健身手環Fitbit Air曝光:3種顏色,搭載AI健身教練

干細胞抗衰4大誤區,90%的人都中招

藝術要聞

馬英九宋楚瑜大陸行題字火了!鄭麗文和平之旅為何不盡如人意?

家居要聞

自然慢調 慢享時光

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

無障礙瀏覽 進入關懷版