![]()
本文來自微信公眾號:字母AI,作者:袁心玥、苗正,題圖來自:視覺中國
Anthropic宣布,公司已完成H輪融資,融資金額達650億美元,投后估值為9650億美元。
這筆融資將被Anthropic用來繼續研發,同時擴大算力產能,滿足現在市場對Claude越來越大的需求。
![]()
與此同時,Claude Opus 4.8被端上來了!!
![]()
這大晚上的,我們還以為要等到六月份呢……
在Claude Code 2.1.154版本中,輸入/model后的模型選擇菜單里,Opus一欄已經更新為Opus 4.8。
![]()
老規矩,APP用戶和電腦端都已經可以用上最新的Opus 4.8模型,API稍晚一些。
![]()
![]()
不過,Opus 4.6被下了……
Opus 4.8更新速覽
根據Anthropic官方介紹,Opus 4.8具有更敏銳的判斷力、對自身進步的更誠實的態度,以及更長時間獨立工作的能力。
重要的是,價格保持不變。
常規價格仍是輸入5美元/百萬token、輸出25美元/百萬token;Fast mode價格為輸入10美元/百萬token、輸出50美元/百萬token。
Opus 4.8的Fast mode速度大約是標準模式的2.5倍;同時,Fast mode這次降價后,價格約為此前Fast mode的三分之一。
![]()
從Anthropic自己的描述看,Opus 4.8并不是一次大跨步的模型代際更新。
官方在新聞稿末尾是這么寫的:“Opus 4.8相比Opus 4.7,并沒有很夸張的提升,更多的是那種用戶真正用起來后,才能感受到的細節升級。”
Anthropic還提到,公司正在開發一類成本更低、但能力接近Opus的模型。同時也計劃推出比Opus更強的新類型模型,就是公開的秘密——Mythos。
![]()
可以理解為,Opus 4.8更像是一次面向真實工作場景的打磨:不再把數字拉得特別嚇人,但要讓模型在復雜任務里更可靠、更會協作、更少裝懂。
Anthropic這次尤其強調,Opus 4.8變得更誠實了。
所謂誠實,不只是少胡說,而是模型在自己拿不準的時候,更愿意把不確定性說出來;在沒有足夠證據時,也更少強行給出一個看似確定的結論。
Anthropic稱,在內部評測中,Opus 4.8如果寫出了有問題的代碼,更可能主動指出問題,而不是假裝一切正常。相比上一代,它“發現自己代碼缺陷卻不說”的情況大約減少了四分之三。
![]()
安全性上,Anthropic也給出了類似的判斷。公司安全團隊認為,Opus 4.8在尊重用戶判斷、維護用戶利益等方面表現更好;與此同時,欺騙、迎合濫用請求等不對齊行為明顯少于Opus 4.7,已經接近Claude Mythos Preview的水平。
這延續了Anthropic最近一貫的姿態。無論是強調Opus 4.8更愿意承認不確定性,還是回應《人性的偉大之處》里關于AI與人類尊嚴的討論,Anthropic都在反復傳遞同一個信號:模型越能干,越不能只是聽話和自信,它必須知道邊界,承認不確定性,并且盡量維護用戶的真實利益。
這種敘事可以增強用戶對于Anthropic模型的信任,促進企業合作,也有助于Anthropic為未來IPO鋪路。
Opus 4.8發布的同時,Anthropic還推出了幾項功能更新,其中最重要的是動態工作流,Anthropic專門發了一篇文章來介紹。
![]()
該功能還在研究預覽階段,將面向Enterprise、Team和Max計劃開放。
按照Anthropic的說法,它可以讓Claude Code處理更大規模的問題。Claude會先規劃工作,再在一個會話里運行數百個并行subagents,最后在向用戶匯報前驗證輸出。配合Opus 4.8,這些agents可以運行更久,更適合代碼遷移、全庫排查、長期重構這類需要持續推進的異步工作流。
官方舉的例子是,Claude Code現在可以完成跨數十萬行代碼庫的遷移任務,從啟動一直推進到合并,并使用項目原有的測試套件來檢查結果。
![]()
另外,effort control(響應力度控制)也從Claude Code這樣的開發者場景,進入了claude.ai(網頁版Claude)和Claude Cowork。
Claude Code里過去已經有類似的effort控制,用/effort可以調不同的思考強度,現在claude.ai和Claude Cowork 現在也有了這個控制項,用戶可以在模型選擇器旁邊直接調Claude對一次回答投入多少effort。
低effort的情況下Claude就回得更快、消耗更少;高effort就是讓它多花一些token,把問題想得更細,更適合那種復雜的任務。
在Claude Code里,Opus 4.8默認使用高effort模式。Anthropic的意思是,這樣能在質量和速度之間取得比較好的平衡。做代碼任務時,它的token消耗和Opus 4.7 默認模式差不多,但完成效果更好。
還有一個更偏開發者的小更新,Messages API現在支持在messages數組里插入system條目了。你可以在任務執行過程中更新Claude的系統指令,不用打斷prompt緩存,非常適合長流程任務。
動態工作流
比起模型性能,本次更新的重中之重,就是前文提到的Claude Code的動態工作流。
![]()
《木蘭辭》有句話,叫東市買駿馬,西市買鞍韉,南市買轡頭,北市買長鞭。
而這,就是動態工作流的核心。
以前你讓Claude Code做一個復雜任務,它是用一個主Agent,一步步讀代碼、改代碼、跑測試、再修。
問題是,大型工程任務往往太大。一個bug可能關聯幾十個文件,一次遷移可能要改幾百個文件。單個Agent一條線往下跑,容易漏東西,也容易中途跑偏。
動態工作流要做的事情就是調度,類似于客戶經理。它不干活,但是它安排合適的人干活。
Claude先把你的任務拆成一套工作流,然后自動拉起幾十到幾百個并行的子Agent。每個子Agent負責一個子任務,比如掃某個模塊、驗證某個結論、找反例、跑測試這些。
最后Claude再把這些結果匯總、交叉驗證,給你一個統一答案。
它的核心不是讓一個Agent更聰明,是讓Claude自動組織一群Agent一起干活。
官方舉的例子是Bun從Zig到Rust的遷移試驗,動態工作流參與了約75萬行Rust代碼遷移,11 天內從首次提交推進到合并,并讓99.8%的既有測試套件通過。
但與之相對的,成本也增加了。官方特意提醒,動態工作流會明顯消耗更多token,第一次觸發時會讓用戶確認;Enterprise管理員也可以選擇直接禁用。
4.7到4.8,只相隔了42天
如果按公開發布時間算,Opus 4.5的發布日期是2025年11月24日,Opus 4.6是2026年2月5日,兩者相隔73天;Opus 4.7是2026年4月16日,距離4.6相隔70天;Opus 4.8是2026年5月28日,距離4.7只有42天。
為什么這么快?
網上普遍認為是4.7沒有達到用戶預期。
Anthropic發布4.7的時候說,它能把更難的編程任務交給模型,并且模型還能在匯報前驗證結果。
但不少用戶反饋稱,4.7只是會簡單搜索一下就直接下結論,也沒有真正地交叉驗證結果。AMD AI 負責人絲黛拉·勞倫佐(Stella Laurenzo)表示,Claude Code在使用4.7做大型工程時,很容易跑偏。
如果只是模型性能沒達標也就算了,問題是官方自己也承認,4.7的tokenizer會讓同樣輸入變成約1.0到1.35倍token,同時高effort下會花更多token。
等于說錢多花了,結果沒有提升,甚至還下降了。
從官方和早期測試者的說法看,4.8至少瞄準了幾個4.7的痛點,比如工具調用、長任務穩定性、代碼缺陷自檢、回復噪音,以及在不確定時硬撐結論的問題。
但要說“完全解決”,還太早,還得等后續各種大型工程項目的反饋結果出來才能看清楚。
關鍵在于,Anthropic現在可不是追趕者了,它是領跑者。
就在4.8發布的前一天,外媒報道稱,Anthropic目前的收入很可能已經比OpenAI至少高出 35%。
Anthropic年化收入接近450億美元,OpenAI約為330億美元。雖然ARR不等同于最終利潤,但足以改變市場敘事。
這兩家公司都是準備在2026年下半年IPO的,如果Anthropic先過會,那OpenAI的故事就不好講了。
這也讓Opus 4.8多了一層含義。它是在給資本市場遞材料,證明4.7雖然不行,但是Anthropic能立馬推出新版本,以支撐自己超高的估值和收入。
本文來自微信公眾號:字母AI,作者:袁心玥、苗正
本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4862546.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.