繼4月推出Claude Opus 4.7后,僅一個多月時間,Anthropic便火速更新旗艦模型序列。
當地時間周四,Anthropic正式發布Claude Opus 4.8,不僅較前代版本進一步強化編程、智能體(Agent)和復雜任務處理能力,還新增用戶可控“思考投入”機制,以及面向大型任務的新功能“動態工作流”(Dynamic Workflows),使模型能著手解決超大規模的復雜問題。
相比前代Claude Opus 4.7,Opus 4.8新增了“快速模式”(Fast Mode),在該模式下,模型的運行速度可提升至常規的2.5倍,現在的成本僅為此前模型的三分之一。
值得注意的是,此次新一代Claude Opus模型的上線時間甚至早于此前代碼泄露與業內爆料所暗示的“6月中旬左右”發布時間。在當前AI大模型競爭持續升溫之際,Anthropic顯然正在加快旗艦模型的迭代節奏。
Claude Opus 4.8有哪些新變化?核心賣點:更強智能體、更高“誠實度”、思考投入可調
Anthropic將Claude Opus 4.8定義為Opus系列最新升級版本,重點提升方向包括編碼、智能體的能力、企業工作流與復雜知識任務。
與傳統模型固定推理模式不同,Anthropic此次引入了“投入控制”(effort control)機制,允許用戶直接控制Claude為任務投入多少“思考資源”。
簡單而言,用戶可以在速度、成本和推理深度之間自行權衡:簡單任務可減少計算投入以降低token消耗,復雜任務則可提高推理強度,換取更高質量輸出。
與此同時,Anthropic特別強調了Opus 4.8的一項關鍵改進——“誠實度”(honesty)。
Anthropic稱,大模型長期存在一個典型問題:在證據不足時容易倉促下結論,甚至高置信度輸出未經驗證內容。
據Anthropic介紹,Opus 4.8在面對不確定信息時,更傾向主動標記疑點、表達不確定性,而不是“強行給出答案”;模型產生無依據結論的傾向也明顯下降。
Anthropic稱,內部評估結果也印證了這一點:數據顯示,Opus 4.8允許其編寫代碼中存在缺陷卻未加提示的概率,僅為其前代模型的四分之一左右。
Anthropic還提到,發布前對Opus 4.8進行了詳盡的“對齊性”(Alignment)評估,結果顯示,新模型“在支持用戶自主權、始終維護用戶最佳利益等‘親社會特質’的各項衡量指標上,均達到了新的高度。”
評估結果還顯示,Opus 4.8 出現“未對齊行為”(即偏離預期行為,例如進行欺騙或協助濫用)的概率顯著低于 Opus 4.7,且已達到與Anthropic目前對齊性最佳的模型——Claude Mythos預覽版——相媲美的水平。
![]()
在智能體方面,Anthropic同步推出研究預覽版“動態工作流”。
這一新功能被整合進Claude Code,可讓模型在單個任務中協調數百個并行子智能體,自動規劃、拆解、執行并驗證復雜流程。
Anthropic舉例稱,新系統能夠完成覆蓋數十萬行代碼的大規模代碼庫遷移任務,從任務啟動、執行到合并提交實現端到端處理。
測評成績:智能體與瀏覽器操作能力繼續拉升
Anthropic公布的評測數據顯示,Claude Opus 4.8繼續強化其在智能體和“計算機使用”場景中的優勢。
其中,在衡量瀏覽器智能體和在線操作能力的Online-Mind2Web基準測試中,Opus 4.8獲得84%的成績,Anthropic稱其表現優于Opus 4.7,也勝過GPT-5.5。
![]()
Anthropic表示,該模型在長流程任務中保持了更穩定的目標一致性和工具調用能力,更適合自主工程Agent、法律分析、金融研究以及企業復雜流程場景。
多家合作伙伴也在官方材料中給出背書。
例如,AI編程產品Devin開發商指出,Opus 4.8改善了此前版本存在的注釋冗長、工具調用問題;法律與稅務工作流平臺CoCounsel則稱,新模型在一致性和推理質量方面有明顯提升。
常規定價不變 新增“快速模式”選項
價格方面,Anthropic并未提高標準使用成本。
Claude Opus 4.8維持與Opus 4.7一致的常規定價:每百萬輸入token收費5美元,每百萬輸出token收費25美元。
同時,Anthropic新增“快速模式”(Fast Mode)方案,定價為每百萬輸入token收費10美元,主打更快響應體驗。
Anthropic同時繼續保留Prompt Caching、批處理折扣等企業級成本優化機制。
已在哪些平臺上線?云廠商同步接入
Anthropic表示,Claude Opus 4.8已正式上線Claude生態。
消費端與企業端方面,Pro、Max、Team、Enterprise用戶均可直接使用。
開發者則可通過Claude API調用claude-opus-4-8模型。
此外,Anthropic同步在主要云平臺開放部署,包括亞馬遜的AWS、谷歌云以及微軟的Foundry。
不止模型更新,Anthropic下一步想做什么?
除發布新模型外,Anthropic此次更新釋放出的更重要信號,或許是其正在從“模型能力競爭”進一步邁向“智能體系統競爭”。
Dynamic Workflows、多Agent協作、長流程自動執行、用戶可調思考強度等新功能,都顯示出Anthropic希望推動Claude從聊天模型向“長期自主執行系統”演進。
公司在公告中也反復強調,未來重點方向將繼續圍繞Agent能力、企業復雜工作流、工具調用、跨會話記憶與長期任務執行展開。
Anthropic表示,作為Glasswing項目的一部分,目前已有少數機構開始試用Claude Mythos預覽版,并將其應用于網絡安全相關工作中。鑒于此類模型具備極高的能力水平,在正式面向大眾發布之前,必須先行建立更為強健的網絡安全防護體系。
目前,Anthropic在構建這些安全防護措施方面正取得迅速進展,并預計,在未來數周內,即可將Mythos級別的模型正式向所有客戶開放。
從時間線上看,Anthropic顯然正在加速新品節奏:4月中旬才推出Opus 4.7,一個多月后便發布4.8,而且較此前外界根據泄露代碼推測的發布時間進一步提前。
在OpenAI、谷歌等廠商持續推進Agent和推理模型競爭的背景下,Anthropic選擇用更快的迭代速度、更多系統級功能升級,繼續押注高端企業AI市場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.