網易首頁 > 網易號 > 正文申請入駐

比劇透提前！Anthropic發布Claude Opus 4.8：更“誠實”、可調思考強度、新功能協調數百智能體

Opus 4.8更“誠實”：不強行給出答案

2026-05-29 01:51:07　來源: 華爾街見聞官方

上海舉報

分享至

繼4月推出Claude Opus 4.7后，僅一個多月時間，Anthropic便火速更新旗艦模型序列。

當地時間周四，Anthropic正式發布Claude Opus 4.8，不僅較前代版本進一步強化編程、智能體（Agent）和復雜任務處理能力，還新增用戶可控“思考投入”機制，以及面向大型任務的新功能“動態工作流”（Dynamic Workflows），使模型能著手解決超大規模的復雜問題。

相比前代Claude Opus 4.7，Opus 4.8新增了“快速模式”（Fast Mode），在該模式下，模型的運行速度可提升至常規的2.5倍，現在的成本僅為此前模型的三分之一。

值得注意的是，此次新一代Claude Opus模型的上線時間甚至早于此前代碼泄露與業內爆料所暗示的“6月中旬左右”發布時間。在當前AI大模型競爭持續升溫之際，Anthropic顯然正在加快旗艦模型的迭代節奏。

Claude Opus 4.8有哪些新變化？核心賣點：更強智能體、更高“誠實度”、思考投入可調

Anthropic將Claude Opus 4.8定義為Opus系列最新升級版本，重點提升方向包括編碼、智能體的能力、企業工作流與復雜知識任務。

與傳統模型固定推理模式不同，Anthropic此次引入了“投入控制”（effort control）機制，允許用戶直接控制Claude為任務投入多少“思考資源”。

簡單而言，用戶可以在速度、成本和推理深度之間自行權衡：簡單任務可減少計算投入以降低token消耗，復雜任務則可提高推理強度，換取更高質量輸出。

與此同時，Anthropic特別強調了Opus 4.8的一項關鍵改進——“誠實度”（honesty）。

Anthropic稱，大模型長期存在一個典型問題：在證據不足時容易倉促下結論，甚至高置信度輸出未經驗證內容。

據Anthropic介紹，Opus 4.8在面對不確定信息時，更傾向主動標記疑點、表達不確定性，而不是“強行給出答案”；模型產生無依據結論的傾向也明顯下降。

Anthropic稱，內部評估結果也印證了這一點：數據顯示，Opus 4.8允許其編寫代碼中存在缺陷卻未加提示的概率，僅為其前代模型的四分之一左右。

Anthropic還提到，發布前對Opus 4.8進行了詳盡的“對齊性”（Alignment）評估，結果顯示，新模型“在支持用戶自主權、始終維護用戶最佳利益等‘親社會特質’的各項衡量指標上，均達到了新的高度。”

評估結果還顯示，Opus 4.8 出現“未對齊行為”（即偏離預期行為，例如進行欺騙或協助濫用）的概率顯著低于 Opus 4.7，且已達到與Anthropic目前對齊性最佳的模型——Claude Mythos預覽版——相媲美的水平。

在智能體方面，Anthropic同步推出研究預覽版“動態工作流”。

這一新功能被整合進Claude Code，可讓模型在單個任務中協調數百個并行子智能體，自動規劃、拆解、執行并驗證復雜流程。

Anthropic舉例稱，新系統能夠完成覆蓋數十萬行代碼的大規模代碼庫遷移任務，從任務啟動、執行到合并提交實現端到端處理。

測評成績：智能體與瀏覽器操作能力繼續拉升

Anthropic公布的評測數據顯示，Claude Opus 4.8繼續強化其在智能體和“計算機使用”場景中的優勢。

其中，在衡量瀏覽器智能體和在線操作能力的Online-Mind2Web基準測試中，Opus 4.8獲得84%的成績，Anthropic稱其表現優于Opus 4.7，也勝過GPT-5.5。

Anthropic表示，該模型在長流程任務中保持了更穩定的目標一致性和工具調用能力，更適合自主工程Agent、法律分析、金融研究以及企業復雜流程場景。

多家合作伙伴也在官方材料中給出背書。

例如，AI編程產品Devin開發商指出，Opus 4.8改善了此前版本存在的注釋冗長、工具調用問題；法律與稅務工作流平臺CoCounsel則稱，新模型在一致性和推理質量方面有明顯提升。

常規定價不變新增“快速模式”選項

價格方面，Anthropic并未提高標準使用成本。

Claude Opus 4.8維持與Opus 4.7一致的常規定價：每百萬輸入token收費5美元，每百萬輸出token收費25美元。

同時，Anthropic新增“快速模式”（Fast Mode）方案，定價為每百萬輸入token收費10美元，主打更快響應體驗。

Anthropic同時繼續保留Prompt Caching、批處理折扣等企業級成本優化機制。

已在哪些平臺上線？云廠商同步接入

Anthropic表示，Claude Opus 4.8已正式上線Claude生態。

消費端與企業端方面，Pro、Max、Team、Enterprise用戶均可直接使用。

開發者則可通過Claude API調用claude-opus-4-8模型。

此外，Anthropic同步在主要云平臺開放部署，包括亞馬遜的AWS、谷歌云以及微軟的Foundry。

不止模型更新，Anthropic下一步想做什么？

除發布新模型外，Anthropic此次更新釋放出的更重要信號，或許是其正在從“模型能力競爭”進一步邁向“智能體系統競爭”。

Dynamic Workflows、多Agent協作、長流程自動執行、用戶可調思考強度等新功能，都顯示出Anthropic希望推動Claude從聊天模型向“長期自主執行系統”演進。

公司在公告中也反復強調，未來重點方向將繼續圍繞Agent能力、企業復雜工作流、工具調用、跨會話記憶與長期任務執行展開。

Anthropic表示，作為Glasswing項目的一部分，目前已有少數機構開始試用Claude Mythos預覽版，并將其應用于網絡安全相關工作中。鑒于此類模型具備極高的能力水平，在正式面向大眾發布之前，必須先行建立更為強健的網絡安全防護體系。

目前，Anthropic在構建這些安全防護措施方面正取得迅速進展，并預計，在未來數周內，即可將Mythos級別的模型正式向所有客戶開放。

從時間線上看，Anthropic顯然正在加速新品節奏：4月中旬才推出Opus 4.7，一個多月后便發布4.8，而且較此前外界根據泄露代碼推測的發布時間進一步提前。

在OpenAI、谷歌等廠商持續推進Agent和推理模型競爭的背景下，Anthropic選擇用更快的迭代速度、更多系統級功能升級，繼續押注高端企業AI市場。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Anthropic估值萬億，但Claude 4.8沒那么驚艷

鈦媒體APP 2026-05-30 09:39:07
0 跟貼 0
階躍發布Step 3.7 Flash：一款為「燒錢時代」準備的Agent模型

機器之心Pro 2026-05-29 16:42:38
0 跟貼 0

新一輪大模型要來了！Blackwell加持下，AI能力更強了？

華爾街見聞官方 2026-05-29 14:46:14
4 跟貼 4

企業落地AI，不怕慢，就怕錯

虎嗅APP 2026-05-29 19:11:58
0 跟貼 0
AI 編程終于有全局視野了！3 萬 Star 項目補齊最大短板

鈦媒體APP 2026-05-30 10:22:27
37 跟貼 37

5億Tokens白送！全球首個商用AI主機發布，終于能放開燒Token了

量子位 2026-05-29 17:04:03
3 跟貼 3

英偉達提出Gamma-World：世界模型從「一個人玩」到「多人共處」

量子位 2026-05-30 11:16:51
0 跟貼 0
登頂HuggingFace日榜！γ-World：把世界模型從單機打到聯機

機器之心Pro 2026-05-30 12:39:17
0 跟貼 0

創意設計版WorkBuddy來了！騰訊發布智能體創意工作室Miora

量子位 2026-05-29 16:30:49
3 跟貼 3
倒反天罡，AI開始給人類打分！Claude評分標準曝光: 優秀人類得7.5分

新智元 2026-05-30 15:07:01
0 跟貼 0
Opus 4.8連夜算盡1170億人命運，一句話敲出人類投胎模擬器！

新智元 2026-05-30 15:11:01
5 跟貼 5
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
猿編程助力中國隊閃耀國際舞臺，2026國際冬季人工智能奧林匹克競賽斬獲兩金

財聯社 2026-05-29 18:03:06
0 跟貼 0
黃仁勛親臨現場！COMPUTEX 2026終極前瞻：AI計算統治一切？

雷科技 2026-05-30 21:29:07
2 跟貼 2
Agent輸出到底該用誰？卡帕西轉發：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0
X平臺瘋傳！這個國產開源模型，把信息圖生成整明白了 ? 附實測

智東西 2026-05-29 21:57:26
0 跟貼 0
AI走向物理世界的“臨門一腳”還差什么？｜直擊BEYOND Expo 2026

財聯社 2026-05-30 22:44:22
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
王曉野：Working Agent將是下一個爆發點

量子位 2026-05-21 08:05:51
0 跟貼 0
博主開發“桌面整理大師”小程序，網友調侃：本以為是裝垃圾桶里，沒想到是掃床底下了

河南都市頻道 2026-05-29 18:16:32
9 跟貼 9
女子吃了隔夜見手青連撞兩輛車，回家后還對著空氣輔導作業

南陽日報 2026-05-30 17:19:03
89 跟貼 89
【半佛】讓小孩學AI屬于浪費時間？

硬核的半佛仙人 2026-05-27 12:58:43
0 跟貼 0
扎哈羅娃：俄將對羅馬尼亞迅速采取報復措施

參考消息 2026-05-30 11:58:56
16522 跟貼 16522
財務部搞AI，先別造超人，雇個項目經理

我是一個養蝦人 2026-05-31 00:41:51
0 跟貼 0
狗子：不好觸發底層代碼了

娛圈小宇宙 2026-05-29 20:29:47
8 跟貼 8
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
你花了四年學編程，卻要用一輩子補寫作

一隅安穩 2026-05-31 01:29:48
0 跟貼 0
面對SDV新趨勢，博為峰車載測試以深度課程與實訓回應產業期待

周口融媒 2026-05-29 15:42:15
0 跟貼 0
《生命是大模型，但不僅僅是大語言模型》第十四期：走向工具驅動的時空模型——結論與展望

尹燁 2026-05-26 19:46:15
0 跟貼 0
“大模型雙雄”港股逆襲分化、A股再擺擂臺：一場技術路線與商業化的巔峰對壘

每日經濟新聞 2026-05-30 22:09:20
1 跟貼 1
Anthropic七子一夜殺進全球富豪榜！每人身家80億，承諾捐出80%財富

新智元 2026-05-30 11:45:54
11 跟貼 11
「老閆說車」蔚來全新ES8首批用戶，行駛1萬公里后的真實看法

閆闖說車 2026-05-28 21:31:41
0 跟貼 0
供應商變股東：存儲芯片三巨頭聯手入股Anthropic，AI供應鏈的權力結構正在重組

鈦媒體APP 2026-05-30 12:31:10
5 跟貼 5
來中國網購久了，忠實用戶的心聲，感動分享過程！

搞笑面包狗 2026-05-26 16:23:15
1 跟貼 1
集采百元一盒藥，藥店竟賣3960元，為何賣出如此高價？記者調查

新京報 2026-05-30 11:58:09
3511 跟貼 3511
大變局！智能體可以直接炒股了，美國知名券商宣布支持AI代理炒股

每日經濟新聞 2026-05-28 23:21:27
0 跟貼 0
智能體從「單兵作戰」到「精銳團隊」 -2

機器之心Pro 2026-04-28 16:56:00
0 跟貼 0

華爾街見聞官方

中國領先的金融商業信息提供商

146893文章數 2653742關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

數碼

藝術

房產

手機

手機 / 數碼

房產 / 家居

比劇透提前！Anthropic發布Claude Opus 4.8：更“誠實”、可調思考強度、新功能協調數百智能體

Opus 4.8更“誠實”：不強行給出答案

車圈大佬發聲：價格戰遠去，但競爭仍殘酷

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

歲月不饒人！39歲德約鏖戰近5小時拼到嘔吐

張碧晨《歌手》 “活人微死” 自嘲

雙匯管不住一頭豬

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

巫師3新DLC跨十年：年輕玩家在初發售時還是小孩！

沒等到Arc G3！華碩ROG Ally 2026新掌機曝光： 仍用AMD銳龍Z2 Extreme

非洲超級地標！全球最大足球場，持續推進！

紅動五月！全國搶入核心資產，廣州盯緊凱旋新世界！

REDMI K90至尊版入網？K90單品激活破200萬

兩名9歲女孩被困電梯近2小時求救幾十次物業無動于衷

兩名9歲女孩被困電梯近2小時求救幾十次物業無動于衷

900V+3.2秒破百領克10+&領克10上市16.99萬元起

沒等到Arc G3！華碩ROG Ally 2026新掌機曝光：仍用AMD銳龍Z2 Extreme