无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

比劇透提前!Anthropic發布Claude Opus 4.8:更“誠實”、可調思考強度、新功能協調數百智能體

Opus 4.8更“誠實”:不強行給出答案

0
分享至

繼4月推出Claude Opus 4.7后,僅一個多月時間,Anthropic便火速更新旗艦模型序列。

當地時間周四,Anthropic正式發布Claude Opus 4.8,不僅較前代版本進一步強化編程、智能體(Agent)和復雜任務處理能力,還新增用戶可控“思考投入”機制,以及面向大型任務的新功能“動態工作流”(Dynamic Workflows),使模型能著手解決超大規模的復雜問題。

相比前代Claude Opus 4.7,Opus 4.8新增了“快速模式”(Fast Mode),在該模式下,模型的運行速度可提升至常規的2.5倍,現在的成本僅為此前模型的三分之一。

值得注意的是,此次新一代Claude Opus模型的上線時間甚至早于此前代碼泄露與業內爆料所暗示的“6月中旬左右”發布時間。在當前AI大模型競爭持續升溫之際,Anthropic顯然正在加快旗艦模型的迭代節奏。

Claude Opus 4.8有哪些新變化?核心賣點:更強智能體、更高“誠實度”、思考投入可調

Anthropic將Claude Opus 4.8定義為Opus系列最新升級版本,重點提升方向包括編碼、智能體的能力、企業工作流與復雜知識任務。

與傳統模型固定推理模式不同,Anthropic此次引入了“投入控制”(effort control)機制,允許用戶直接控制Claude為任務投入多少“思考資源”。

簡單而言,用戶可以在速度、成本和推理深度之間自行權衡:簡單任務可減少計算投入以降低token消耗,復雜任務則可提高推理強度,換取更高質量輸出。

與此同時,Anthropic特別強調了Opus 4.8的一項關鍵改進——“誠實度”(honesty)。

Anthropic稱,大模型長期存在一個典型問題:在證據不足時容易倉促下結論,甚至高置信度輸出未經驗證內容。

據Anthropic介紹,Opus 4.8在面對不確定信息時,更傾向主動標記疑點、表達不確定性,而不是“強行給出答案”;模型產生無依據結論的傾向也明顯下降。

Anthropic稱,內部評估結果也印證了這一點:數據顯示,Opus 4.8允許其編寫代碼中存在缺陷卻未加提示的概率,僅為其前代模型的四分之一左右。

Anthropic還提到,發布前對Opus 4.8進行了詳盡的“對齊性”(Alignment)評估,結果顯示,新模型“在支持用戶自主權、始終維護用戶最佳利益等‘親社會特質’的各項衡量指標上,均達到了新的高度。”

評估結果還顯示,Opus 4.8 出現“未對齊行為”(即偏離預期行為,例如進行欺騙或協助濫用)的概率顯著低于 Opus 4.7,且已達到與Anthropic目前對齊性最佳的模型——Claude Mythos預覽版——相媲美的水平。


在智能體方面,Anthropic同步推出研究預覽版“動態工作流”。

這一新功能被整合進Claude Code,可讓模型在單個任務中協調數百個并行子智能體,自動規劃、拆解、執行并驗證復雜流程。

Anthropic舉例稱,新系統能夠完成覆蓋數十萬行代碼的大規模代碼庫遷移任務,從任務啟動、執行到合并提交實現端到端處理。

測評成績:智能體與瀏覽器操作能力繼續拉升

Anthropic公布的評測數據顯示,Claude Opus 4.8繼續強化其在智能體和“計算機使用”場景中的優勢。

其中,在衡量瀏覽器智能體和在線操作能力的Online-Mind2Web基準測試中,Opus 4.8獲得84%的成績,Anthropic稱其表現優于Opus 4.7,也勝過GPT-5.5。


Anthropic表示,該模型在長流程任務中保持了更穩定的目標一致性和工具調用能力,更適合自主工程Agent、法律分析、金融研究以及企業復雜流程場景。

多家合作伙伴也在官方材料中給出背書。

例如,AI編程產品Devin開發商指出,Opus 4.8改善了此前版本存在的注釋冗長、工具調用問題;法律與稅務工作流平臺CoCounsel則稱,新模型在一致性和推理質量方面有明顯提升。

常規定價不變 新增“快速模式”選項

價格方面,Anthropic并未提高標準使用成本。

Claude Opus 4.8維持與Opus 4.7一致的常規定價:每百萬輸入token收費5美元,每百萬輸出token收費25美元。

同時,Anthropic新增“快速模式”(Fast Mode)方案,定價為每百萬輸入token收費10美元,主打更快響應體驗。

Anthropic同時繼續保留Prompt Caching、批處理折扣等企業級成本優化機制。

已在哪些平臺上線?云廠商同步接入

Anthropic表示,Claude Opus 4.8已正式上線Claude生態。

消費端與企業端方面,Pro、Max、Team、Enterprise用戶均可直接使用。

開發者則可通過Claude API調用claude-opus-4-8模型。

此外,Anthropic同步在主要云平臺開放部署,包括亞馬遜的AWS、谷歌云以及微軟的Foundry。

不止模型更新,Anthropic下一步想做什么?

除發布新模型外,Anthropic此次更新釋放出的更重要信號,或許是其正在從“模型能力競爭”進一步邁向“智能體系統競爭”。

Dynamic Workflows、多Agent協作、長流程自動執行、用戶可調思考強度等新功能,都顯示出Anthropic希望推動Claude從聊天模型向“長期自主執行系統”演進。

公司在公告中也反復強調,未來重點方向將繼續圍繞Agent能力、企業復雜工作流、工具調用、跨會話記憶與長期任務執行展開。

Anthropic表示,作為Glasswing項目的一部分,目前已有少數機構開始試用Claude Mythos預覽版,并將其應用于網絡安全相關工作中。鑒于此類模型具備極高的能力水平,在正式面向大眾發布之前,必須先行建立更為強健的網絡安全防護體系。

目前,Anthropic在構建這些安全防護措施方面正取得迅速進展,并預計,在未來數周內,即可將Mythos級別的模型正式向所有客戶開放。

從時間線上看,Anthropic顯然正在加速新品節奏:4月中旬才推出Opus 4.7,一個多月后便發布4.8,而且較此前外界根據泄露代碼推測的發布時間進一步提前。

在OpenAI、谷歌等廠商持續推進Agent和推理模型競爭的背景下,Anthropic選擇用更快的迭代速度、更多系統級功能升級,繼續押注高端企業AI市場。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
哈弗茨歐冠決賽打入2球,自改制以來僅次于C羅和貝爾

哈弗茨歐冠決賽打入2球,自改制以來僅次于C羅和貝爾

懂球帝
2026-05-31 00:45:09
利物浦下課僅數小時,斯洛特閃電成AC米蘭新帥頭號目標!5大豪門搶人戰一觸即發

利物浦下課僅數小時,斯洛特閃電成AC米蘭新帥頭號目標!5大豪門搶人戰一觸即發

元氣滿分吖
2026-05-31 02:01:19
六輛裝甲車白守!無人機鉆門縫炸穿指揮室,旅長當場腦漿迸裂

六輛裝甲車白守!無人機鉆門縫炸穿指揮室,旅長當場腦漿迸裂

深度報
2026-05-30 00:32:15
歐冠決賽兩大爭議判罰!薩卡手球逃點,阿什拉夫鎖喉哈弗茨逃紅

歐冠決賽兩大爭議判罰!薩卡手球逃點,阿什拉夫鎖喉哈弗茨逃紅

奧拜爾
2026-05-31 00:50:22
耿同學抖音賬號,已被永久限流!中南大學湘雅醫學院回應論文造假:已要求課題組提交原始數據

耿同學抖音賬號,已被永久限流!中南大學湘雅醫學院回應論文造假:已要求課題組提交原始數據

TOP大學來了
2026-05-30 19:02:11
釋永信被判24年,為啥不是無期?盤點他的錢色人生

釋永信被判24年,為啥不是無期?盤點他的錢色人生

大江看潮
2026-05-30 10:48:52
從1-2至3-2!北京國安絕境大逆轉,法比奧創紀錄,重慶3分鐘丟2球

從1-2至3-2!北京國安絕境大逆轉,法比奧創紀錄,重慶3分鐘丟2球

汪星人喲
2026-05-30 22:02:12
官方發布歐冠歷史射手榜!炸出一堆牛鬼蛇神,C羅140球穩居第一

官方發布歐冠歷史射手榜!炸出一堆牛鬼蛇神,C羅140球穩居第一

寒士之言本尊
2026-05-30 16:36:06
汽車變客廳?中國監管擬禁止零重力座椅

汽車變客廳?中國監管擬禁止零重力座椅

甜份超標的我
2026-05-30 02:11:08
重磅!利物浦官宣47歲斯洛特下課:投入5億僅排第5 創2大恥辱紀錄

重磅!利物浦官宣47歲斯洛特下課:投入5億僅排第5 創2大恥辱紀錄

風過鄉
2026-05-30 19:33:04
王菲低調現身謝霆鋒鳥巢演唱會,好友俞飛鴻陪同觀演,當天演出系謝霆鋒時隔23年重返北京舉辦大型個唱

王菲低調現身謝霆鋒鳥巢演唱會,好友俞飛鴻陪同觀演,當天演出系謝霆鋒時隔23年重返北京舉辦大型個唱

大象新聞
2026-05-30 23:47:03
中央氣象臺:廣東貴州等地有分散性強降水 東北地區等地有強對流

中央氣象臺:廣東貴州等地有分散性強降水 東北地區等地有強對流

環球網資訊
2026-05-30 18:32:07
遺憾!張雪機車無緣3連冠+曇花六現 德比斯衛冕失敗:獲第8拿8分

遺憾!張雪機車無緣3連冠+曇花六現 德比斯衛冕失敗:獲第8拿8分

念洲
2026-05-30 19:01:54
54:45!美國投票結果出爐,一個時代已結束,中國加速減持美債

54:45!美國投票結果出爐,一個時代已結束,中國加速減持美債

潮鹿逐夢
2026-05-30 04:10:27
終于等到你!國足天才時隔587天再次踢滿全場:已貢獻3助攻

終于等到你!國足天才時隔587天再次踢滿全場:已貢獻3助攻

邱澤云
2026-05-30 23:44:54
歐冠決賽首發:阿什拉夫復出+大巴黎最強陣沖衛冕!阿森納排4中衛

歐冠決賽首發:阿什拉夫復出+大巴黎最強陣沖衛冕!阿森納排4中衛

我愛英超
2026-05-30 22:56:48
打虎!王益華被查

打虎!王益華被查

新京報
2026-05-30 20:29:17
阿森納夢幻開局!哈弗茨5分鐘閃擊 零度角世界波 歐冠決賽2場2球

阿森納夢幻開局!哈弗茨5分鐘閃擊 零度角世界波 歐冠決賽2場2球

奧拜爾
2026-05-31 00:13:18
古巴8個鮮為人知的事實:曾迫使數萬華人流亡,從富裕國家滑落至極度困難

古巴8個鮮為人知的事實:曾迫使數萬華人流亡,從富裕國家滑落至極度困難

三言四拍
2026-05-30 13:05:06
國產車圈大變局:優等生小米虧31億,理想虧23億!小鵬虧18億

國產車圈大變局:優等生小米虧31億,理想虧23億!小鵬虧18億

互聯網.亂侃秀
2026-05-29 11:32:00
2026-05-31 02:16:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
146893文章數 2653742關注度
往期回顧 全部

科技要聞

車圈大佬發聲:價格戰遠去,但競爭仍殘酷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

體育要聞

歲月不饒人!39歲德約鏖戰近5小時拼到嘔吐

娛樂要聞

張碧晨《歌手》 “活人微死” 自嘲

財經要聞

雙匯管不住一頭豬

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

游戲
數碼
藝術
房產
手機

巫師3新DLC跨十年:年輕玩家在初發售時還是小孩!

數碼要聞

沒等到Arc G3!華碩ROG Ally 2026新掌機曝光: 仍用AMD銳龍Z2 Extreme

藝術要聞

非洲超級地標!全球最大足球場,持續推進!

房產要聞

紅動五月!全國搶入核心資產,廣州盯緊凱旋新世界!

手機要聞

REDMI K90至尊版入網?K90單品激活破200萬

無障礙瀏覽 進入關懷版