Opus 4.8剛發(fā)布,跑分全面超過GPT-5.5和Gemini 3.1 Pro,快速模式價(jià)格直接比上代便宜了三分之二。一個(gè)前沿模型,性能往上走,價(jià)格往下走,這劇情本身就夠反常。但更值得琢磨的是另外兩件事:dynamic workflows把任務(wù)規(guī)劃從對話窗口里挪到了代碼里,用戶還能手動(dòng)調(diào)模型的"思考強(qiáng)度"。一邊是能力在漲,一邊是控制權(quán)在往回交,這對每天跟代碼打交道的開發(fā)者來說,信息量不小。
先拆dynamic workflows。它的本質(zhì)是讓Claude用JavaScript寫一段編排腳本,把用戶的需求拆成子任務(wù),分給并行運(yùn)行的subagents去干。關(guān)鍵變化藏在一個(gè)細(xì)節(jié)里:任務(wù)計(jì)劃不再堆在Claude的上下文窗口里,中間結(jié)果全存在腳本變量里,最終只把答案送回對話。這意味著上下文不會(huì)被越拖越長的規(guī)劃過程稀釋掉,也不容易跑偏。subagents的并發(fā)上限是16個(gè),單次運(yùn)行總數(shù)不超過1000個(gè),腳本本身碰不了文件系統(tǒng)和shell,能讀寫文件的是agents。進(jìn)度隨時(shí)保存,中斷了可以在同一個(gè)session里恢復(fù),已經(jīng)跑完的agents直接返回緩存結(jié)果。
![]()
Anthropic放出的案例很有看頭。Jarred Sumner用dynamic workflows把Bun從Zig移植到Rust,生成約75萬行代碼,測試套件通過率99.8%,從第一次commit到merge花了11天。過程是這樣的:一個(gè)workflow負(fù)責(zé)給每個(gè)struct字段映射正確的Rust lifetime,下一個(gè)workflow把每個(gè).rs文件改寫成行為一致的移植版本,數(shù)百個(gè)agents并行干活,每個(gè)文件配兩個(gè)reviewer,后面跟一個(gè)修復(fù)循環(huán)持續(xù)跑構(gòu)建和測試,直到全部通過為止。不過Anthropic也說明了,這個(gè)結(jié)果已經(jīng)合入但還沒上生產(chǎn)。
![]()
第二個(gè)變化是思考強(qiáng)度控制。用戶現(xiàn)在可以手動(dòng)調(diào)高或調(diào)低Claude投入推理資源的程度。調(diào)高就"更頻繁、更深入地思考",回答質(zhì)量往上走;調(diào)低就更快回應(yīng)用戶,消耗rate limit的速度也變慢。這個(gè)設(shè)計(jì)戳中了一個(gè)挺現(xiàn)實(shí)的焦慮:很多人已經(jīng)感覺到AI服務(wù)在通過各種額度機(jī)制變相漲價(jià),額度消耗速度比預(yù)期快得多。現(xiàn)在能自己握個(gè)開關(guān),至少知道快慢和消耗是怎么掛鉤的。
價(jià)格這塊,快速模式的變化最直接。Opus 4.8快速模式的速度是正常輸出的2.5倍,價(jià)格降到每百萬輸入token 10美元、每百萬輸出token 50美元。對比Opus 4.7的30美元和150美元,降了整整三倍。常規(guī)模式下,Opus 4.8還是每百萬輸入5美元、輸出25美元,跟Opus 4.7持平,而且比GPT-5.5便宜。快速模式已經(jīng)在Claude Code里通過/fast命令可用,API訪問還得去claude.com/fast-mode申請waitlist。企業(yè)版需管理員開通,Max和Team計(jì)劃默認(rèn)開啟。
![]()
功能說完,有個(gè)點(diǎn)不容忽視。Opus 4.8在整體基準(zhǔn)測試上壓了GPT-5.5和Gemini 3.1 Pro一頭,但agentic terminal coding這項(xiàng),OpenAI的模型還在前面。所以不是一個(gè)模型把所有科目都考了第一的劇本,而是在開發(fā)者工作流這個(gè)具體戰(zhàn)場上擺出了新的棋局。dynamic workflows瞄準(zhǔn)的是大規(guī)模任務(wù)編排,fast mode卡的是延遲敏感的生產(chǎn)環(huán)境,方向很清楚。
最后說一下"誠實(shí)"這個(gè)事。今天的大模型競賽里,聰明、快速、能寫代碼已經(jīng)成了標(biāo)配,難的是找到一個(gè)真能老老實(shí)實(shí)說"我不知道"的AI。第歐根尼大白天打著燈籠找誠實(shí)的人,放今天,人們大概想找的是個(gè)誠實(shí)的模型。跑分能告訴你誰能寫更多代碼,但沒辦法回答模型會(huì)不會(huì)在搞不定時(shí)硬編一個(gè)答案。Opus 4.8在跑分上拿了優(yōu)勢,在定價(jià)上給了誠意,但誠實(shí)這道附加題,還沒人交卷。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.