網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude Opus 4.6被指"降智":Anthropic如何在服務(wù)器端"砍預(yù)算"讓旗艦?zāi)P妥儽?/h1>
0
分享至

2026年2月Claude Opus 4.6更新后,開發(fā)者圈子一片哀嚎:復(fù)雜工程任務(wù)從"Senior Expert"級協(xié)作,迅速退化成"需要反復(fù)監(jiān)督的實習(xí)生"。AMD高級AI總監(jiān)Stella Laurenzo甩出的6852次日志實錘把一切量化:中位思考長度從2200字符暴跌至600字符(降73%),代碼閱讀/修改比例從6.6:1崩到2:1,模型"上來就瞎寫"而不看上下文;錯誤導(dǎo)致API重試暴增80倍,用戶實際支出上升卻質(zhì)量下滑。


GitHub Issue、Reddit r/ClaudeAI、HN討論和獨立分析(6800+會話數(shù)據(jù))進一步確認:這波"shrinkflation"(縮水通脹)從2月下旬開始,3月思考內(nèi)容隱藏功能上線后更難察覺。Anthropic官方回應(yīng)稱是"自適應(yīng)思考(adaptive thinking)+默認effort=85(中等努力)"的優(yōu)化結(jié)果,目的是提升延遲和token效率,并非惡意降智。但用戶數(shù)據(jù)表明,復(fù)雜工程場景下模型嚴(yán)重低估任務(wù)復(fù)雜度,導(dǎo)致淺層推理。

下面,我們不糾結(jié)"動機"(成本控制 vs 新模型Mythos鋪路),而是純技術(shù)推測:Anthropic到底通過哪些服務(wù)器端/推理時操作,就能讓一個已經(jīng)訓(xùn)練好的旗艦?zāi)P停∣pus 4.6)在不重新訓(xùn)練、不改變定價的情況下,系統(tǒng)性地"降智"?


1. 最核心推測:推理預(yù)算(Thinking Budget)從固定高配切換到動態(tài)自適應(yīng)限流

Anthropic早在Claude Code文檔中就支持MAX_THINKING_TOKENS和/effort參數(shù)。Opus 4.6引入"adaptive thinking"后,服務(wù)器端默認把effort從"high/max"下調(diào)至"medium(85)"。模型內(nèi)部有一個meta-decider(元決策器),根據(jù)prompt復(fù)雜度估算需要多少思考token,然后動態(tài)截斷。

推測細節(jié):后端配置文件中,adaptive_thinking_threshold被調(diào)低,或引入負載感知的budget_scaler(例如高峰期自動乘以0.3-0.5系數(shù))。日志顯示思考長度"時段性"波動,正好匹配AWS/Google Cloud的動態(tài)負載均衡API。

效果:簡單任務(wù)不受影響,復(fù)雜多文件工程直接"淺思考",Read:Edit比率崩盤。用戶付的output token(思考也按output計費)反而更多,因為重試循環(huán)。

2. 努力等級(Effort Levels)映射到底層算力配額

Anthropic把effort拆成離散等級(low/medium/high/max),每個等級對應(yīng)不同的內(nèi)部compute allocation。Medium effort限制總推理步數(shù)(steps)或并行CoT鏈數(shù)量,強制模型早停(early stopping)。更狠的可能是:服務(wù)器端路由部分請求到量化/蒸餾子模型(quantized Opus-lite),對外仍標(biāo)"Opus 4.6",用戶無感知。日志中"閱讀上下文不足"正是低比特量化后注意力機制退化的典型癥狀。

3. 負載感知動態(tài)配額 + 時段性throttling

后端部署了global rate limiter + per-region budget allocator,根據(jù)GPU/TPU實時利用率自動縮減單查詢的max_tokens_for_thinking。峰值時段(5-7pm,美西/全球用戶重疊)觸發(fā)throttle_factor=0.4,深夜恢復(fù)1.0——這解釋了AMD總監(jiān)日志的"智商按時段分配"。

4. 輔助優(yōu)化手段:上下文壓縮 + 采樣策略微調(diào)

Context Compaction自動壓縮歷史對話/代碼庫,丟失關(guān)鍵細節(jié),導(dǎo)致模型"讀不懂"長上下文。Decoding tweaks方面,默認temperature下調(diào)、top_p收緊、top_k限制,減少探索性,輸出更"保守"但也更淺薄、易翻車。



結(jié)論與用戶建議

Opus 4.6的"降智"本質(zhì)是商業(yè)成本優(yōu)化在技術(shù)上的完美落地——通過自適應(yīng)預(yù)算、努力映射、負載throttling三板斧,把高階推理的GPU小時從用戶身上摳出來,轉(zhuǎn)嫁到重試費用和用戶挫敗感上。

開發(fā)者應(yīng)對建議:強制/effort max + CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING;拆解任務(wù)(先規(guī)劃再執(zhí)行);監(jiān)控自己的thinking長度(用第三方proxy);或切換到Sonnet 4.6(有時反而更穩(wěn))。

AI時代,模型能力不再是"訓(xùn)練出來"的固定屬性,而是服務(wù)器端可實時調(diào)節(jié)的旋鈕。Anthropic這次把旋鈕往"省錢"方向猛擰了一把,用戶用數(shù)據(jù)和錢買了教訓(xùn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
32歲帥小伙與54歲大媽,街頭熱吻!網(wǎng)友:這小伙也是真的“餓”了

32歲帥小伙與54歲大媽,街頭熱吻!網(wǎng)友:這小伙也是真的“餓”了

川渝視覺
2026-04-17 22:26:16
賴清德背后主子浮出水面,大陸擒賊先擒王,誓要斬斷幕后黑手!

賴清德背后主子浮出水面,大陸擒賊先擒王,誓要斬斷幕后黑手!

琴琴有氧運動
2026-04-19 09:53:39
醫(yī)生坦言:只要血脂報告里沒有這2個詞,血管健康就不用太擔(dān)憂

醫(yī)生坦言:只要血脂報告里沒有這2個詞,血管健康就不用太擔(dān)憂

健康科普365
2026-04-07 11:35:05
隨著曼城2-1阿森納,利物浦2-1,維拉4-3,英超最新積分榜出爐

隨著曼城2-1阿森納,利物浦2-1,維拉4-3,英超最新積分榜出爐

側(cè)身凌空斬
2026-04-20 01:29:49
于海青:為何說廣東黃坤明書記不斷下基層讓企業(yè)信心滿滿?

于海青:為何說廣東黃坤明書記不斷下基層讓企業(yè)信心滿滿?

于海青
2026-04-19 19:54:18
撿漏神操作!曼聯(lián)鎖定 5200 萬皇馬巨星,完爆隊內(nèi)廢柴

撿漏神操作!曼聯(lián)鎖定 5200 萬皇馬巨星,完爆隊內(nèi)廢柴

瀾歸序
2026-04-20 01:07:19
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
北京首鋼VS吉林男籃!威廉姆斯上演首秀,趙睿回歸,央視直播

北京首鋼VS吉林男籃!威廉姆斯上演首秀,趙睿回歸,央視直播

體壇瞎白話
2026-04-20 08:32:56
印度幫助中國,誰也沒想到!印媒曝光美國圍堵中國的馬六甲大計劃

印度幫助中國,誰也沒想到!印媒曝光美國圍堵中國的馬六甲大計劃

忠于法紀(jì)
2026-04-20 10:13:32
不退役了?勇士4冠功臣預(yù)計回歸,年薪創(chuàng)紀(jì)錄,阻礙開拓者引援!

不退役了?勇士4冠功臣預(yù)計回歸,年薪創(chuàng)紀(jì)錄,阻礙開拓者引援!

你的籃球頻道
2026-04-19 17:14:51
廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開眼

廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開眼

今日搞笑分享
2026-04-06 17:55:16
少年低成本Cos弗利薩大王,結(jié)果乳膠漆洗不掉,悲劇了

少年低成本Cos弗利薩大王,結(jié)果乳膠漆洗不掉,悲劇了

英國那些事兒
2026-04-19 23:07:52
湖人G2賽前做出爭議決定,或?qū)氐准づ材匪梗?>
    </a>
        <h3>
      <a href=夜白侃球
2026-04-20 10:12:53
強闖臺海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門口

強闖臺海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門口

阿傖說事
2026-04-20 06:43:47
美國“密謀兵變”,以色列80年魔咒成真?正在復(fù)燃的美國反猶本色

美國“密謀兵變”,以色列80年魔咒成真?正在復(fù)燃的美國反猶本色

南宗歷史
2026-04-19 23:11:51
人形機器人半馬眾生相:榮耀跑最快,但別小看那些沒奪冠的“宇樹們”|甲子光年

人形機器人半馬眾生相:榮耀跑最快,但別小看那些沒奪冠的“宇樹們”|甲子光年

甲子光年
2026-04-19 20:38:36
又開始了,以軍不宣而戰(zhàn),美深夜開火,無人機墜毀后又有兩國反水

又開始了,以軍不宣而戰(zhàn),美深夜開火,無人機墜毀后又有兩國反水

嫹筆牂牂
2026-04-20 09:41:03
霍思燕帶狗泰國奪冠!肥肚三層、發(fā)際線好假,女兒出鏡像女版杜江

霍思燕帶狗泰國奪冠!肥肚三層、發(fā)際線好假,女兒出鏡像女版杜江

翰飛觀事
2026-04-08 19:57:12
西伯利亞:吃不完的鹿肉,收不完的糧;砍不完的森林,挖不完的礦

西伯利亞:吃不完的鹿肉,收不完的糧;砍不完的森林,挖不完的礦

小莜讀史
2026-04-17 20:53:45
CBA:首鋼新援到位,廣東奪冠,新疆溫情一幕

CBA:首鋼新援到位,廣東奪冠,新疆溫情一幕

老曁科普
2026-04-20 10:27:46
2026-04-20 11:03:00

知識圈 incentive-icons
知識圈
全球熱點新聞資訊
220文章數(shù) 317224關(guān)注度
往期回顧 全部

科技要聞

藍色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

失蹤女老板被找到 嫌犯曾改名整容還催警察"還我清白"

頭條要聞

失蹤女老板被找到 嫌犯曾改名整容還催警察"還我清白"

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

章子怡!增重20斤素顏拍新片

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

外觀非常驚艷 全新一代寶馬6系有望回歸

態(tài)度原創(chuàng)

本地
藝術(shù)
數(shù)碼
旅游
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

藝術(shù)要聞

王羲之《換鵝帖》尚在人間,驚艷無比!

數(shù)碼要聞

內(nèi)存短缺或致蘋果推遲上新 新款Mac Studio據(jù)稱延遲數(shù)月發(fā)布

旅游要聞

去藝術(shù)現(xiàn)場,赴一次深度游

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版