網易首頁 > 網易號 > 正文申請入駐

僅需一行代碼AI智商飆升成本反降！Claude推出軍師模式：最強模型opus只做幕后大腦

2026-04-10 17:23:19　來源: 人工智能學家

北京舉報

分享至

來源：AI寒武紀

Anthropic又出招了,在Claude平臺上實裝了一套軍師策略,主要目標降低成本和提高次級模型智商。最近很多網友反應claude 降智了，A廠現在的頂尖模型的token使用很明顯就是偏向to B和內部迭代，越來越對C端不友好了，不知道A廠內部是不是很早就在偷用這個軍師策略

簡單來說，就是讓最強大的Opus模型在后臺當軍師，讓輕量級的Sonnet或者Haiku模型去當執行者。通過這種搭配，開發者可以用極低的成本，讓自己的智能體瞬間獲得接近Opus級別的頂級智商。

過去很多開發者為了平衡AI的智力和使用成本，自己摸索出了這種大小模型打配合的套路。今天，Anthropic官方直接把這個經驗變成了Claude平臺上的一個現成工具，只需要在API調用里改一行代碼就能實現。

這個策略的運作機制非常巧妙。

在軍師策略下，Sonnet或Haiku會作為執行者負責包攬全場。它們從頭到尾運行任務，調用各種工具，讀取結果，并不斷嘗試解決問題。但是，當執行者遇到難度極高的關鍵決策，覺得自己搞不定時，它就會呼叫Opus這位軍師來尋求指導。

接到呼叫后，Opus會讀取雙方共享的上下文信息，然后給出一個明確的計劃，一個糾錯建議，或者直接給出一個停止信號，隨后執行者拿到建議繼續干活。在這個過程中，軍師絕對不會親自去調用任何工具，也不會直接生成給用戶看的最終內容，它的職責僅僅是給執行者提供高層指導。

這種玩法直接反轉了業界目前最常用的子智能體模式。以前大家習慣用一個超大模型做統籌節點，把任務拆解后分發給底下的工人小模型去干。而在軍師策略里，一個小巧且極其省錢的模型承擔了主導和向上匯報的工作，完全不需要復雜的任務拆解邏輯和龐大的工人池。最頂尖的推理算力好鋼全用在了刀刃上，只有在執行者真正卡殼時才介入，剩下的絕大部分運行時間都維持在極低的成本線上。

實測數據證明了這套方案的強大。

在SWE benchmark Multilingual這套測試集中，帶上Opus軍師的Sonnet執行者，最終得分比單打獨斗的Sonnet高出了2.7個百分點，而每個任務的平均成本居然還降低了11.9%。

在BrowseComp和Terminal benchmark 2.0這兩項基準測試中，有Opus當軍師的Sonnet不僅得分全面提升，花費同樣比單獨使用Sonnet時還要少。

如果把執行者換成尺寸最小的Haiku模型，效果更加立竿見影。在BrowseComp測試中，帶上軍師的Haiku拿到了41.2%的高分，這比它自己單干時19.7%的成績翻了一倍還要多。雖然這個組合的最終得分比單用Sonnet落后29%，但它的單次任務成本足足下降了85%。引入軍師確實會讓Haiku增加一點開銷，但整體算下來依然只是單跑Sonnet的一小部分零頭。對于那些既需要一定智商又面臨海量高并發需求的應用場景來說，這是一個極具殺傷力的性價比選項。

現在，這個軍師工具已經在Claude平臺上開啟Beta測試。

開發者只要在Messages API請求中聲明advisor 20260301，模型的交接工作就會在同一個API請求內全部自動完成。不需要任何額外的網絡往返通信，也不用開發者手動去管理復雜的上下文。

執行者模型會自己判斷什么時候該請軍師出山。一旦觸發，系統會在后臺自動把整理好的上下文發給軍師，獲取計劃后執行者無縫銜接繼續推進，整個過程行云流水。

核心代碼的配置非常簡單：


response = client.messages.create(
    model=claude-sonnet-4-6,  
    tools=[
        {
            type: advisor_20260301,
            name: advisor,
            model: claude-opus-4-6,
            max_uses: 3,
        },
    ],
    messages=[...]
)

計費方式也算得非常清楚。軍師消耗的Token按軍師的超大杯費率算，執行者消耗的Token按輕量級的費率算。因為軍師通常只會吐出一份包含400到700個Token的簡短指導計劃，而耗費大量Token的最終長文本全交給價格低廉的執行者搞定，所以總體成本被死死壓在了全量跑大模型之下。

不僅如此，官方還內置了成本控制功能。你可以通過設置max_uses參數來限制每次請求中呼叫軍師的次數上限。系統也會在使用情況明細里把軍師消耗的Token單獨列出來，方便你追蹤每一塊錢的去向。

這個新工具和你現有的技術棧完全兼容。軍師工具本質上只是你API請求列表里的一個新增條目而已。你的智能體完全可以一邊在網上搜索資料，一邊敲代碼測試，遇到死胡同時順手向Opus請教一下，所有動作都在同一個循環里完美閉環。

想要立即上手體驗體驗，只需按照以下三個步驟操作即可：

首先在請求頭中加上Beta版特性聲明：anthropic-beta: advisor-tool-2026-03-01

接著在你的Messages API請求里添加advisor_20260301

最后根據你具體的業務場景調整一下系統提示詞

Anthropic官方強烈建議開發者現在就用自己的評估數據集跑一下對比測試，分別看看單跑Sonnet，采用軍師策略組合，以及單跑Opus的具體效果差異。

source :

https://claude.com/blog/the-advisor-strategy

閱讀最新前沿科技趨勢報告，請訪問21世紀關鍵技術研究院的“未來知識庫”

未來知識庫是 “21世紀關鍵技術研究院”建立的在線知識庫平臺，收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能，數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

（加入未來知識庫，全部資料免費閱讀和下載）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.