![]()
來源:AI寒武紀
Anthropic又出招了,在Claude平臺上實裝了一套軍師策略,主要目標降低成本和提高次級模型智商。最近很多網友反應claude 降智了,A廠現在的頂尖模型的token使用很明顯就是偏向to B和內部迭代,越來越對C端不友好了,不知道A廠內部是不是很早就在偷用這個軍師策略
簡單來說,就是讓最強大的Opus模型在后臺當軍師,讓輕量級的Sonnet或者Haiku模型去當執行者。通過這種搭配,開發者可以用極低的成本,讓自己的智能體瞬間獲得接近Opus級別的頂級智商。
![]()
過去很多開發者為了平衡AI的智力和使用成本,自己摸索出了這種大小模型打配合的套路。今天,Anthropic官方直接把這個經驗變成了Claude平臺上的一個現成工具,只需要在API調用里改一行代碼就能實現。
這個策略的運作機制非常巧妙。
在軍師策略下,Sonnet或Haiku會作為執行者負責包攬全場。它們從頭到尾運行任務,調用各種工具,讀取結果,并不斷嘗試解決問題。但是,當執行者遇到難度極高的關鍵決策,覺得自己搞不定時,它就會呼叫Opus這位軍師來尋求指導。
接到呼叫后,Opus會讀取雙方共享的上下文信息,然后給出一個明確的計劃,一個糾錯建議,或者直接給出一個停止信號,隨后執行者拿到建議繼續干活。在這個過程中,軍師絕對不會親自去調用任何工具,也不會直接生成給用戶看的最終內容,它的職責僅僅是給執行者提供高層指導。
這種玩法直接反轉了業界目前最常用的子智能體模式。以前大家習慣用一個超大模型做統籌節點,把任務拆解后分發給底下的工人小模型去干。而在軍師策略里,一個小巧且極其省錢的模型承擔了主導和向上匯報的工作,完全不需要復雜的任務拆解邏輯和龐大的工人池。最頂尖的推理算力好鋼全用在了刀刃上,只有在執行者真正卡殼時才介入,剩下的絕大部分運行時間都維持在極低的成本線上。
實測數據證明了這套方案的強大。
在SWE benchmark Multilingual這套測試集中,帶上Opus軍師的Sonnet執行者,最終得分比單打獨斗的Sonnet高出了2.7個百分點,而每個任務的平均成本居然還降低了11.9%。
![]()
在BrowseComp和Terminal benchmark 2.0這兩項基準測試中,有Opus當軍師的Sonnet不僅得分全面提升,花費同樣比單獨使用Sonnet時還要少。
![]()
如果把執行者換成尺寸最小的Haiku模型,效果更加立竿見影。在BrowseComp測試中,帶上軍師的Haiku拿到了41.2%的高分,這比它自己單干時19.7%的成績翻了一倍還要多。雖然這個組合的最終得分比單用Sonnet落后29%,但它的單次任務成本足足下降了85%。引入軍師確實會讓Haiku增加一點開銷,但整體算下來依然只是單跑Sonnet的一小部分零頭。對于那些既需要一定智商又面臨海量高并發需求的應用場景來說,這是一個極具殺傷力的性價比選項。
![]()
現在,這個軍師工具已經在Claude平臺上開啟Beta測試。
開發者只要在Messages API請求中聲明advisor 20260301,模型的交接工作就會在同一個API請求內全部自動完成。不需要任何額外的網絡往返通信,也不用開發者手動去管理復雜的上下文。
執行者模型會自己判斷什么時候該請軍師出山。一旦觸發,系統會在后臺自動把整理好的上下文發給軍師,獲取計劃后執行者無縫銜接繼續推進,整個過程行云流水。
核心代碼的配置非常簡單:
response = client.messages.create(
model=claude-sonnet-4-6,
tools=[
{
type: advisor_20260301,
name: advisor,
model: claude-opus-4-6,
max_uses: 3,
},
],
messages=[...]
)
計費方式也算得非常清楚。軍師消耗的Token按軍師的超大杯費率算,執行者消耗的Token按輕量級的費率算。因為軍師通常只會吐出一份包含400到700個Token的簡短指導計劃,而耗費大量Token的最終長文本全交給價格低廉的執行者搞定,所以總體成本被死死壓在了全量跑大模型之下。
不僅如此,官方還內置了成本控制功能。你可以通過設置max_uses參數來限制每次請求中呼叫軍師的次數上限。系統也會在使用情況明細里把軍師消耗的Token單獨列出來,方便你追蹤每一塊錢的去向。
這個新工具和你現有的技術棧完全兼容。軍師工具本質上只是你API請求列表里的一個新增條目而已。你的智能體完全可以一邊在網上搜索資料,一邊敲代碼測試,遇到死胡同時順手向Opus請教一下,所有動作都在同一個循環里完美閉環。
想要立即上手體驗體驗,只需按照以下三個步驟操作即可:
首先在請求頭中加上Beta版特性聲明:anthropic-beta: advisor-tool-2026-03-01
接著在你的Messages API請求里添加advisor_20260301
最后根據你具體的業務場景調整一下系統提示詞
Anthropic官方強烈建議開發者現在就用自己的評估數據集跑一下對比測試,分別看看單跑Sonnet,采用軍師策略組合,以及單跑Opus的具體效果差異。
source :
https://claude.com/blog/the-advisor-strategy
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.