MODEL
今天,Anthropic 發布了 Claude Managed Agents
這是一套可組合的 API,用于構建和部署云托管的 AI Agent。但跟市面上的 Agent 框架不同,Anthropic 賣的核心是 Harness(Agent 編排引擎):一個經過調優的編排循環,自動處理工具調用決策、上下文管理、錯誤恢復,并且隨模型能力升級自動演進
![]()
Claude Managed Agents 架構,來自官方產品博客
之前 Anthropic 的產品線有一個明顯的斷層。面向消費者有 claude.ai 和 Claude Code,面向開發者有 Messages API。但如果一家企業想基于 Claude 做一個長時間運行的、能自主調用工具的 Agent,它需要自己搭沙箱、做狀態管理、處理權限、寫錯誤恢復邏輯。這些基礎設施工作可能比 Agent 本身的業務邏輯還重
Managed Agents 填的就是這個空。你定義 Agent 的任務、工具和約束,Anthropic 負責跑
它能做什么 生產級沙箱
每個 Agent 跑在一個安全的云容器里,可以預裝 Python、Node.js、Go 等環境,配置網絡訪問規則,掛載文件。Agent 在容器里執行代碼、編輯文件、跑命令,都在隔離環境中
長時間運行的 Session
Agent 可以自主運行幾個小時,斷連了會恢復,進度和產出持久化。這解決了「Agent 跑到一半掛了怎么辦」的問題
內置編排 Harness
Anthropic 提供了一個經過調優的 Agent Harness,自動處理工具調用決策、上下文管理和錯誤恢復。內置 prompt caching、compaction 等性能優化
多 Agent 協調
研究預覽階段。一個 Agent 可以啟動其他 Agent,分配子任務并行處理
自評估能力
研究預覽階段。你定義成功標準,Claude 自己迭代直到達標。在內部測試中,結構化文件生成任務的成功率比標準 prompting 方式提高了最多 10 個百分點,提升在難題上最明顯
治理工具
Scoped permissions(作用域權限)、身份管理、執行追蹤。Session tracing 和集成分析直接內置在 Claude Console 里,可以檢查每一個工具調用、決策點和失敗模式
定義 Agent 可以用自然語言描述,也可以用 YAML 文件。支持 MCP 服務器和 Agent Skills
Harness 怎么做的:把大腦和手分開
這是這次發布中技術含量最高的部分。Anthropic 同時發了一篇工程博客,標題是「Scaling Managed Agents: Decoupling the brain from the hands」,詳細講了 Harness 的架構設計
Harness 編碼的是模型做不到什么的假設,這些假設會過時
一個具體例子:Sonnet 4.5 在接近上下文限制時會提前收工(他們叫「context anxiety」),Anthropic 在 Harness 里加了上下文重置來應對。但換到 Opus 4.5 之后,這個行為消失了,重置變成了多余的負擔
所以 Managed Agents 的設計目標是:為「尚未想到的程序」設計系統。這個思路借鑒了操作系統的做法。操作系統通過虛擬化硬件(進程、文件)來支持還不存在的程序。抽象比硬件活得久
三層虛擬化
Managed Agents 把 Agent 的組成部分虛擬化成三個接口:
Session(會話):所有事件的追加寫入日志,持久存儲在 Harness 之外
Harness(編排循環):調用 Claude、把 Claude 的工具調用路由到對應基礎設施的循環
Sandbox(執行環境):Claude 可以在里面跑代碼和編輯文件的容器
三者解耦,互不依賴。任何一個出故障或需要替換,都不影響其他兩個
![]()
大腦與雙手解耦的架構
從寵物到牲畜
最初的設計把所有組件放在一個容器里。好處是文件操作是直接系統調用,沒有服務邊界。但壞處是:容器變成了一只「寵物」。寵物壞了你得救它,牲畜壞了換一頭就行
![]()
耦合 vs 解耦:從寵物到牲畜
解耦之后,容器變成了牲畜。Harness 通過 execute(name, input) → string 調用容器,就像調用其他工具一樣。容器掛了,Harness 捕獲錯誤傳給 Claude,Claude 決定是否重試,重試就起一個新容器
Harness 也變成了牲畜。Session 日志在 Harness 之外,Harness 崩潰了什么都不丟。新的 Harness 通過 wake(sessionId) 啟動,從上次停下的地方繼續
安全邊界也因此變干凈了。耦合設計里,Claude 生成的不可信代碼跟憑證在同一個容器里。解耦后,憑證永遠不在沙箱里。Git 令牌在初始化時寫入本地 remote,Agent 不經手。OAuth 令牌存在安全保管庫里,通過代理調用
Session 不是上下文窗口
長任務經常超出 Claude 的上下文窗口。壓縮、裁剪、總結都是不可逆操作,可能丟掉后面用得上的信息
![]()
Session 與上下文窗口的關系
Managed Agents 的做法是:Session 作為一個獨立的、持久化的上下文對象存在于上下文窗口之外。Harness 通過 getEvents() 按需取回事件流的切片,可以回到特定時刻之前重讀上下文
多個大腦,多雙手
解耦帶來了擴展能力。之前 Harness 在容器里,每個 Agent 會話都要等容器起好才能開始推理。解耦后,推理可以在容器起好之前就開始。p50 TTFT 下降了約 60%,p95 下降了超過 90%
![]()
多大腦多雙手
每雙手就是一個工具調用:execute(name, input) → string。Harness 不知道沙箱是容器、手機還是 Pokémon 模擬器。因為手不綁定大腦,大腦之間可以互相傳遞手
Anthropic 工程博客把這個架構叫「meta-harness」:不對具體的 Harness 實現做假設,只對 Claude 需要的接口形狀做假設
誰在用
我們希望 Notion 成為團隊與 Agent 協作、把事情做完的最佳場所。Claude Managed Agents 能處理長時間運行的 Session、管理記憶、持續輸出高質量結果
Eric Liu,Notion 產品經理
Rakuten 在產品、銷售、營銷、財務、HR 部門都部署了 Agent,接入 Slack 和 Teams。每個專項 Agent 一周內部署完成
Asana 做了 AI Teammates,在項目管理流程中跟人類協作。團隊表示用 Managed Agents「顯著加速了高級功能的開發」
Sentry 把 Seer 調試 Agent 跟 Claude Agent 配對,后者負責寫補丁和開 PR。集成在幾周內完成,而非原來預估的幾個月
Atlassian 把 Agent 直接構建到 Jira 工作流里,用戶可以在 Jira 中直接分配任務給 Agent
定價
標準的 Claude Platform token 費率,加上每個 Session 的活躍運行時間 $0.08/小時(按毫秒計量)。Agent 等待用戶輸入或等待工具返回的空閑時間不計費。Agent 做 web 搜索額外收 $10/千次搜索
幾個信號
第一,Anthropic 的產品形態在這一步發生了質變。之前它賣的是模型(API token),現在它賣的是運行 Agent 的基礎設施(容器、Session、Harness、權限管理)。從「模型提供商」到「Agent 基礎設施提供商」,這是一個根本性的定位轉移
第二,Harness 的 meta-harness 設計思路值得注意。Anthropic 沒有把某一個具體的 Harness 實現寫死,而是虛擬化了 Harness 的接口。這跟操作系統的設計哲學一致:接口比實現活得久
第三,時間線。4 月 4 日封殺 OpenClaw 訂閱通道,4 月 7 日發布 Mythos,4 月 8 日發布 Managed Agents。三天三個動作:收緊第三方 Agent 的薅羊毛通道,展示最強模型能力,推出自己的 Agent 基礎設施平臺。商業閉環形成
$0.08/session-hour 意味著 Anthropic 開始在 token 之外賺錢了
Token 收入跟模型使用量掛鉤,session-hour 收入跟 Agent 運行時長掛鉤。后者是一個更穩定、更可預測的收入流
參考材料
Claude Managed Agents 產品公告https://claude.com/blog/claude-managed-agents
Anthropic 工程博客:Scaling Managed Agentshttps://www.anthropic.com/engineering/managed-agents
Claude Managed Agents API 文檔https://platform.claude.com/docs/en/managed-agents/overview
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.