網易首頁 > 網易號 > 正文 申請入駐

Anthropic、OpenAI、谷歌和微軟都認為智能代理控制層是產品,但在定價上存在分歧

0
分享至


作者 | Janakiram MSV

譯者 | 平川

策劃 | Tina

本文最初發布于 TheNewStack 博客。

3 月 30 日,Sycamore宣布 了 6500 萬美元的種子輪融資,用于構建其創始人所說的自主企業級 AI 操作系統。4 月 8 日,Anthropic 在公共測試版中推出了每會話小時八美分的 托管代理。七天后,OpenAI 將自己的模型原生控制層(harness)作為開源 Agents SDK 的更新 發布,除標準 API 和工具費用外,無需支付額外的第一方運行時費用。

十六天內的三個動作,每一個都是基于相同的市場觀察在押注,F在,控制層是產品。但各實驗室在如何銷售該產品上存在尖銳的公開分歧。

Anthropic 在自己的基礎設施上增加了單獨計費的運行時。谷歌和微軟將其打包成一個跨會話、內存、代碼執行和工具的消費層。OpenAI 將運行時開源并免費提供,只對已經計費的模型和工具調用收費。這個領域正在迅速成型,但商業模式尚未確定。

1 什么是控制層?它為何會成為一個市場?

“控制層”這個詞在二月份廣泛流傳開來,當時 OpenAI 發表了一篇工程 博文,描述了一個小型團隊如何交付了一個百萬行的生產級系統,其中沒有一行代碼是由人手工編寫的。這個術語之所以流行了起來,是因為它命名了一個團隊一直在實踐但沒有命名的真實學科。Martin Fowler 在四月初的一篇長文中對其極力推崇,將控制工程(harness engineering)定義成圍繞 AI 模型但不包括模型在內的一切。

控制層是圍繞代理的控制層,幫助其在生產環境中可靠地運行。它通常涵蓋模型調用和上下文管理、工具編排、沙箱執行、持久化會話和執行狀態、范圍權限、錯誤恢復、可觀測性和追蹤。從這個意義上說,它類似于容器周圍的生產基礎設施:不是模型本身,而是使長期運行的代理更安全、更可調試且更可靠的周邊系統。

在過去的 18 個月里,云和框架供應商提供了這一層的部分托管組件,但大多數交付生產級代理的團隊仍然有太多的東西需要自己組裝。初創公司通過銷售現成的版本來籌集資金。內部平臺團隊基于開源組件構建自己的平臺?刂茖又猿蔀橐粋市場,是因為現有的組件還無法提供一個完整的解決方案。

2 Anthropic 交付了什么?它的使用成本是多少?

對于這一市場空白,Anthropic 給出的答案是 Managed Agents,他們將其打包為 Claude 平臺上的測試版 API。開發人員定義代理、工具和護欄,而 Anthropic 則負責運行執行環境。該環境支持持續數小時的長期會話、沙箱化代碼執行、范圍限定權限、端到端追蹤,以及基于 MCP 的第三方服務連接。

首批客戶頗具影響力。Notion 利用 Managed Agents 同時運行數十個并行委托任務。Rakuten 在產品、銷售、市場營銷、財務和人力資源等部門部署了專家代理。Sentry 開發了一個代理,能夠將標記出的 Bug 自動轉換為公開的拉取請求,無需任何人工干預。Asana 將該服務集成到了其 AI Teammates 功能中,而 Atlassian 也成為首批客戶之一。

其定價相對比較透明。所有模型推理都適用于 Claude 平臺的標準令牌費率,會話運行期間每會話小時八美分的基礎使用費。多代理編排、自我評估結果和長期記憶需要通過單獨的研究預覽訪問申請才能獲得,這也就意味著其中三項最引人注目的功能使用受限。

Anthropic 還提供了一個 Claude Agent SDK 用于編程構建,因此托管與開源的區別在于產品而不是公司。但托管代理,4 月 8 日發布的那一部分,僅托管在 Anthropic 的基礎設施上。

3 OpenAI 發布了什么?它的使用成本是多少?

七天后,OpenAI 下了不同的賭注。升級后的開源 Agents SDK 增加了模型原生控制層和本地沙箱執行,提供可配置的內存、沙箱感知編排、Codex 風格的文件系統工具和標準化的 MCP 集成。它針對的是持續好幾個小時并調用許多工具的長程代理(long-horizon agents),和托管代理針對的用例一樣。

該交付模式和 Anthropic 截然不同。OpenAI 不負責運行計算任務。開發者通過支持七家沙箱提供商(包括 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel)的 Manifest 抽象層自帶計算資源,存儲則分布于 S3、GCS、Azure Blob 和 Cloudflare R2 上。狀態外部化使運行實例能在沙箱容器丟失后繼續存活,并通過快照功能在新容器中恢復運行。雖然控制層負責協調,但基礎設施歸開發者所有。

價格線是對比最明顯的地方。OpenAI 的公告指出,新功能采用基于令牌和工具使用情況的標準 API 定價,不收取單獨的第一方運行時費用,也不按會話小時計費。SDK 本身是免費且開源的。開發者仍然需要向其選擇的任何服務提供商支付使用沙箱計算和存儲所產生的實際費用,因此總成本并非為零,但 OpenAI 拒絕設置單獨的運行時收費項目。根據工作負載的形態,總成本可能高于或低于 Anthropic 捆綁的模型。

OpenAI 明確說明了原因。他們在公告中指出,雖然托管代理 API 簡化了部署,但代價是限制代理運行的位置以及它們訪問敏感數據的方式。這是公開與 Anthropic、谷歌和微軟背道而馳。

4 各實驗室都同意應該有這一層,但他們對如何計費持不同的看法。

谷歌將 Vertex AI Agent Engine 列為完全托管的運行時,包括會話、內存、代碼執行和可觀測性,每一項都作為單獨的消費線計費,而不是單一的每小時費用。微軟提供的 Foundry Agent Service 則基于模型和工具的使用計費,對于 Code Interpreter 等工具有特定的會話計量,而不是整個平臺統一計費。亞馬遜云科技在 2 月份 宣布,將與 OpenAI 共同創建一個有狀態的運行時環境,未來幾個月通過 Bedrock 提供,同時 Bedrock AgentCore 將作為運行時原語層。

這些都是不同的定價模式。Anthropic 將計算、狀態和編排打包在一起,按每小時會話計費。谷歌則單獨計量組件,而微軟按模型和工具計量。亞馬遜云科技將在 OpenAI 運行時發布后增加另一個托管路徑。OpenAI 的官方答案則完全跳過了運行時計量。

這五家供應商一致認為這一層很重要,他們都想擁有它。他們存在分歧的地方是,該產品究竟是具備獨立計費系統的托管服務、一套收費的原語集合,還是由商業模式支撐的開源 SDK。這種分歧并非僵局,而是一種有意為之的戰略差異。

5 AI 中間件架構路線出現了分裂。

云基礎設施領域此前曾經出現過這種分化,而結果并非是哪一方被完全取代。Terraform 作為開源項目繼續存在,與 AWS CloudFormation 的托管服務并行發展。Kubernetes 同樣保持開源,并成為了事實上的行業標準,盡管亞馬遜云科技、谷歌和微軟都推出了托管的容器服務。在這兩種情況下,開源都沒有取代托管服務,托管服務也并未淘汰開源。它們之所以能夠共存,是因為它們服務于截然不同的用戶群體。

我們的經驗是,當一個供應商提供免費的開源軟件,其他供應商提供付費的托管軟件時,市場傾向于根據基礎設施偏好分化,而不是崩潰。想要托管便利性的團隊會轉向托管服務。想要控制權、可移植性或多云靈活性的團隊會轉向開源技術棧。這兩種模式都在云時代支撐著真實的業務運營。

獨立開發者銷售該層橫向版本的經濟模式開始發生變化。OpenAI 提供的免費原生模型框架,會給獨立框架帶來定價壓力,而且遠超任何付費托管服務。云計算的模式正在顯現,但正同時經歷著兩重壓縮。

6 這對希望填補空白的初創公司意味著什么?

我認為,初創企業的風險特征變得更加明確了。Sycamore 向 Coatue 和 Lightspeed 的推介重點是企業 AI 中的信任、治理與控制,并內置了多模型支持。這一推介方案在面對 Anthropic 主導的路線和 OpenAI 的開源路線時都具有充分的說服力,因為它瞄準的是那些非常希望避免依賴任何單一實驗室的買家。在此背景下,Sycamore 看上去并不像是那種容易受到沖擊的典型模式。

在我看來,這些發布所凸顯的典型模式是“橫向編排框架”。如今,LangChain、CrewAI 和 VoltAgent 正在與他們所依賴的實驗室展開更直接的競爭,他們使用這些實驗的模型,但后者推出了免費、模型原生的控制層框架。當相關供應商免費提供一個與其前沿模型高度契合的開源控制層時,那些主張“模型無關”框架的論點(即靈活性優于供應商鎖定)就變得更難站住腳了。那些仍在向企業買家推銷橫向“模型無關”編排層的廠商,未來恐怕將面臨更艱難的談判。

銷售付費托管平臺的初創公司則面臨來自 Anthropic、谷歌和微軟的壓力。在我看來,從戰略上講,應對這兩種壓力的方法似乎是一樣的:在治理、合規、垂直深度或多模型控制方面實現差異化,或者在價格上與免費服務和打包服務展開競爭。

7 這對自建團隊意味著什么?

在“自建與采購”的權衡中,出現了兩個新的參考點。希望采用捆綁式基礎設施的團隊,可以將內部系統與 Anthropic Managed Agents 進行對比——后者的定價為每會話小時 8 美分外加 Token 費用。而已經擁有自有基礎設施的團隊,則可以將 OpenAI SDK 作為參照,該方案除需支付沙箱和存儲服務提供商的費用外,不再額外收取第一方運行時費用。至于哪一個更具參考價值因團隊而異。在一個月前,這兩個選項都還不存在。

對于仍處于原型階段的團隊來說,一夜之間,便無法把從頭開始構建腳手架難度大當理由了。過去被認為是差異化工程的基礎性工作,現在可以通過 API 或免費的 SDK 獲得。對于已經投入生產應用的團隊而言,可能內部系統仍然更適合當前的工作負載。但現在,其維護團隊正和四個前沿實驗室在他們進行著積極投資的領域里展開競爭,這將使這項工作進展變慢,地位變低,招聘難度變大。

自建仍然是一個有效的選擇,不過需要在工作負載適應性和團隊可持續性兩個基準上都勝出,而不是一項都不行。

8 接下來會發生什么?

控制層本應成為護城河。在十八個月的時間里,大多數交付生產級代理的團隊都自己構建或組裝了自己的控制層,這就是差異化。前沿實驗室集體決定不出售模型訪問權,看著別人捕獲其上的邊際利潤,但他們在如何自己獲取利潤上存在分歧。其中三個實驗室以某種形式對運行時收費。有一個實驗室則免費提供控制層,轉而押注于模型忠誠度。

值得關注的問題是哪個商業模式會勝出,或者市場是否能夠都支撐。OpenAI 的賭注是,一個免費的、開源的、模型原生的控制層會比付費的托管運行時帶來更多的模型消費,而 Bedrock 合作伙伴關系則涵蓋了希望采用托管服務的企業。Anthropic 則押注于付費的完全托管版本,而谷歌和微軟則押注于將定價明確的組件整合到更廣泛的平臺中。這些可能適用于不同的模式。那些在場外觀望的初創公司需要先弄清楚市場的主流趨勢,再制定差異化戰略。敬請關注,后續我將繼續為你解讀“控制層”和“運行時”這兩個不斷演進的概念。

https://thenewstack.io/ai-agent-harness-pricing-split

聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日本政府圖謀出口二手武器,不斷突破“紅線”引擔憂

日本政府圖謀出口二手武器,不斷突破“紅線”引擔憂

參考消息
2026-04-26 20:00:08
西班牙反了!法國反了!印度也要反,全世界都看清特朗普最怕啥

西班牙反了!法國反了!印度也要反,全世界都看清特朗普最怕啥

杰絲聊古今
2026-04-07 11:57:43
國內將逐步淘汰白內障手術?做完人就瞎了?醫生告訴你真相

國內將逐步淘汰白內障手術?做完人就瞎了?醫生告訴你真相

健康之光
2026-03-12 13:55:08
女生主動起來有多黏人?網友:這些女的太開放了

女生主動起來有多黏人?網友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
白嫖DeepSeek V4 Pro!免費無限用,還能接入Claude-Code,星哥親測教程

白嫖DeepSeek V4 Pro!免費無限用,還能接入Claude-Code,星哥親測教程

星哥玩云
2026-04-27 16:30:45
重慶這些區縣真要合并?扒完真相,別再信“主城21區大變16區”了

重慶這些區縣真要合并?扒完真相,別再信“主城21區大變16區”了

荷蘭豆愛健康
2026-04-28 00:35:48
竇靖童和宋妍霏巴黎被偶遇,留著寸頭很帥氣,兩人在一起很久了

竇靖童和宋妍霏巴黎被偶遇,留著寸頭很帥氣,兩人在一起很久了

老好人的憤怒
2026-04-27 08:07:21
楊樂樂后悔全職帶娃落淚,在婚姻中不快樂,汪涵:為什么要和我比

楊樂樂后悔全職帶娃落淚,在婚姻中不快樂,汪涵:為什么要和我比

八斗小先生
2026-04-23 10:25:23
堪比光刻機?半導體真正的“卡脖子”材料是這12種!

堪比光刻機?半導體真正的“卡脖子”材料是這12種!

Thurman在昆明
2026-04-26 10:06:56
哎!居然是跟腱斷裂!

哎!居然是跟腱斷裂!!

柚子說球
2026-04-27 12:34:08
AI跪了:圍棋的上帝,是300年前的古人!

AI跪了:圍棋的上帝,是300年前的古人!

我不叫阿哏
2026-04-27 12:33:03
直屏剛火 蘋果帶頭重返四曲屏時代 網友:潮流果真是一個輪回

直屏剛火 蘋果帶頭重返四曲屏時代 網友:潮流果真是一個輪回

快科技
2026-04-25 19:54:03
爺爺4套學區房全給堂弟,我八十大壽回:護照已剪祝你們吃得開心

爺爺4套學區房全給堂弟,我八十大壽回:護照已剪祝你們吃得開心

蘭姐說故事
2026-03-30 10:30:15
12-13,奧沙利文遭絕殺!13-11,吳宜澤爆冷塞爾比!世錦賽神劇本

12-13,奧沙利文遭絕殺!13-11,吳宜澤爆冷塞爾比!世錦賽神劇本

大秦壁虎白話體育
2026-04-28 00:07:17
18倍牛股一季度凈利增長11倍,這個產業也景氣度高

18倍牛股一季度凈利增長11倍,這個產業也景氣度高

每日經濟新聞
2026-04-27 22:37:49
性與愛,最怕過期。

性與愛,最怕過期。

劉娜
2026-04-27 08:20:15
85億敗光!王中磊街頭吃湯圓,兒子卻在美揮霍

85億敗光!王中磊街頭吃湯圓,兒子卻在美揮霍

鄉野小珥
2026-04-28 02:02:38
莫氏清暉園店又即將開業啦!

莫氏清暉園店又即將開業啦!

廣州正嘢
2026-04-27 15:32:26
交管12123 “綠拇指” 火了!連續3年無扣分,交強險低至475元 +免審

交管12123 “綠拇指” 火了!連續3年無扣分,交強險低至475元 +免審

趣味萌寵的日常
2026-04-25 20:08:00
深圳一網紅餐廳十余家門店突然撤店,商家無法聯系

深圳一網紅餐廳十余家門店突然撤店,商家無法聯系

深圳晚報
2026-04-27 12:28:02
2026-04-28 02:48:49
InfoQ incentive-icons
InfoQ
有內容的技術社區媒體
12309文章數 51863關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

時尚
藝術
本地
游戲
軍事航空

絲巾的10種系法,愛美的女人必看

藝術要聞

他的油畫筆觸粗獷又細膩,透著一種不可言說的美!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

《AC黑旗》重制版新增專屬劇情!原版編劇親自執筆

軍事要聞

伊朗外長折返伊斯蘭堡內情披露

無障礙瀏覽 進入關懷版