![]()
2026年,中國(guó)AI云市場(chǎng)上同時(shí)出現(xiàn)了兩個(gè)“第一”。但兩個(gè)“第一”指向的,是截然不同的問(wèn)題。
Omdia 5月19日發(fā)布的報(bào)告給出了第一個(gè)答案:2025年中國(guó)AI云市場(chǎng)總規(guī)模567億元,阿里云以38.1%的收入份額位居第一,超過(guò)第二至第四名的總和,在AI IaaS和MaaS兩個(gè)細(xì)分領(lǐng)域均居領(lǐng)先位置。
但在Omdia發(fā)布數(shù)據(jù)的前一周,IDC公布了另一組數(shù)字。IDC數(shù)據(jù)顯示,2025年中國(guó)公有云大模型調(diào)用量同比增長(zhǎng)16倍,達(dá)到1944萬(wàn)億Token。在這張榜單上,火山引擎以49.5%的調(diào)用量份額、40%以上的營(yíng)收份額,站在了第一位。
![]()
Omdia說(shuō)的是“誰(shuí)賣(mài)得多”,IDC問(wèn)的是“誰(shuí)被用得多”。兩份報(bào)告,兩把尺子,量的是不同維度的東西,但共同印證了2026年中國(guó)云市場(chǎng)的繁榮,也精準(zhǔn)映出兩家公司不同的戰(zhàn)略落點(diǎn),阿里云在收入體量上守住了既有優(yōu)勢(shì),火山引擎則在調(diào)用規(guī)模上建立了自己的坐標(biāo),并試圖把量的積累轉(zhuǎn)化為平臺(tái)層更難被替代的價(jià)值。
5月11日,火山引擎發(fā)布了國(guó)內(nèi)首個(gè)Agent Plan。套餐里,GLM-5.1和Kimi-K2.6與火山引擎自研模型并排陳列,統(tǒng)一使用AFP(Agent Flow Pricing)計(jì)費(fèi),月費(fèi)40元起。一家占據(jù)中國(guó)公有云MaaS市場(chǎng)近半調(diào)用量的公司,主動(dòng)把競(jìng)爭(zhēng)對(duì)手的產(chǎn)品放進(jìn)了自家貨架。
目前,主流模型之間的能力差距,已經(jīng)收窄到大多數(shù)企業(yè)用戶(hù)難以在實(shí)際業(yè)務(wù)中感知的程度。Token單價(jià)持續(xù)壓縮,用戶(hù)切換供應(yīng)商的成本趨近于零。在這樣的市場(chǎng)條件下,“最強(qiáng)模型”的敘事價(jià)值在加速衰減,而“最全平臺(tái)”的戰(zhàn)略?xún)?yōu)先級(jí)隨之上升。
Agent Plan是這條邏輯走到今天的產(chǎn)品化表達(dá),而非起點(diǎn)。IDC的數(shù)據(jù)從規(guī)模維度坐實(shí)了這個(gè)判斷,2025年中國(guó)公有云MaaS調(diào)用量同比增長(zhǎng)16倍。在一個(gè)量級(jí)擴(kuò)張如此劇烈的市場(chǎng)里,決定天花板的,或許從來(lái)都不是模型能力的絕對(duì)高度。
低價(jià)Token,先把規(guī)模跑出來(lái)
火山引擎拿下MaaS近半市場(chǎng)份額,靠的不只是模型能力,其比同行更早完成規(guī)模積累,并將規(guī)模轉(zhuǎn)化為可持續(xù)的工程優(yōu)勢(shì)。這套邏輯的起點(diǎn),是一個(gè)相對(duì)清晰的戰(zhàn)略判斷——公有云存量市場(chǎng)的格局已經(jīng)固化,新興的MaaS業(yè)務(wù),才是仍有空間建立差異化的方向。
2020年,火山引擎正式對(duì)外推出。譚待接手時(shí),傳統(tǒng)IaaS領(lǐng)域早已是一場(chǎng)拼客戶(hù)粘性、拼多年運(yùn)營(yíng)積累的消耗戰(zhàn),后來(lái)者幾乎沒(méi)有逆轉(zhuǎn)空間。MaaS因此成了火山引擎最有可能實(shí)現(xiàn)突破的方向,先以模型服務(wù)建立入口,再帶動(dòng)IaaS和PaaS層的協(xié)同增長(zhǎng)。
這個(gè)邏輯在海外有現(xiàn)成參照。Azure出售OpenAI模型API,只是鏈條的第一環(huán)。企業(yè)客戶(hù)一旦接入大模型,往往會(huì)繼續(xù)采購(gòu)檢索、數(shù)據(jù)庫(kù)等配套云服務(wù),整體支出隨之抬升。
2020年底,他隨字節(jié)跳動(dòng)對(duì)“幺零貳四”的收購(gòu)加入,最初主導(dǎo)火山引擎技術(shù)架構(gòu),此前深耕搜索引擎領(lǐng)域。相比“提供最聰明的答案”,搜索的競(jìng)爭(zhēng)邏輯更傾向于“讓用戶(hù)以最低成本、最高效率找到結(jié)果”。這個(gè)基因直接塑造了他對(duì)MaaS的理解方式,即Token是需要以最高效率送達(dá)用戶(hù)的生產(chǎn)資料。
據(jù)《晚點(diǎn)LatePost》報(bào)道,火山引擎在2025年內(nèi)兩度上調(diào)MaaS收入目標(biāo),Seed 2.0和Seedance 2.0發(fā)布后再次上調(diào),原定超百億的2026年目標(biāo)隨之刷新。資源的集中方向與調(diào)整節(jié)奏,始終指向同一個(gè)優(yōu)先級(jí)。
![]()
譚待曾明確表示,Token使用量高速增長(zhǎng)的核心驅(qū)動(dòng)力,是AI視頻創(chuàng)作的爆發(fā)與AI智能體的加速普及,而非通用語(yǔ)言模型能力的整體提升。這個(gè)判斷,在豆包大模型的市場(chǎng)表現(xiàn)與其基準(zhǔn)測(cè)試能力之間存在落差的背景下,多了一層解釋力。
在視頻生成這一Token消耗密度最高的場(chǎng)景,字節(jié)跳動(dòng)目前處于市場(chǎng)領(lǐng)先地位。據(jù)AI普瑞斯報(bào)道,按日均算力消耗占比測(cè)算,Seedance已占據(jù)超過(guò)80%的市場(chǎng)份額,可靈緊隨其后約占14%,萬(wàn)相約占4%。也就是說(shuō),當(dāng)下的AI視頻生成市場(chǎng),用戶(hù)每發(fā)起10次生成請(qǐng)求,超過(guò)8次流向Seedance。
AI智能體場(chǎng)景同樣是Token消耗的放大器,一次Agent任務(wù)通常包含多輪推理、工具調(diào)用與任務(wù)執(zhí)行,單次消耗量遠(yuǎn)高于普通對(duì)話。這個(gè)場(chǎng)景結(jié)構(gòu),構(gòu)成了理解火山引擎市場(chǎng)份額的第一個(gè)關(guān)鍵前提,它的調(diào)用量領(lǐng)先,很大程度上建立在特定場(chǎng)景的需求密度上。
而價(jià)格機(jī)制則是火山引擎規(guī)模積累的杠桿。去年5月,火山引擎把豆包大模型價(jià)格打入“厘時(shí)代”,豆包1.6首創(chuàng)依據(jù)輸入長(zhǎng)度區(qū)間定價(jià),綜合成本比同級(jí)別模型降低63%。譚待事后的解釋只有一句話:能靠技術(shù)把成本降下來(lái),就決定一次降徹底。
支撐這次降價(jià)的技術(shù)底座,是火山引擎較早大規(guī)模應(yīng)用的兩項(xiàng)關(guān)鍵工程優(yōu)化——PD分離與KV Cache。可以用一個(gè)更直白的類(lèi)比理解它們的作用,PD分離相當(dāng)于把“讀題”和“答題”兩個(gè)動(dòng)作拆給不同的工位分別處理,讓每個(gè)環(huán)節(jié)匹配更合適的算力資源;KV Cache則相當(dāng)于給推理過(guò)程配一本“草稿本”,緩存已經(jīng)算過(guò)的歷史狀態(tài),避免每次生成新內(nèi)容都從頭重算,兩項(xiàng)技術(shù)的共同目標(biāo),是降低單次推理的顯存消耗與計(jì)算成本。
這兩項(xiàng)技術(shù)的收益,高度依賴(lài)規(guī)模。小規(guī)模調(diào)用時(shí),維護(hù)復(fù)雜緩存和調(diào)度系統(tǒng)本身也有成本,可能抵消節(jié)省下來(lái)的算力;規(guī)模越大,緩存命中率越高,工程優(yōu)化的收益才越顯著。譚待曾用一個(gè)例子描述這種放大效應(yīng):1萬(wàn)臺(tái)服務(wù)器利用率優(yōu)化一個(gè)點(diǎn),與100萬(wàn)臺(tái)服務(wù)器優(yōu)化同樣一個(gè)點(diǎn),收益相差100倍。
當(dāng)PD分離、KV Cache等技術(shù)在行業(yè)內(nèi)逐步擴(kuò)散,Token價(jià)格趨向均一,這道門(mén)檻才真正顯現(xiàn)。規(guī)模不足的跟隨者對(duì)標(biāo)低價(jià),往往承受更大的成本壓力。調(diào)用規(guī)模更大的平臺(tái),成本空間也更充裕,在價(jià)格競(jìng)爭(zhēng)中也具備更長(zhǎng)的持續(xù)性。
2025年下半年,是去年競(jìng)爭(zhēng)最激烈的階段。競(jìng)爭(zhēng)對(duì)手密集入場(chǎng),但火山引擎的調(diào)用量份額從上半年的49.2%進(jìn)一步升至全年的49.5%。份額沒(méi)有下降,反而小幅抬升。這個(gè)數(shù)字,部分印證了規(guī)模優(yōu)勢(shì)在當(dāng)前階段的防御價(jià)值。
模型商品化之后,平臺(tái)開(kāi)始定價(jià)
Agent Plan的發(fā)布,是一個(gè)信號(hào)。它標(biāo)志著火山引擎在產(chǎn)品層面完成了從模型分發(fā)商,向基礎(chǔ)設(shè)施提供方的重心轉(zhuǎn)移。
![]()
在2026年以前,MaaS的基本商業(yè)形態(tài)只有一種:賣(mài)Token接口。企業(yè)按調(diào)用量付費(fèi),模型是核心購(gòu)買(mǎi)對(duì)象,平臺(tái)只是管道。Agent Plan改變了這個(gè)結(jié)構(gòu)的底層邏輯,將自研Seed系列模型與GLM-5.1、Kimi-K2.6等第三方模型,連同聯(lián)網(wǎng)搜索等Harness工具打包,以AFP統(tǒng)一計(jì)費(fèi)體系出售。計(jì)費(fèi)單位從“消耗多少Token”遷移到“完成多少任務(wù)”。
Harness,是這次發(fā)布中被忽視的關(guān)鍵詞。MaaS提供穩(wěn)定的模型能力,Harness負(fù)責(zé)把推理變成可約束、可追蹤、可持續(xù)運(yùn)行的工作流。兩者分工不同,但目標(biāo)卻一致,讓Agent在生產(chǎn)環(huán)境里真正可用。企業(yè)的Agent任務(wù)通過(guò)AFP統(tǒng)一計(jì)費(fèi)平臺(tái)運(yùn)行,工作流日志、用量報(bào)表和審計(jì)記錄全部在同一體系內(nèi)生成時(shí),用戶(hù)就不得不重點(diǎn)考慮遷移成本。
據(jù)《晚點(diǎn)LatePost》報(bào)道,火山引擎過(guò)去幾年的產(chǎn)品演進(jìn),在強(qiáng)化MaaS競(jìng)爭(zhēng)力的同時(shí),也在逐步把大模型服務(wù)擴(kuò)展為覆蓋Agent開(kāi)發(fā)與運(yùn)營(yíng)的基礎(chǔ)設(shè)施。譚待此前的描述提供了一個(gè)參照:以前寫(xiě)代碼,本質(zhì)上是在寫(xiě)if-else定義工作流;現(xiàn)在基于模型開(kāi)發(fā)Agent,流程規(guī)劃、任務(wù)拆解、創(chuàng)建子Agent等環(huán)節(jié),越來(lái)越多地交給模型自己完成。
Agent Plan把競(jìng)品模型納入自家套餐,一種解讀是火山引擎判斷自身的基礎(chǔ)設(shè)施價(jià)值,已經(jīng)高于單一模型的產(chǎn)品價(jià)值,可以從第三方模型的分發(fā)中獲取渠道收益,邏輯類(lèi)似AWS Marketplace允許第三方SaaS軟件上架,平臺(tái)的核心資產(chǎn)是用戶(hù)在平臺(tái)內(nèi)積累的工作流數(shù)據(jù)與賬單綁定深度。
這里有一組方向相反的力量在同時(shí)運(yùn)作,把競(jìng)品模型納入套餐,降低了用戶(hù)在平臺(tái)內(nèi)切換模型的摩擦,是一種開(kāi)放姿態(tài);AFP統(tǒng)一計(jì)費(fèi)的設(shè)計(jì)目標(biāo),恰好相反,它在提高用戶(hù)離開(kāi)這個(gè)平臺(tái)的整體成本。開(kāi)放性吸引用戶(hù)進(jìn)來(lái),賬單綁定讓用戶(hù)留下。哪個(gè)目標(biāo)最終占主導(dǎo),取決于企業(yè)客戶(hù)對(duì)平臺(tái)的依賴(lài)深度。而這個(gè)深度,只有當(dāng)真實(shí)的Agent工作流被部署進(jìn)生產(chǎn)環(huán)境之后,才能被測(cè)量。
目前檢驗(yàn)這個(gè)判斷的關(guān)鍵變量只有一個(gè),那就是第三方模型在Agent Plan總調(diào)用量中的占比,是否會(huì)隨時(shí)間持續(xù)下降。如果用戶(hù)最終向Seed系列集中遷移,平臺(tái)化敘事成立;如果比例穩(wěn)定甚至上升,則更接近一種現(xiàn)實(shí)主義的能力補(bǔ)位。答案需要時(shí)間。
支撐平臺(tái)化轉(zhuǎn)型的,還有組織結(jié)構(gòu)的同步收斂。2025年,字節(jié)跳動(dòng)AI研發(fā)團(tuán)隊(duì)經(jīng)歷了三次整合,AI Lab整體并入Seed團(tuán)隊(duì),視覺(jué)生成團(tuán)隊(duì)與豆包技術(shù)部的管理權(quán)限統(tǒng)一納入Seed體系,從分散研發(fā)走向統(tǒng)一驅(qū)動(dòng)。這不只是研發(fā)效率的整合。只有統(tǒng)一調(diào)度的研發(fā)體系,才能為MaaS平臺(tái)提供穩(wěn)定、可預(yù)期的模型迭代節(jié)奏。
火山引擎已經(jīng)回答了MaaS第一階段的核心問(wèn)題,即勝出不需要最強(qiáng)的模型,需要的是最低的調(diào)用門(mén)檻、最徹底的價(jià)格策略,以及比對(duì)手更早完成規(guī)模積累。但規(guī)模優(yōu)勢(shì)只有被轉(zhuǎn)化為平臺(tái)層的綁定深度,才能延續(xù)到下一階段的競(jìng)爭(zhēng)。而平臺(tái)綁定的前提,是企業(yè)客戶(hù)真正把Agent工作流跑在這里,這要求工具鏈的完整度和模型能力在關(guān)鍵場(chǎng)景上足夠可靠。
寫(xiě)在最后
從Token平臺(tái)到Agent基礎(chǔ)設(shè)施,這條演進(jìn)路徑在海外有輪廓可循。Anthropic與多家云廠商合作,OpenAI與AWS合作將模型封裝進(jìn)云平臺(tái)的原生Agent環(huán)境,目標(biāo)都是讓企業(yè)能在云平臺(tái)內(nèi)完成生產(chǎn)級(jí)Agent的開(kāi)發(fā)與運(yùn)營(yíng)。IDC報(bào)告顯示,MaaS的商業(yè)邊界,正在從“按量計(jì)費(fèi)的推理服務(wù)”擴(kuò)展為“企業(yè)AI工作流的運(yùn)營(yíng)底座”。越來(lái)越多的大客戶(hù)與平臺(tái)的合作,開(kāi)始向業(yè)務(wù)流程的深處延伸,而不只停留在賬單層面。
不過(guò),IDC的預(yù)測(cè)給出了一個(gè)判斷,2026年中國(guó)MaaS市場(chǎng)Token消耗量將達(dá)到40000萬(wàn)億,對(duì)應(yīng)營(yíng)收約186億元人民幣。消耗量在一年內(nèi)擴(kuò)張約21倍,營(yíng)收增幅遠(yuǎn)低于量的增幅。這意味著Token的平均單價(jià)將進(jìn)一步壓縮。
量增與價(jià)降同步發(fā)生,背后是行業(yè)在當(dāng)前階段的共同選擇。先把規(guī)模做出來(lái)。但低價(jià)策略有一條財(cái)務(wù)底線,算力成本的下降速度,必須能跑贏Token單價(jià)的下降速度。這個(gè)問(wèn)題的答案,懸在英偉達(dá)的供貨節(jié)奏和國(guó)產(chǎn)替代芯片的成熟進(jìn)度之間。兩者目前都難以精確預(yù)判。
譚待說(shuō)過(guò),MaaS這件事還太早,“馬拉松才跑500米,別取得一點(diǎn)點(diǎn)小成績(jī)就滿(mǎn)意了。”這句話在2025年是內(nèi)部激勵(lì),在今年5月讀來(lái),多了一層別的含義,把競(jìng)品模型打包進(jìn)自家套餐的決定,是一家已在規(guī)模競(jìng)爭(zhēng)中建立優(yōu)勢(shì)的公司,對(duì)下半程規(guī)則可能改變的提前布局。這個(gè)判斷是否正確,要等企業(yè)客戶(hù)真正跑起生產(chǎn)級(jí)Agent之后才能驗(yàn)證。
“夠用”贏得了第一階段。能否用同樣的邏輯贏得Agent-as-a-Service的競(jìng)爭(zhēng),取決于企業(yè)級(jí)Agent場(chǎng)景對(duì)模型能力的實(shí)際容忍邊界在哪里,才是下半程真正的問(wèn)題。
*題圖及文中配圖來(lái)源于網(wǎng)絡(luò)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.