網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

兩個第一，兩場戰(zhàn)爭，火山引擎依然是阿里云的最大變量

2026-05-21 18:05:20　來源: 鈦媒體APP

北京舉報

分享至

文 | 強調(diào)Next

5月20日，阿里云發(fā)布新一代旗艦?zāi)Ｐ蚎wen3.7-Max。當(dāng)晚蔡崇信和吳泳銘發(fā)布股東信表態(tài)，再次強調(diào)阿里云的戰(zhàn)略地位。

兩周前，火山引擎剛剛披露一組數(shù)字：根據(jù)IDC報告 2025年全年，火山引擎在中國企業(yè)級MaaS市場的Token調(diào)用量份額達到49.5%，阿里云28%，百度10%。

阿里云的模型更強了。但在調(diào)用量這張榜單上，它還落在火山引擎后面將近二十個百分點。

而就在Qwen3.7-Max發(fā)布會的前一天，阿里云高調(diào)發(fā)布了另一個行業(yè)榜單。Omdia統(tǒng)計的包含IaaS、PaaS、MaaS全鏈條的AI云整體收入，阿里云以35.8%排在第一，火山引擎14.8%。

兩張榜單，兩個第一，兩種敘事，足以窺見雙方的競爭烈度。兩張榜單背后，誰在建真正的護城河，還沒有答案。

01.評測的游戲，已經(jīng)不只是跑分

昨天的發(fā)布會上，阿里云列出的評測清單比以往長了很多。除了GPQA、數(shù)學(xué)、代碼這些通用項，還出現(xiàn)了SWE-Pro、MCP-Mark、Qwen SVG、Qwen World Bench、Qwenclaw、ClawEval等一批更偏Agent場景的測試。

大模型行業(yè)跑了三年基準(zhǔn)測試，MMLU、HumanEval、Arena已經(jīng)被磨得快沒有區(qū)分度了，回答不了“誰更強”這個問題。

于是新一輪競爭轉(zhuǎn)移到了出題權(quán)上。Agent任務(wù)的評測更復(fù)雜，變量更多：模型本身的能力、工具接口質(zhì)量、任務(wù)拆解方式、評分規(guī)則，每一個環(huán)節(jié)都能影響最終結(jié)果。這給了有研發(fā)余量的大廠足夠的操作空間，他們把自己擅長的任務(wù)形態(tài)寫進評測框架，在新賽道上先占有利位置。

OpenAI有自己的Evals，Anthropic有Claude工程任務(wù)集，Google有AIME和代碼競賽系列。阿里云這次密集推出Qwen前綴的專項測試，邏輯一樣。火山引擎的豆包大模型2.0在今年2月密集更新了多模態(tài)能力評測維度，重點強調(diào)OS Agent和復(fù)雜指令遵循，刻意回避了與Qwen正面競爭的賽道選擇。

各家都在用自己擅長的題目給自己打分。阿里出的題阿里能贏，火山出的題火山能贏，有參考意義，但不大。

旗艦?zāi)Ｐ椭g的能力差距還在快速收窄，benchmark的邊際解釋力也在同步下降。一個模型在某張榜單領(lǐng)先0.5分，未必能轉(zhuǎn)化為真實業(yè)務(wù)中的穩(wěn)定優(yōu)勢。企業(yè)客戶最終關(guān)心的不是誰拿了第一，而是模型能不能持續(xù)完成任務(wù)、出錯后能不能自己改正、成本能不能算清楚。

Agent競爭的重心正在從“回答質(zhì)量”遷移到“執(zhí)行可靠性”。這是Qwen3.7-Max這次想證明的東西，但僅靠發(fā)布會數(shù)字還不夠。

02.開發(fā)者入口：三條截然不同的路

阿里云強調(diào)，Qwen3.7-Max具備跨框架泛化能力，并點名支持Claude Code、OpenClaw、Qwen Code等工具。

Claude Code是Anthropic今年增長最快的產(chǎn)品線之一，用戶基數(shù)和粘性越來越高。

阿里云的切入方式是把工具層和模型層顯式拆開。開發(fā)者繼續(xù)用Claude Code，但底層調(diào)用換成Qwen。

阿里云的如意算盤是，讓Anthropic做生態(tài)，自己做替換。這個邏輯能不能跑通，取決于Anthropic愿不愿意配合，而Anthropic現(xiàn)在正在把Claude和Claude Code綁得越來越緊。

火山引擎走的是另一條路。2026年3月，它正式發(fā)布ArkClaw。這是一款云端SaaS版的OpenClaw托管服務(wù)。

字節(jié)的策略是不讓開發(fā)者折騰本地環(huán)境、配API、裝Python，在火山方舟控制臺開通會員、點“立即創(chuàng)建”，兩分鐘內(nèi)一個云端OpenClaw實例就跑起來了。ArkClaw深度綁定飛書生態(tài)，支持飛書應(yīng)用市場一鍵安裝，聊天窗口里直接@智能體就能訂會議室、批量生成文檔、管理多維表格。

DeepSeek也在同一時間節(jié)點出手。近日DeepSeek發(fā)布了Harness產(chǎn)品經(jīng)理和Harness研發(fā)工程師兩個新崗位，崗位 JD直接寫明：“除模型本身以外，所有工作都屬于Harness的范疇”，相關(guān)人員將參與“DeepSeek桌面端Agent產(chǎn)品”的全過程，并“定義DeepSeek對Harness的理解”。更早的3月，DeepSeek曾一口氣放出17個Agent方向崗位，要求候選人“深度使用過Claude Code、OpenClaw、Manus等知名Agent”。從大量招聘到組建專項團隊，DeepSeek從“只做模型”到“也做上層產(chǎn)品”的轉(zhuǎn)變，現(xiàn)在已經(jīng)夠明確了。

阿里云盯住全球開發(fā)者工具鏈里的模型替換空間，火山引擎把Agent能力嵌進中國企業(yè)最常用的辦公IM，DeepSeek則直接做桌面端Agent產(chǎn)品，正面和Claude Code競爭。三家的目標(biāo)客群有交叉，核心打法差異很大。

這三種路徑各有壁壘，也各有弱點。ArkClaw的優(yōu)勢在低門檻和飛書生態(tài)的自然滲透，弱點是字節(jié)的B端客戶以前沿開發(fā)者和AI創(chuàng)業(yè)公司為主，進入金融、制造、政府等重型企業(yè)客戶的能力還有限，也很難像阿里云那樣把模型服務(wù)和存儲、數(shù)據(jù)庫、安全等周邊云產(chǎn)品打包銷售。阿里云的全棧布局讓它在企業(yè)客戶里有更強的話語權(quán)，但這也意味著銷售周期更長、客制化交付更重。DeepSeek的強項是模型本身的技術(shù)聲譽，但產(chǎn)品、運營、用戶留存，這些都不是做模型的公司天然擅長的事。

有開發(fā)者坦言，即便阿里推出了百煉平臺也沒有遷移的打算。“遷移本身就是成本。除非千問的能力強到明顯碾壓其他模型，或者完全免費，我才會考慮遷移。”

Anthropic已經(jīng)開始把Claude模型和Claude Code綁定得更深：更穩(wěn)定的項目級上下文、更精細的工具調(diào)用協(xié)議，以及一些設(shè)計上只有Claude才能完整激活的能力。工具層和模型層一旦重新耦合，第三方模型即便能接入，也只是“能跑”，而不是“好用”。

03.模型強不等于云收入強

發(fā)布Qwen3.7-Max的同一天，阿里巴巴集團主席蔡崇信和CEO吳泳銘聯(lián)合發(fā)布致股東信，措辭罕見地直接：“AI業(yè)務(wù)已跨越初期投入階段，正式邁入商業(yè)化回報周期。”信中還寫道，阿里正在加大對全棧AI能力的投資，要“打造更強大的MaaS產(chǎn)品，來更高效地實現(xiàn)模型與應(yīng)用的連接”。

這是阿里云最想講的資本故事：模型越強，云業(yè)務(wù)越受益。

阿里的布局從云基礎(chǔ)設(shè)施、大模型、企業(yè)客戶、電商和辦公場景、芯片到服務(wù)器全覆蓋，是國內(nèi)云廠商中最接近真正意義上“AI全棧”的。去年11月，阿里啟動“百煉戰(zhàn)役”，目標(biāo)是短期內(nèi)將百煉Token調(diào)用規(guī)模提升三倍以上；今年3月，集團CEO吳泳銘直接帶隊成立Alibaba Token Hub事業(yè)群。市場大體上認(rèn)可這個方向。

但增長數(shù)字并不意味著增長質(zhì)量。

回到開頭那兩張榜單。IDC按Token調(diào)用量統(tǒng)計，火山引擎2025年全年占49.5%，阿里云28%；Omdia按全鏈條AI云收入統(tǒng)計，阿里云35.8%，火山引擎14.8%。這種“雙第一”格局的背后，是兩套完全不同的商業(yè)邏輯。

有數(shù)據(jù)顯示，按Token計費的MaaS服務(wù)收入，目前僅占整個AI云市場規(guī)模的不到1%。Token調(diào)用量增速驚人，但它還沒有成為真正的收入大頭。這意味著，火山引擎“MaaS Token調(diào)用量第一”的標(biāo)簽，和“AI云收入第一”之間，還有相當(dāng)長的距離需要穿越。同樣，阿里云“全棧AI云收入領(lǐng)先”，也不能直接轉(zhuǎn)譯為Qwen的模型價值被充分兌現(xiàn)。

一個企業(yè)選擇阿里云的AI服務(wù)，可能是因為Qwen能力夠強，也可能是因為價格低、合規(guī)要求、或者原本就在阿里云采購體系里。三種來源，只有第一種值得講故事，后兩種不過是傳統(tǒng)云業(yè)務(wù)的收入換了個AI的殼。阿里云目前沒有披露，也沒有辦法輕松披露，這三類收入各占幾成。

AI云業(yè)務(wù)最危險的一種形態(tài)是：增長數(shù)字好看，但質(zhì)量不扎實。試用量大、留存少；調(diào)用量漲、毛利被GPU成本吃掉；項目簽了不少，多數(shù)是重定制交付，規(guī)模化復(fù)制難。這種情況下，Qwen再強，也只是幫阿里云多賣了一些算力，并沒有真正建立模型層的護城河。

這個問題對火山引擎同樣存在。Token調(diào)用量不一定轉(zhuǎn)化出高質(zhì)量的企業(yè)級收入。據(jù)媒體報道，阿里云的一線銷售直言，2024年以后，火山引擎對阿里云的威脅最大，雙方經(jīng)常激烈爭奪同一個客戶。但爭奪的是哪類客戶，是利潤薄、易流失的AI創(chuàng)業(yè)公司，還是金融、制造這類黏性高、采購周期長的企業(yè)客戶？兩者的含金量差距很大。

百度是另一個參照系。它曾是AI公有云服務(wù)市場的連續(xù)多年第一，但正在悄悄轉(zhuǎn)換策略。百度智能云今年北京機場的廣告從“AI公有云市場份額領(lǐng)先”改成了“中國云廠商大模型市場項目數(shù)量&金額中標(biāo)王“。這隱含的信息是：央國企客戶才是百度云的舒適區(qū)，MaaS的硬碰硬已經(jīng)不是它的主戰(zhàn)場。

有質(zhì)量的AI云收入特征應(yīng)該是：客戶持續(xù)調(diào)用、使用深度遞增、遷移成本隨時間上升、單位成本隨規(guī)模下降，并且模型能力能帶動存儲、數(shù)據(jù)庫、安全、數(shù)據(jù)治理等周邊云服務(wù)協(xié)同增長。

這條鏈路，幾家AI云廠商目前都還沒有在財報層面講清楚。

04.誰在建真正的護城河

Qwen3.7-Max發(fā)布后，外界還會繼續(xù)比較它和Claude、GPT、DeepSeek誰更強，但結(jié)果的重要性會下降。

Agent時代的競爭，已經(jīng)不是單純的模型能力競賽。模型能力是基礎(chǔ)，評測權(quán)決定話語權(quán)，開發(fā)者入口決定調(diào)用權(quán)，云基礎(chǔ)設(shè)施決定交付能力，收入質(zhì)量決定商業(yè)價值。

從這個視角來看，中國AI云形成了大致四種路徑。

火山引擎的路徑是用豆包App的C端海量用戶打磨B端能力，用極致價格和低門檻工具快速跑量，把“Token調(diào)用量第一”建立成認(rèn)知壁壘，再從調(diào)用量反推企業(yè)深度合作。這條路的風(fēng)險是，客戶結(jié)構(gòu)偏淺，一旦有更低價的競爭者出現(xiàn)，切換成本不高。Token第一的標(biāo)簽，護城河還是流量泡沫，現(xiàn)在還說不清楚。

阿里云的路徑是用模型能力爭奪技術(shù)話語權(quán)，用百煉平臺和全棧產(chǎn)品矩陣綁定企業(yè)工作負(fù)載，通過支持Claude Code這樣的主流工具爭奪開發(fā)者，最終讓模型、工具鏈、云基礎(chǔ)設(shè)施形成閉環(huán)。這條路的風(fēng)險是，鏈路長、節(jié)點多，任何一環(huán)出問題都會影響整體，而“全棧”意味著每個細分戰(zhàn)場都要維持競爭力，資源消耗巨大。

百度走的是第三條路，放棄MaaS的正面消耗，守住政企和央國企市場，用合規(guī)和安全能力筑壁壘。這條路最穩(wěn)，但也最沒有彈性。

DeepSeek選擇正面和Claude Code競爭。這條路如果走通，DeepSeek就不再是一個給各家云廠商和開發(fā)者提供底層模型的“公共基礎(chǔ)設(shè)施”，而是一個有自己產(chǎn)品入口的Agent玩家。它要挑戰(zhàn)的，本質(zhì)上是Anthropic，而不是阿里云或火山引擎。

阿里云在這四條路徑里的特殊性在于，它不能只證明Qwen強，還要證明Qwen能進入真實工作流，能留住開發(fā)者，能帶動企業(yè)工作負(fù)載遷移，最后能變成高質(zhì)量云收入。

蔡崇信和吳泳銘在股東信里說，AI業(yè)務(wù)已經(jīng)邁入商業(yè)化回報周期。這個判斷對不對，Qwen3.7-Max是重要的測試變量。

Qwen3.7-Max的看點不是今天超過了誰，而是半年后有多少開發(fā)者把它寫進了自己的工作流，有多少企業(yè)的工作負(fù)載因為它而不想走。

這場競爭最終檢驗的，不是哪家模型跑贏了哪張榜單，而是誰先把模型能力轉(zhuǎn)化成了客戶不愿離開的理由。這才是AI云競爭真正的終局問題。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.