![]()
阿里云在 520 峰會上,交出了第一張 Agentic 答卷。
作者|鄭玄
5 月 19 日的 Google I/O 上,谷歌最重磅的發布是一款叫 Gemini Spark 的個人 Agent——跑在 Google Cloud 的專屬虛擬機上,由 Gemini 3.5 和 Antigravity 框架驅動,深度接管用戶的 Gmail 和 Workspace,24 小時在云端替人執行長任務。Sundar Pichai 在 keynote 上把它定義為「你的個人 AI Agent」。
幾個小時以后,北京時間 5 月 20 日的杭州,阿里云在自己的年度峰會上交出了另一份答卷。和 Spark 不同,阿里云這次不是發一款 Agent,而是把整朵云按 Agent 的需求重做了一遍——它要解決的,是當 Spark 這樣的 Agent 大規模跑起來時,云本身需要變成什么樣。
如果只看發布清單,這是又一場密集的發布會:Qwen3.7-Max 登頂國產開源、Qwen3.6 系列下放、平頭哥真武 AI 芯片披露 56 萬片出貨、百煉平臺 SLA 4 個 9、新官網「千問云」上線、Agentic Cloud 體系亮相??每一項單獨拎出來都能寫一篇報道。但把這些產品放在一起,會發現它們都圍繞著同一件事:
阿里云正在把自己的整條技術棧,按照 Agent 的需求重新拆解、重新裝配。
阿里云的這些動作不只是「AI 升級」,它更像一次「基礎設施換底座」。阿里云將這套新架構稱為 Agentic Cloud——目標只有一個:讓 Agent 成為云的一等公民,產品、API、計費、文檔、官網全部圍繞 Agent 重新設計。
01
重讀這套四層架構
阿里云在臺上畫的那張技術棧圖,支撐 Agent 的底座從下到上有四層:底層是平頭哥芯片,倒數第二層是「為 Agent 而生」的云能力,中間是千問大模型,最后是模型推理平臺百煉。
![]()
阿里云在 Agentic 時代重構技術棧|來自:阿里云 520 峰會
聽起來還是熟悉的「芯片-平臺-模型-應用」四件套。但仔細看每一層,每一層的定義都被改寫了一次。
最容易被低估的,是中間的Agentic Cloud。阿里云把它分成了兩件事:一是給 Agent 跑起來提供基礎設施(Agent Infra),二是把云產品自己變成 Agent 可以調用的能力(Agentic Products)。
第一件事的邏輯是:Agent 負載和傳統在線服務,本質上是兩種東西。傳統云負載是穩態的 QPS——一個網站每秒固定承載多少請求,資源按容量買。Agent 負載則是任務流——一個任務可能跑幾秒、幾分鐘甚至幾小時,結束就銷毀,下一秒又突發起十萬個新任務,每個任務有自己的依賴、自己的臨時存儲、自己的工具調用權限。
傳統云做「資源調度」,Agentic Cloud 必須做「任務調度」。阿里云為此堆出了一整套圍繞「短生命周期 + 突發 + 高并發 + 需要工具調用」這組新特征設計的組件——從任務級運行環境隔離,到多 Agent 編排、任務級身份鑒權,再到多模態記憶存儲,每一項新特征,都不是為了人類用戶。
第二件事更有意思——阿里云宣布了 12 條產品線、56 款產品的全面「Skill 化」。這是什么意思?過去你要用 OSS、用瑤池數據庫、用 DataWorks,得讀文檔、寫代碼、調 API。現在阿里云把這些產品的核心能力封裝成 Skill,Agent 可以像調函數一樣直接調用,OSS Agent、StarOps、Dataworks Agent 已經先后落地。這件事的本質不是云產品變成了 Agent 的「下屬」,而是讓開發者用云產品的體驗被 Agent 化——從讀文檔、調 API,變成任務級、交互式的對話,像給下屬布置任務一樣。這是云廠商真正要做的工作量最大的事:把所有存量產品的接口重新做一遍。
百煉這層則是 Agent 經濟跑通的關鍵卡點。阿里云把它叫做「Agentic 時代的模型推理平臺」,對外講的是三個數字——冷啟動降低 90% 以上、每分鐘拉起 10000 個 Pod、SLA 4 個 9,背后解決的是 Agent 工作負載最棘手的「彈性/成本/效果」三難。
Agent 一旦投入生產,Token 消耗會暴增幾個數量級,單純按量調度的成本結構會迅速崩掉。百煉給出的答案是分四種計費形態——按 Token、PTU、MU、Batch API。把不同特征的 Agent 工作負載塞進最合適的計費模式里,再疊加 Prompt Caching 把重復上下文的成本砍掉九成。一個細節是,在 Claude Code 這類高頻復用 prompt 的編程 Agent 場景下,百煉上報的重復上下文計算可降低 98%——這個數字直接決定了一個企業能不能負擔得起用 Agent 寫代碼。
模型層則是這套體系里最被驗證、也最被低估的「非云」資產。在峰會上發布的旗艦模型 Qwen3.7-Max,在 Arena 全球大模型盲測總榜里超過了 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,與 GPT、Claude、Gemini 同處第一梯隊,國產模型登頂。開源側的數字更醒目:千問衍生模型數量在 Hugging Face 上突破 20 萬個,下載量過 10 億次,全球開源模型采用率 53%,已經把 Meta-Llama 和 Google-Gemma 遠遠甩在后面。
Qwen 在開源生態里跑贏了,意味著大量第三方 Agent 框架默認會接入 Qwen——Cursor、Claude Code、Qwen Code、OpenCode、Cline,幾乎所有主流的編程 Agent 都已經支持把后端切到 Qwen。當一個開發者用 Qwen Coder 寫完代碼,下一步順理成章地就是把推理放到百煉上跑——百煉現在是 OpenAI SDK 兼容、Bailian CLI 直接對接 Cursor 和 Claude Code 的狀態。
而 Qwen 在 Agentic Coding 和 Tool Use 上的強項,恰好是 Agent 真正干活時最需要的兩類能力。代碼是 Agent 當下最被驗證的生產力場景——GitHub Copilot 數據顯示,AI 生成代碼占比已達 46%,Agent 編程會話時長從 4 分鐘拉長到 23 分鐘,78% 的會話涉及多文件操作。這些數字背后是一個簡單的事實:編程 Agent 已經從演示走進生產線,而能做好編程的模型,就能吃到這個市場最先長出來的真金白銀。
最底層的是平頭哥,阿里自研芯片一直比較低調,但重要性一點不低。會上,阿里云宣布真武 AI 芯片累計出貨 56 萬片,覆蓋 20 多個行業、400 多個客戶,超過 30 家車企的智駕研發已經在阿里云上跑、累計使用真武芯片超 13 萬卡。
加上倚天 Arm 服務器 CPU、鎮岳存儲主控、磐脈 400G 智能網卡構成的「四件套」,讓阿里能把模型訓練、Agent 任務編排、上下文長記憶讀寫、萬卡集群互聯做成一個系統級的整體優化。劉偉光在媒體溝通里反復強調一個詞——「芯云模一體化」,意思是只有自己同時控制芯片、推理平臺和模型,才有可能在 Token 成本上跑出系統級的性價比。
02
新官網背后意味著什么
把四層架構講清楚,只是這次峰會的「明線」。
更值得分析的「暗線」,藏在阿里云這次同時公布的另一件事里:一個看起來不太起眼的新官網——千問云。
![]()
千問云官網|來自:千問云
它和阿里云自己原來的官網完全是兩種東西。阿里云官網是一個典型的傳統云廠商門戶——產品線長、目錄深、面向 IT 采購者;千問云則像一個 AI 時代的 Stripe 或 Linear,UI 極簡,主體只剩下三件事:選模型、對比模型、用模型。它把 200 多款主流模型(Qwen、GLM、Kimi、DeepSeek、Wan 等)的 API 擺在最顯眼的位置,模型的核心服務被打包成 Skills 和 CLI——意味著 Agent 可以直接調用,連人類開發者都被當成次要用戶。
劉偉光對外的原話是:「過去模型服務平臺為人服務,未來用模型的主力將是 Agent,千問云正在全面重構模型服務平臺,為開發者和 Agent 提供更友好的體驗。」
這是新官網背后的含義:阿里云在公開承認,云的用戶已經不再只是人了。
這件事的戰略含義比看上去大。一旦云廠商接受「Agent 是新的客戶」,意味著官網、計費、控制臺、文檔、SDK,整個云產品的用戶界面都要重寫一遍。Skill/CLI 化不只是一個 UI 改造,而是云產品要從「人能看懂的頁面」變成「機器能直接調用的接口」。
千問云加上 56 款產品的 Skill 化,是阿里云對「Agent 是新客戶」這個判斷的第一次 GTM 嘗試。即將到來的 Agentic AI 時代,誰先把「為 Agent 而生」的入口跑通,誰就先搶到下一階段的開發者心智。
03
從「賣 Token」到「賣結果」
技術棧重構的下一步,是商業模型重構。這件事更難,也更能看出阿里云這次到底轉了多少。
在和媒體的閉門交流里,劉偉光花了相當長的時間講解阿里云銷售端過去一段時間的變化——這部分內容比產品發布更值得細讀。
第一,考核指標變了。阿里云銷售從看 GPU 賣了多少、多少客戶遷移上云,轉向關注「為付費 Token 的企業客戶數」、「Agent 自主完成閉環工作的比例」。這兩個指標里沒有一個是傳統云銷售熟悉的語言——付費 Token 客戶數意味著客戶真的在生產環境用 Agent 而不是 PoC;Agent 自主完成閉環更激進,相當于把「結果」作為衡量銷售成敗的標準。
第二,組織結構變了。阿里云成立了專注做在 MaaS 產品上的銷售團隊,和原有云銷售團隊「在局部打配合、在部分市場各自作戰」。這是一個非常典型的「業務重構」動作——當新業務的 PMF、銷售路徑、客戶決策鏈都和老業務不一樣的時候,強行讓老團隊轉型,效率遠低于專門拉一支新軍加入戰斗。
第三,話語權變了。今天銷售要賣 MaaS,要見的人變成了企業的董事長、CEO 或者業務負責人,而不是 IT 負責人。因為決定一個企業要不要全公司用 Agent,本質上不是一個采購決策,而是一個組織和業務決策。
第四,定價方向在遷移。劉偉光承認,按 Token 收費是目前市場上最普遍的方式,但「已經出現客戶愿意為結果付費的苗頭」。他給的判斷是:終極目標是結果付費,但需要模型足夠強大、Agent 足夠穩定。這是一個非常誠實的現狀描述——結果付費是方向,但要走過去,需要技術先成熟到一定程度。
把這四件事放在一起看,阿里云正在做的事情,遠不只是「再賣一種產品」。它是在把云的價值衡量單位,從計算資源(GPU、彈性計算、網絡,存儲,大數據,數據庫等)變成 Token,再從 Token 變成 Agent 跑通的具體業務結果。
這個過程里,阿里云面對的不只是技術棧重構,還有產品組合、銷售考核、組織架構、客戶對話方式的連環重構——每一環都很難,但都是通往下個時代的云必須走過的道路。
04
一次組織級的轉身
阿里云接下來要打的,是一場比技術棧重構更復雜的硬仗——要在一個還沒有定型的市場里,同時支撐多種 Agent 產品形態、多種銷售路徑、多種客戶類型,并且自己內部還要從「賣云」的組織重塑成「賣 Agent 解決方案」的組織。
阿里云財報數字給出的反饋是積極的——FY26 Q4 云外部收入增速加速到 40%,AI 相關收入占比首破 30%,AI 相關產品收入已經連續 11 個季度三位數同比增長,年化 AI 收入達到 358 億。阿里全棧 AI 已經進入吳泳銘口中的「正向商業化回報周期」。
但財報反映的是過去一年的回報,而 5 月 20 日這場峰會真正押注的是未來三到五年的市場:當所有云廠商都在圍繞 Agent 重構技術棧、重構銷售、重構組織結構的時候,阿里云能不能比對手轉得更快、更徹底。
從這次峰會能看到的信號是——它至少已經開始轉了,而且轉的不只是產品層。
這是一件值得繼續觀察的事。因為對一家像阿里云這樣體量的云公司來說,最難的從來不是發布一個新產品,而是同時讓產品形態、銷售考核、組織結構、客戶對話方式跟著新業務一起改變。
Agentic Cloud 的終局會怎樣還說不清。但 5 月 20 日這一天,阿里云至少讓外界看到了一件事:它愿意為這件事,把自己重新拆開裝一遍。
*頭圖來源:阿里云
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你如何看待 Agentic Cloud ?
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.