過去一年,外界對阿里云乃至阿里巴巴的討論,大多集中在一件事上,它以史無前例的資本投入,重注AI基礎設施。
外界甚至有些不解,做一個面向AI時代的云底座,需要花費這么多錢么,阿里巴巴是不是過于激進,想靠AI的資本敘事推升股價?
這些問題本身沒有錯,但它隱含了一個前提,還是用老框架評估阿里云,看市場份額、看增速、看跟AWS和Azure的差距。
5月20日的阿里云峰會,阿里云給出的答案,不在這個框架里。
![]()
阿里云資深副總裁劉偉光表示,Agent突破臨界點之后可以24小時不間斷工作,對AI和云的需求無窮無盡。阿里云正在進行全棧技術革新,從底層芯片、Agentic Cloud、模型到推理平臺全面升級,建設中國最大的AI工廠。
無獨有偶,同期谷歌的I/O大會核心主題也是Agent,谷歌把智能體全面塞進所有核心入口,從搜索框到Chrome瀏覽器,從Android手機到智能眼鏡,Gemini不再只是一個對話助手,變成一個可以持續運行、跨應用執行任務的AI代理。AWS,微軟Azure都同樣基于Agent的邏輯,重塑自己的業務和基礎設施底座。
全球頭部云廠商,他們自身也是大模型頭部廠商,達成了一種默契,舊的云撐不住未來的Agent,基礎設施需要為Agent重建。就以往而言,大多數廠商的路線是,在現有架構上疊加一個Agent層,底層基礎設施改動有限。
現在,阿里云真正意義上將云、芯片、模型做成一體化的組合。
當云的客戶從人變成Agent
理解阿里云這次重構的關鍵,在于一個判斷,Agent的負載特征,和傳統云計算的負載特征,是兩種完全不同的邏輯。
傳統云計算的典型負載是穩態的,一個企業買一臺ECS,跑一個網站或者一個數據庫,流量相對可預測,資源長期占用,云廠商的商業模式也因此圍繞資源出租來設計,計算、存儲和網絡,是云計算生意的三大件。
但Agent的工作模式完全不同,一個Agent在執行任務時,可能在毫秒間連續發起數十次模型調用,執行完任務立即銷毀環境,下一次被喚醒可能是幾分鐘后,也可能是幾秒后,它的負載特性無規律且突發,在短生命周期內瞬時起量,用完即走。
表面上Agent調用的是模型,實際上是一整套AI全棧體系,它還需要沙箱環境來運行代碼,需要數據庫存儲中間狀態,需要網絡訪問外部工具,一個Agent的一次任務執行,牽動計算、存儲、網絡、模型推理等多種資源的協同調度。
新舊時代的云計算,復雜度完全是兩個量級的問題。劉偉光提到,今年春節后,龍蝦類智能體產品上線后,阿里云發現了一個有趣的現象,過去企業開通云資源需要人登錄控制臺手動操作,當下Agent直接在后臺自動激活了云計算資源。
“Agent能夠以分鐘為單位完成的云計算資源服務開通,可能是過去我們人以天為單位完成的工作。”劉偉光說。這由不得云廠商不注意,Agent已經在成為云計算的新界面,阿里云由此做出的判斷是,未來云計算產品的主要使用對象,將逐漸從人類工程師變成Agent。
這個判斷,也貫穿阿里云的整個重構邏輯,為了讓Agent真正用得上云,阿里云對云產品進行了三個維度的改造,Skill化、MCP化和CLI化。
簡單來說,就是把每一個云產品都變成Agent可以像調函數一樣調用的標準化能力模塊,傳統云產品的控制臺對人友好,但對Agent毫無意義,Agent需要的是結構化的能力描述,以及明確的調用協議。
![]()
這套體系被阿里云命名為“Agentic Cloud”,區別于以往幾年為大模型訓練和推理服務的“AI Native Cloud”。兩者的區別在于,AI Native Cloud更多專注在模型的生產迭代,提供彈性高效的算力調度,Agentic Cloud面向的是智能體的運行時,提供沙箱、AI網關、記憶管理、安全防護與編排治理等全套能力。
數年之前云廠商做AI,主要是把算力資源賣給模型公司去訓練和推理,如今阿里云要做的,是讓云本身成為Agent運行的操作系統。
阿里云補上所有拼圖
如果說,Agentic Cloud是阿里云在架構層面的回答,那芯片就是這個回答的物理基礎。
![]()
在本次峰會上,阿里云公布了自研芯片的路線圖,平頭哥發布了新一代訓推一體AI芯片真武M890,144GB顯存,片間互聯帶寬800GB/s,性能是上一代真武810E的3倍。配套發布的ICN Switch 1.0互聯芯片,可以將128張AI芯片組成一臺超節點服務器,P2P時延低于150納秒。
據介紹,平頭哥未來兩年將陸續推出算力更強的真武V900、真武J900兩代芯片,這大概率意味著,阿里云的芯片迭代節奏,與模型迭代節奏對齊,每一代芯片性能的提升,直接轉化為大模型訓練和推理能力的躍升。
![]()
目前真武系列AI芯片累計出貨56萬片,已服務20多個行業的400多家客戶,覆蓋電信、汽車、金融等領域。加上阿里自研的倚天系列CPU、磐脈智能網卡、鎮岳存儲主控芯片,阿里芯片版圖已經從單點突破走到了全面覆蓋,算力、網力、存力三個維度的數據中心芯片矩陣,在國內云廠商中獨一份。
劉偉光也反復強調了芯片-云-模型-推理一體化的邏輯,“今天給客戶最終呈現的結果,是齒輪咬合的組合效應,是模型能力、芯片能力和云能力三件事的完整有機結合。”
在芯片和模型之間,百煉推理平臺起到“生產車間”的作用,阿里云在百煉上構建了大規模GPU資源集群,并通過一套針對Agent場景的技術棧來應對推理側的特殊挑戰,并池調度將GPU資源統一管理,提升整體利用率;上下文緩存消除Agent在多輪對話和長鏈路任務中的重復計算開銷;吞吐彈性調度應對Agent并發請求的波峰波谷,確保流量激增時不崩潰、低谷期不浪費。
更值得注意的是Agentic RL機制,基于Agent實際執行反饋的強化學習,讓模型在真實場景中越用越好,形成持續迭代的閉環。此外,百煉內建了安全治理能力,這一點在Agent自主運行的語境下極其關鍵,一個24小時不間斷執行任務的Agent,如果沒有邊界約束,后果不可控,百煉的安全機制確保Agent始終在預設的權限范圍內行動。
類比谷歌,谷歌的TPU和Gemini模型的深度綁定,在其自有的深度學習框架里跑出了最高的性價比,不論是技術還是資本市場,都已經高度認可這條路線。阿里用自研芯片跑自研模型,通過軟硬件的深度協同,也可以把每一張芯片的每一個算力單元都榨到極致。
再看模型部分,最新發布的Qwen3.7-Max在三方機構Arena全球大模型盲測總榜中,Qwen3.7-Max位列國產模型第一,與GPT、Claude、Gemini的最強模型接近。
![]()
Qwen3.7-Max可獨立執行35小時的長程復雜任務
更有說服力的是一個實戰案例,在從未接觸過的真武M890芯片上,Qwen3.7-Max僅憑一份任務說明,從零開始自主工作35小時,獨立完成了一個生產級AI計算內核的編寫與調優,最終性能較官方版本提升10倍。
沒有人類干預,沒有中間指導,35小時,從零到生產級,這充分體現出模型“自主完成復雜工程任務”的能力,它運行的硬件底座,恰恰是阿里自研的芯片,芯片和模型的協同進化,在這個案例里被具象化了。
值得一提的是,近3個月內千問旗艦模型已經連續迭代了3.5、3.6、3.7三個版本。這種發布節奏本身就說明,阿里巴巴在刻意加速模型進化,以匹配Agent時代對模型能力的指數級增長需求。
![]()
反之,模型迭代的速度,最終受制于算力的供給,這又回到了芯片-云-模型-推理的體系,一個齒輪咬合、螺旋上升的關系。
賣Token,就是未來阿里云最大的生意
技術架構的重構,最終要回到商業邏輯上來理解。阿里巴巴上周的財報披露了一個關鍵數據,AI模型及應用服務的ARR已超過80億元,預計年底突破300億元。消息發布當天,阿里股價飆漲8%。
阿里云內部的判斷更為激進,Agent驅動的MaaS收入將取代ECS,成為阿里云最大的產品線。阿里云的商業模式徹底變化,增長引擎正在從以虛擬機為計量單位的資源收入,全面切換為以Token為計量單位的AI收入。
百煉平臺也遵循開放生態策略,不只跑阿里自研的千問模型系列,還同步接入了智譜GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、Vidu等第三方模型。
企業客戶在真實業務中會使用多模型組合,百煉要做的是讓客戶在一個平臺上找到每個領域最好的模型組合和最具性價比的推理服務,只要模型部署在阿里云上,不管是自研還是第三方,產生的都是Token收入。
劉偉光估計,對于AI原生的創業企業來說,MaaS開銷幾乎就是100%的IT支出;在中國互聯網企業中,Token相關的支出已經占到IT總支出的15%—20%;傳統企業目前還在5%以下,但增長曲線陡峭。阿里云內部的指標是,每一個企業客戶在阿里云上的Token支出,應該不低于該客戶總花費預算的20%。
更具體的變化體現在行業側,賣token實際上拓展了阿里云的業務邊界。以汽車行業為例,阿里云以往能做的就是幫車企把ERP等系統上云,后來延伸到智駕的算力和云底座,再后來是座艙大模型對話。
當前,客戶營銷、廣告生成這些曾經完全不在云廠商業務范圍內的事情,都因為AI能力的溢出而變成了新的收入來源,阿里云內部甚至都沒有預料到,能拿到客戶的這部分業務的預算。
還有一個原來云廠商完全吃不到的市場,企業內部的軟件開發和人力外包,這部分預算長期由系統集成商和外包公司拿走,云廠商無從插手。但AI Coding的出現,讓這部分預算變成了Token支出。
諸如此類的變化匯總起來,意味著云計算行業的天花板被大幅抬高了。以往云廠商的收入上限,取決于企業IT預算中可以遷移上云的部分,數據庫、中間件、大數據平臺,存量市場遷移為主,也創造出一些新的云原生需求。
AI把企業內部的運營管理、市場營銷、軟件開發這些原本不屬于“IT基礎設施”的支出,都拉進了云廠商的收入池。
One more thing
阿里云成立17年來,第一次發布了另一個官網,千問云官網,本質上是對新商業邏輯的反饋動作。
![]()
打開www.qianwenai.com,不是傳統云官網的產品列表和控制臺,首頁只有一行代碼指令:`npx skills add QianWen-AI/qianwen-ai`。這是一條Agent可讀的prompt指令,阿里云將所有模型服務的核心能力封裝為標準化的Skills和CLI工具,Agent可以直接解析并調用。
當云的主要消費者不再是人,而是Agent,所有圍繞人類設計的界面、流程和交互邏輯,都需要被重寫。
上一次中國頭部科技公司以如此決絕的方式重構產品入口,可能要追溯到移動互聯網早期,所有人把PC官網的流量讓位給App的階段。只不過這一次更徹底,App至少還需要人去打開,Agent只需要讀一條指令。
回到開頭的問題,阿里巴巴做云的決心,到底應該被怎樣評估?
從資本投入看,萬億級的AI基礎設施投資確實史無前例。但只看投資額,會錯過更本質的變化,阿里云從芯片、云架構、模型、推理平臺到產品入口,做了一次徹底的全棧重構。
這背后的賭注,就是當Agent成為云的主要消費來源時,誰先完成基礎設施的重建,誰能實現更好的效果以及更高的性價比,誰就拿到下一個十年的入場券。全球頭部的云廠商,無論是谷歌、AWS、微軟還是阿里云,都做出了同一個選擇。
這不是一家公司的冒險,而是一個行業的共識,現在阿里云想做的,就是沖在最前。(作者|張帥,編輯|蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.