![]()
過去五個月,阿里云的MaaS收入增長了15倍,這只是阿里云重構(gòu)自己的一個側(cè)面。阿里云在峰會上宣布完成"芯片-云-模型-推理"全棧Agent化升級,同步推出全新AI產(chǎn)品官網(wǎng)"千問云"、搭載自研AI芯片真武M890的超節(jié)點服務(wù)器,以及最新旗艦?zāi)P蚎wen3.7-Max。
用阿里云資深副總裁劉偉光的話說:"我們正在建設(shè)中國最大的AI工廠。"工廠這個比喻暗示了一套完整的生產(chǎn)邏輯,片是原材料,云是車間,模型是機器,推理平臺是流水線,最終產(chǎn)出的商品是Token。
而這次重構(gòu)的本質(zhì),是把過去17年圍繞"人使用云"搭建的整套體系,改造成"Agent消費Token"的新體系。
芯片這張牌,為什么現(xiàn)在打
阿里云過去很少在公開場合強調(diào)芯片。這次峰會,不僅發(fā)布了新一代訓(xùn)推一體AI芯片真武M890,還破天荒地公布了未來兩年的芯片路線圖,真武V900、真武J900兩代產(chǎn)品逐年推進。
真武M890配備144GB顯存,片間互聯(lián)帶寬800GB/s,性能是上一代真武810E的3倍,搭配自研的ICN Switch互聯(lián)芯片,128張AI芯片可以組成一臺機器,P2P時延壓到150納秒以內(nèi)
但參數(shù)之外,更關(guān)鍵的信息是規(guī)模,真武系列累計出貨56萬片,已經(jīng)進入電信、一汽、浦發(fā)銀行等20多個行業(yè)的400多家客戶。
![]()
劉偉光反復(fù)用谷歌做類比,谷歌TPU和Gemini的深度綁定,讓谷歌在自家框架里跑出了最優(yōu)的性價比。阿里云當(dāng)然想走同樣的路,他把競爭邏輯歸結(jié)為一句話:"如果未來拼的是每一塊芯片都能跑出比競爭對手更多的高質(zhì)量Token,那我們就勝利了。"
再加上倚天CPU、磐脈智能網(wǎng)卡、鎮(zhèn)岳存儲主控芯片,平頭哥的芯片版圖已經(jīng)從單點延伸到了算力、網(wǎng)絡(luò)、存儲的完整覆蓋。當(dāng)推理需求指數(shù)級膨脹的時候,只有把芯片握在自己手里,才能控制住每個Token的邊際成本。
道理不復(fù)雜。模型公司可以比拼參數(shù),云廠商最終比的是誰的Token更便宜、更穩(wěn)定、更快。芯片是這場成本戰(zhàn)的起點。
云本身也得重寫
芯片解決的是"跑得動"的問題,但Agent對云的需求遠不止算力。
傳統(tǒng)云產(chǎn)品的交互邏輯是給人設(shè)計的,打開控制臺,看菜單,配參數(shù),點按鈕。這套東西對Agent來說完全不可用,Agent不看網(wǎng)頁,不點按鈕,它需要的是結(jié)構(gòu)化的能力描述、標(biāo)準(zhǔn)化的調(diào)用協(xié)議和可預(yù)期的反饋。
阿里云CTO李飛飛用一組對比來說明問題:傳統(tǒng)云的工作負載是穩(wěn)態(tài)的,一臺ECS開出來可能跑幾個月甚至幾年;但Agent的工作負載是"無規(guī)律彈性、短生命周期、瞬時起量即走",一個Agent執(zhí)行完任務(wù),沙箱就銷毀了,下一個請求可能幾毫秒后就來,也可能幾小時后才來。
為此,阿里云做了三件事。
第一,把云產(chǎn)品Skill化、MCP化和CLI化。簡單說就是把每個云產(chǎn)品封裝成Agent可以直接調(diào)用的標(biāo)準(zhǔn)化接口,像調(diào)函數(shù)一樣調(diào)云。
第二,為Agent構(gòu)建專屬的運行環(huán)境——輕量沙箱、多Agent協(xié)同、跨任務(wù)記憶、數(shù)據(jù)流轉(zhuǎn)通路。
第三,重建調(diào)度邏輯,從"資源調(diào)度"轉(zhuǎn)向"任務(wù)調(diào)度",因為當(dāng)海量Agent同時并發(fā)的時候,傳統(tǒng)的資源編排方式扛不住。
劉偉光表示,一些AI應(yīng)用上線后,會自動在后臺開通云資源——虛擬機、數(shù)據(jù)庫實例、沙箱環(huán)境,全程不需要人介入,一個客戶一天內(nèi)自動開通的資源量,相當(dāng)于過去人工操作兩周。
"這已經(jīng)等于說Agent在自己使用云了。"劉偉光給出了一個內(nèi)部測算的換算關(guān)系:Token消耗可以按比例折算成GPU用量,而每一卡GPU的增長,大致帶動一比一的CPU增長。也就是說,Token收入的增長不是在蠶食傳統(tǒng)云收入,而是在拉動它,前提是云平臺能夠接得住Agent的工作負載。
因此,阿里云不是在原來的體系上加一層AI能力,而是從交互方式、調(diào)度邏輯、計費模型到產(chǎn)品形態(tài)全部推翻重來。
模型不是用來聊天的
全棧重構(gòu)的第三層是模型。Qwen3.7-Max在Arena全球盲測總榜中排到了國產(chǎn)第一,超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,這次發(fā)布的重點,是阿里對模型能力方向的重新定義。
阿里巴巴通義大模型負責(zé)人周靖人表示,"過去我們追求模型'說得好',現(xiàn)在要求模型'做得到'。"
![]()
以阿里云在芯片的實踐來看,在訓(xùn)練時從未接觸過的真武M890芯片上,Qwen3.7-Max僅憑一份任務(wù)說明,從零開始自主工作了35個小時,獨立完成了一個生產(chǎn)級AI計算內(nèi)核的編寫和調(diào)優(yōu),最終性能比官方版本提升了10倍,整個過程沒有人類干預(yù),沒有中間指導(dǎo)。
這說明了模型在Agent場景下的核心能力,長程自主執(zhí)行,接過一個任務(wù),自己拆解、自己規(guī)劃、自己寫代碼、自己調(diào)試,連續(xù)干35個小時不停。
為了支撐這種級別的推理需求,百煉平臺也做了對應(yīng)升級,并池調(diào)度提升GPU利用率,上下文緩存消除重復(fù)計算,吞吐彈性調(diào)度應(yīng)對并發(fā)波峰。
在生態(tài)上,百煉保持開放接入,除了千問模型矩陣,還上線了智譜GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型。
劉偉光提到,"客戶在實際使用中不會只用一個模型,是多模型組合。我們提供組合,客戶在平臺上找到最適合自己的搭配。"峰會現(xiàn)場,六家國內(nèi)頭部模型公司的高管集體站臺,場面頗有"國內(nèi)AI聯(lián)盟"的意味。
近三個月內(nèi),千問旗艦?zāi)P瓦B續(xù)迭代了3.5、3.6、3.7三個版本。這個發(fā)布節(jié)奏本身就在傳遞信號,模型能力的競賽遠沒有結(jié)束,而阿里打算用自研芯片+自研模型的縱向整合來建立長期優(yōu)勢。
這場重構(gòu)的真正賭注
回過頭來看,阿里云這次全棧重構(gòu)的底層邏輯簡單純粹,當(dāng)AI收入的增長速度遠超傳統(tǒng)云業(yè)務(wù),當(dāng)Token有可能取代ECS成為最大的產(chǎn)品線,當(dāng)Agent開始自動開通云資源而不再需要人類登錄控制臺,整套為人設(shè)計的技術(shù)體系就到了不得不改的時候。
但執(zhí)行層面的難度是另一回事。劉偉光自己也承認,轉(zhuǎn)型"說起來容易,做起來非常難"。過去銷售團隊跟客戶的IT部門打交道,現(xiàn)在做MaaS要跟業(yè)務(wù)部門甚至CEO對話,
"你的對話能力、閱歷,完全是另一個層次的要求"。阿里云已經(jīng)在大客戶上設(shè)立了專職的MaaS銷售,與傳統(tǒng)IaaS銷售分開考核、獨立作戰(zhàn)。
考核指標(biāo)也在變,不再只看調(diào)用量,而是看"高質(zhì)量Token",解決實際問題的Token,而不是灌水聊天的Token。三個核心指標(biāo):付費客戶數(shù)的日增長、核心業(yè)務(wù)系統(tǒng)接入模型的數(shù)量、Agent自主完成任務(wù)閉環(huán)的效率。
這些組織和機制層面的調(diào)整,往往比技術(shù)發(fā)布更能說明一家公司的真實判斷,阿里云要重建收入結(jié)構(gòu)、客戶關(guān)系和銷售體系。劉偉光表示,"以前我們做云的時候,客戶的IT預(yù)算是能算出來的,線下多少臺服務(wù)器,搬上來大概多少錢,能看到題目。但做MaaS,這個題的答案你是不知道的,進去之后可能超乎你的想象。"
題目看不到了,答案也不確定,但阿里云還是決定把整套體系拆開重寫,因為唯一確定的是,AI是比以往大上十倍甚至百倍的機會。
這大概就是這次峰會最值得關(guān)注的信息:不是哪款芯片多出算力,哪個模型排名第幾,而是中國最大的云廠商,正在用一種接近創(chuàng)業(yè)公司的激進姿態(tài),賭一個它認定會到來的未來。(本文作者 | 張帥,編輯 | 楊林)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.