5月20日,在2026阿里云峰會上,阿里云宣布進行全棧技術(shù)革新,從底層芯片、Agentic Cloud、模型到推理平臺全面升級,建設(shè)中國最大的AI工廠。
阿里云資深副總裁劉偉光表示,Agent突破臨界點后可24小時不間斷工作,對AI和云的需求無窮無盡。
![]()
以下內(nèi)容根據(jù)官方消息總結(jié):
一、芯片層:真武 M890+128 卡超節(jié)點服務(wù)器
真武 M890 AI 芯片(平頭哥)
性能為真武 810E 的3 倍,144GB 顯存,片間互聯(lián)帶寬800GB/s。
原生支持 FP32~FP4 全精度,覆蓋訓(xùn)練 / 推理全場景。
路線圖:2027Q3真武 V900、2028Q3真武 J900。
累計出貨56 萬片,服務(wù) 400 + 政企客戶。
磐久 AL128 超節(jié)點服務(wù)器
搭載自研 ICN Switch 1.0,128 卡互聯(lián),P2P 時延<150ns。
面向 Agent 海量并發(fā)推理與大模型訓(xùn)練。
二、云層:全面升級為 Agentic Cloud
云產(chǎn)品Skill 化 / MCP 化 / CLI 化,變成 Agent 可直接調(diào)用的標(biāo)準(zhǔn)化能力模塊。
重構(gòu)運行環(huán)境:輕量沙箱、多 Agent 協(xié)同、跨任務(wù)記憶、數(shù)據(jù)高速流轉(zhuǎn)、全域智能運維。
適配 Agent“無規(guī)律彈性、短生命周期、瞬時起量即走” 的負(fù)載特征
三、模型層:Qwen3.7-Max 國產(chǎn)第一,勝任 35 小時長程任務(wù)
Qwen3.7-Max(通義千問旗艦)
Arena 全球盲測國產(chǎn)第一,對標(biāo)全球頂級模型。
面向 Agent 重構(gòu):強編程 / 推理 / 多智能體協(xié)作 / 辦公自動化能力。
里程碑演示:在真武 M890 上自主運行 35 小時,千次工具調(diào)用,自研 AI 內(nèi)核性能提升 10 倍。
迭代加速:近 3 個月連續(xù)發(fā)布3.5/3.6/3.7三個版本。
四、推理層:百煉平臺極致彈性 + 開放生態(tài)
百煉推理平臺
并池調(diào)度 + 上下文緩存 + 彈性吞吐,優(yōu)化 Agent 高并發(fā)推理。
內(nèi)置Agentic RL:基于執(zhí)行反饋的強化學(xué)習(xí),驅(qū)動模型持續(xù)迭代。
安全治理:約束自主 Agent 行為,防止越界。
生態(tài)開放:接入 Qwen、GLM5.1、MiniMax M2.7、Kimi K2.6、可靈、Vidu Q3 等150 + 主流模型。
五、新入口:千問云發(fā)布
Agent 原生模型服務(wù)平臺,聚合150 + 模型 API。
核心能力封裝為 Skills 與 CLI 工具,便于 Agent 調(diào)用與 AI 應(yīng)用開發(fā)。
定位:從 “為人服務(wù)” 轉(zhuǎn)向 “為 Agent 服務(wù)” 的下一代模型入口。
據(jù)媒體報道,這是行業(yè)首次圍繞Agent進行全棧產(chǎn)品發(fā)布。阿里云資深副總裁劉偉光在峰會上表示,Agent突破臨界點之后可以24小時不間斷工作,對AI和云的需求無窮無盡。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.