摘要 ◎ 云棲信號:阿里云政企AI+操作系統浮現 ◎ 為何是阿里云 ◎走向確定性增長
消息人士對夸克點評透露,阿里云智能集團政企事業部有望扭虧為盈。
大概涉及到信披,官方未回應。但這讓人想起19日云棲大會采訪。阿里云智能研究員、副總裁、專有云總經理劉國華對夸克談業務調整時說,“老石頭領軍的業務發展還是很迅速的”,上半年已完成全年目標。
這傳遞了很多信號。
有人或以為是收縮結果。去年以來,阿里云政企業務經歷過調整。其中部分虧損的傳統大集成項目(非專有云)被裁撤。外界認為政企業務很難規模化,更難盈利,阿里云或有意弱化。
夸克觀感不同。結合上述消息、云棲及前段動向,我們認為,該單元重整后,非但未弱化,面向AI浪潮,反而已探索出一條富有協同效率的路徑,并在多個度釋放出新的發展動能。
可以說,2024年屬于阿里云政企業務重新定位、夯實產品與方法論、穩健經營的一年;2025年,憑借原生混合云等平臺級產品及落地能力,有望呈現出營收與利潤規模并進的局面。
云棲信號:阿里云政企AI+操作系統浮現
觀感主要來自云棲。峰會上,政企業務基本信息,簡單總結,就是借助一個“一體兩翼”平臺,阿里云建構起一個從底層算力到大模型服務及智能體生成的政企行業AI+操作系統。
“一體兩翼”。“一體”即AI驅動的公共云技術底座。近似阿里集團CEO吳泳銘說的“AI驅動、公共云優先”。外界以為“公共云優先”是業務,其實吳泳銘原話是“公共云技術優先”。“兩翼”指的是飛天企業版智算版與阿里云百煉專屬版2.0。它們都是專為政企客戶打造的重磅產品。
所謂“政企AI+操作系統”,屬于兩翼協同與融合。飛天企業版新版已嵌入百煉專屬版2.0,構成了完整閉環的政企行業AI+操作系統。
這系統的商業邏輯體現在哪?
拆解看。先從飛天企業版智算版開始。
新版最大特色,兩詞總結,“一云多算”與“公專一體”。它將智算能力深度融入專有云平臺,實現通算、超算、智算一網調度與管理運維,足可滿足政企客戶“云+AI”協同發展需求。
2021年,飛天企業版實現“一云多芯”。通過消除底層硬件差異,化解了不同芯片架構的統管與調度難題,資源協同,可滿足多云需求。
智算版面臨的挑戰不同,主要與大模型爆發后底層算力有關。
GPU已取代CPU成底層算力主流。但美國封鎖供應鏈形成安全焦慮。本地涌現多家供應商,惜架構不一,算力碎片化嚴重。此外,各地投建許多智算中心,多芯異構使得看似規模不小的GPU服務器集群缺乏統管,算力池化低,并行計算性能效率低下。
兩重碎片化導致算力巨大浪費。業內披露,目前企業訓練大模型算力有效利用率不足50%。這與算力焦慮形成強烈反差。看來,靠堆卡,成本高企不說,亦很難解決供應鏈問題。
飛天企業版為此升級。它在異構算力池化、推理效率等能力上提升明顯。
針對前者,劉國華表示基本分兩步:一、先做統一納管,將碎片資源變成可經營的云資源;二、統一納管后,將GPU做成統一共池調度。
完成后,智算版GPU虛擬化和容器調度算力切分粒度可達1%,資源利用率提升100%;基于訓推調度一體平臺,算力碎片可減少30%。推理效率上,通過算法優化,單機多卡并行訓練可自動選擇最優通信鏈路,通信帶寬最大提升100%;基于拓撲感知資源調度,模型吞吐量提升23%;GPU深度調優及顯存、算子等優化后,性能較社區版提升10%。
實現不易。劉國華說,除GPU卡與算力外,互聯互通才是訓練中最關鍵的能力,很多受限,須跟硬件廠商合作。
此外,政企客戶亦關注穩定性、模型構建及運維。穩定性上,智算版提供從訓練任務到底層基礎設施一體的監控和分析診斷,整體故障監控覆蓋達80%。模型建構與運維上,增加了AI Studio和運維模型。前者兼容國產硬件,可進行訓練、微調、測評,內置應用可快捷構建大模型并發布;后者以通義千問為基模,結合數據訓練,效率提50%。
顯然,智算版公專一體,不僅獲得同根同源的公共云技術助益,亦擁有協同能力。后者正是過往政企混合云最大痛點之一。
它仍在進化。劉國華透露,今年的3.18版與明年的3.20版,核心能力都是原生混合云。
話外音就是:阿里云已打通底層各環節壁壘,完成標準化平臺建構,為大模型規模化落地政企場景奠定了基礎。
不過,劉國華強調,僅解決算力不夠。真正落地,要靠模型應用驅動。否則,上述性能數字只是理論值。
說到模型應用,他表示,AI可在三大場景發揮:一、基模訓練。萬卡起步,僅BAT等少數企業或國家級城市智算中心能做;二是行業大模型。千卡可訓。部署后,企業私有數據調優,萬卡可實現;三是推理。場景更大,不看單卡或集群規模,更多跟業務相關。
劉國華說,不同場景用不同卡,能充分挖掘算力。如跟國產GPU廠商合作更多在推理,互聯、單卡算力要求不高;企業級調優跟行業大模型訓練,單卡算力要求苛刻,國內就BAT提供,更多跟國際合作。
如此,大模型就能快速落地政企場景嗎?仍不夠。還有很多挑戰。
一方面政企業務的獨特性、敏感性,對大模型開發環境有特殊要求;另一方面,政企市場歷史悠久,有大量圖表、公式等復雜資料,如何轉換為大模型理解的數據,已成政企訓練大模型、打造智能體的關鍵。
就是說,必須提供匹配這一場景的大模型服務與智能體搭建平臺。
2023年,阿里云推出百煉,集成主流大模型,提供選型、微調訓練、安全套件、部署及全鏈路應用開發。今年上半年升級為百煉專屬版1.0,專為政企構建從基模推理到復雜模型定制訓練及行業智能體搭建的一站式平臺。
而此次云棲發布的百煉專屬版2.0,除了大模型訓推、模型兼容、數據解析、智能體搭建能力全面強化外,最大特色之一,就是嵌入了智算升級后的飛天企業版。從而,可基于公共云VPC和專有云部署,支持多芯異構算力調度、多租戶模式下的算力/模型/數據隔離與共享。在智算能力與上述能力加持下,可實現真正意義上一條龍服務。
簡單羅列它幾個特點:支持高性能分布式訓練,吞吐率提升20%;基于軟硬協同的推理加速,精度無損量化升至0.5%,推速升3倍以上;預置通義多尺寸多模態大模型,兼容主流模型框架,支持三方模型接入。模型服務上,除了數據解析,借助工具和插件可拖拉拽搭建智能體。
截至目前,百煉專屬版生成的智能體已在政務、電力、醫藥研發、科研等領域落地。
你不覺得,嵌入飛天企業版的百煉專屬版2.0,屬于政企數字化行業最完整、協同與集成度最高的解決方案、一套“政企行業AI+操作系統”么?
為何是阿里云?
在夸克看來,它也稱得上阿里云政企業務甚至整個阿里云數字化最高方法論的凝結。
那么,如小標題,為何是阿里云?
還有,即便技術與商業邏輯出色,這套操作系統能否一定成功呢?
第一個問題,邏輯其實很簡單。
那就是,跟它完整名字“阿里云智能”一樣,這家公司擁有完整的技術能力與商業要素,也即“云+AI”。
展開一下:阿里云智能是本地唯一一家既擁有龐大公共云平臺又擁有基礎大模型的公司。同時,它也是全球唯一一家既持續做大模型開發又做大量模型開源的公司。截至目前,通義大模型是全球開源與開放程度最高的基礎大模型。
你可能會說,擁有云計算與模型服務,規模不如你大,難道就不能做成協同一體的操作系統嗎?
那倒不是。不過,規模差異很難忽視。
如果你的云計算業務規模小,即便你從產業邏輯上能研發出相近的一站式方案,也很難真正化解底層算力的難題。尤其是成本問題。
多年前,阿里云創始人王堅博士就對外做出過這一預判。若你有心,能注意到,此后每個阿里云一號位與核心高管都反復強調過觀點。
談及吳泳銘強調的“AI驅動,公共云技術優先”,劉國華說,無論公共云還是專有云,底層都是公共云技術,可謂同宗同源。公共云技術能力若是缺乏,不可能壯大規模。
“云計算想要創造價值,規模是基礎。不能將規模做大,所有的故事都是忽悠人的。”他說。
因為,很多客戶尤其政企客戶,早已不是今天你隨便賣個云技術給它或管理10~20臺機器了。事實上,它們自身都已達萬臺服務器規模,有的電網客戶2.5萬臺規模。如此規模,阿里云公共云技術才能發揮更大優勢,尤其“公專一體”云業務形態的選擇。
截至目前,阿里云是亞太、中國第一的公共云平臺。它擁有向下定義硬件、向上定義軟件的全棧化能力。
劉國華說,飛天企業版今年三個方面做了大的技術升級。除了智算平臺支持多芯異構GPU融合管理,還有云平臺智能化升級以及AIPaaS層整個智算落地效率的提升。其中涉及技術繁多。
“云計算”早已不是當初形態。云計算具有龐大的網絡效應與規模效應。它是一條又寬又深又長的大河。此刻我們還說“云+AI”,好像分開,其實兩者正在加速融合,成為更壯觀的原生。
你可能會說,兩大環節,難道不能采用系統集成方式嗎?比如底層算力與混合云選一家,大模型服務、智能體搭建選其他。
邏輯上可以,尤其對大模型開箱即用或只是微調的一般行業。但政企行業特殊性決定了,整個方案除了單點、單一環節的技術與產品必須過硬外,你還必須具有高度穩定、協同一體的服務。剛才說過,這也是過往政企行業數字化的痛點之一。
事實上,你能從阿里云政企業務去年以來的組織升級中感受到這種要求。即便是阿里云智能,為了耕耘這一場景,內部也是全力傾斜聚合優勢、重兵資源,才呈現今天的成果。
去年11月,阿里云成立三大事業部,即公共云業務事業部、混合云業務事業部、海外業務事業部。其中混合云事業部由李津負責,主要滿足特定行業因政策限制、短期無法使用公共云的客戶需求,重點考核利潤,減少項目制軟硬件訂單銷售,鼓勵政企客戶優先使用公共云。接著,兩個月不到,也即今年1月,直接更名為政企事業部,而專有云產研、銷售、服務團隊并入,并成為一級部門,同時可銷售所有公共云產品。
這一變化說明阿里云不但沒有弱化政企,反而調集專有云上述單元重兵及公共云產品,直接將原混合云業務定義為政企事業部。這高度突出了它的行業屬性與地位。
外界很容易忽視組織升級背后圍繞政企業務展開的內部協同。一個快速變化的大模型時代,面對一個復雜的場景,不要說外部的系統集成隱含的協同脆弱性與交易成本,就連阿里云內部內部都經歷著這種深刻的變革。
有必要補一個視角。涉及領導力。提一下阿里云智能資深副總裁、政企事業部總裁李津。他加入阿里集團正好14年。最初4年多擔任集團技術保障部總監,隨后兩年轉崗至阿里云任飛天基礎產品研發資深總監兼行業線業務負責人。接著先后擔任阿里云中國區業務總裁、全球服務部總裁,長達7年。直到去年擔任現職。
想說的是,李津身上就展示了阿里云過去10年的變化。盡管他不是阿里云創始團隊,但他擁有全局視野,應該是核心崗位轉崗最多最完整的高管,覆蓋了核心產品飛天、行業業務一號位、中國業務一號位、全球服務尤其交付一號位。此前曾多次采訪他,他是一位技術、商業思維高度融合且擁有思想力的業務領軍人。
啰嗦這么多,好像繞遠了。這里絕對不是否定系統集成與開放性。
事實上,阿里云多年來一直不變的核心立場就是“被集成”。即便截至目前,阿里云政企業務也仍有與客戶共創、高定制的項目,也是集成形態。而無論飛天企業版,還是百煉專屬版2.0,內在同樣都有這種特質。前者向下兼容多芯異構,向上兼容應用生態;后者兼容多種大模型。
事實上,多年前,王堅博士就強調,飛天是“云計算操作系統”。這一定位,仍是目前新產品的核心立場。只是說,它融入了更強的PaaS尤其AIPaaS能力。但無論如何,它仍是開放的平臺。上面會長滿各種智能體應用生態。
這也是我們將阿里云“一體兩翼”的新方案稱為“政企行業AI+操作系統”與最高方法論的真正原由。
走向確定性增長
再回到文章開頭。看看阿里云政企事業部本財年有望扭虧為盈、上半年已完成全年目標消息,以及我們所做的斷言。
我們說該單元面向AI浪潮,已探索出一條富有協同效率的路徑,并在多個度釋放出新的發展動能。正是建立在政企行業AI+操作系統與最高落地方法論的基礎上。
過去,一些虧損的大集成項目,側重的是項目制軟硬件訂單銷售。這類項目不但交付難,建成后,也很難沉淀下能夠規模化復制的方案。它當然有利于拉動營收,吻合那個周期財務面的短期訴求。但很難持續。
此次云棲大會兩大重磅產品的公布,以及“一體兩翼”之下的融合形態的產品,已為阿里云政企業務創造出一條大模型規模化落地的路徑。
再加上2025年預期中的原生混合云,以及持續升級的百煉專屬版,當然也有部分公共云產品銷售,這一業務的增長將變得更可預期,更具確定性。
這一單元考核的并非是單純的規模。短期肯定還是要縮減虧損,正式走向盈利。但隨著模型應用與智能體生態壯大,它有望出現我們所做的斷言:2024年屬于阿里云政企業務重新定位、夯實產品與方法論、穩健經營的一年;2025年及之后,憑借原生混合云等平臺級產品及落地能力,有望呈現出營收與利潤規模并進的局面。
這一動向,也將有助于提升阿里云智能集團整體財務面質量。
2025Q1,盡管營收規模被阿里國際數字商業、菜鳥物流超越,但結合規模、利潤,考察整個增長的質量與平衡度,阿里云可謂高質量增長。剔除集團關聯交易,整體營收同比增6%;公共云營收同比增兩位數;AI相關產品營收連續兩季增幅達3位數;整個單元經調整EBITA同比增155%達23億。
財報會上,阿里集團CEO吳泳銘說,下半財年,阿里云整體增幅會上到兩位數,其中一半以上的增速貢獻,將來自AI產品相關帶動。由于AI產品的毛利相對有利,這其實暗示了營收與利潤雙增動向。
此前,夸克曾預判,本財年之后,阿里云有望呈現千億營收、百億凈利的局面。它將成為阿里集團又一頭現金奶牛。
云棲上,政企業務傳出近扭虧為盈、半年完成全年任務的消息,更是有利于阿里云整體財務目標的達成。隨著平臺級產品與大模型落地方法論走向成熟,這一單元未來有望貢獻更多。
夸克,最小的粒子,微末的洞察
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.