![]()
文:董指導(dǎo)
很多產(chǎn)業(yè)的加速,不是從技術(shù)發(fā)明那一刻開始,而是從路線收斂后才啟動(dòng)的。
就像智能手機(jī)的加速,是在產(chǎn)業(yè)認(rèn)知收斂到“大屏觸控+應(yīng)用生態(tài)”之后。開發(fā)者知道該為什么平臺(tái)寫應(yīng)用,芯片廠商知道該為移動(dòng)計(jì)算優(yōu)化,用戶也終于明白,手機(jī)不再只是通訊工具,而是隨身的計(jì)算平臺(tái)。各類資源集中方向,移動(dòng)浪潮撲面而來。
AI如今也走到了類似時(shí)刻。盡管底層技術(shù)仍在分叉、演進(jìn),但應(yīng)用共識(shí)正在收斂:AI 不能只會(huì)回答,還要能執(zhí)行;不能只做內(nèi)容生成器,還要進(jìn)入流程、調(diào)用工具、完成任務(wù)。
剛剛結(jié)束的Google I/O開發(fā)者大會(huì)上,谷歌宣布全面轉(zhuǎn)向AI智能體驅(qū)動(dòng)時(shí)代,并發(fā)布了個(gè)人智能體助手、智能體開發(fā)平臺(tái)等;
5月中旬的百度Create大會(huì),不僅發(fā)布了多款智能體,也發(fā)布了智能體時(shí)代的衡量指標(biāo)DAA(日活躍智能體數(shù));
DeepSeek也在陸續(xù)發(fā)布了智能體相關(guān)的崗位招聘。
每一次技術(shù)方向收斂,也都會(huì)帶來基礎(chǔ)設(shè)施重構(gòu)。
智能手機(jī)收斂到觸屏應(yīng)用生態(tài)后,移動(dòng)芯片、操作系統(tǒng)、應(yīng)用商店和移動(dòng)網(wǎng)絡(luò)被重構(gòu);電動(dòng)車收斂到純電智能平臺(tái)后,電池、電驅(qū)、域控和充電網(wǎng)絡(luò)成為新基礎(chǔ)設(shè)施。
當(dāng)AI應(yīng)用范式向智能體收斂后,云,作為基礎(chǔ)設(shè)施也必須重構(gòu)。因?yàn)橹悄荏w有新的負(fù)載管理、環(huán)境需求、成本管控等等。于是,業(yè)內(nèi)也在探索新全棧AI云。
理解這個(gè)變化,對(duì)于理解AI、智能體,都非常關(guān)鍵。
01 從聊天到做事,新的負(fù)載要求
一次對(duì)話問答很簡(jiǎn)單,但智能體更像一個(gè)項(xiàng)目經(jīng)理。
比如,銷售智能體要處理客戶線索,除了讀取資料、歷史記錄,還要查看庫(kù)存和價(jià)格政策,生成跟進(jìn)話術(shù),創(chuàng)建工單,提醒銷售,甚至把結(jié)果寫回系統(tǒng);
調(diào)度智能體要給工廠排產(chǎn),需要讀取訂單、庫(kù)存、設(shè)備狀態(tài)、工藝約束、交付時(shí)間、物流計(jì)劃,還要在產(chǎn)能、成本、交期之間做權(quán)衡,最后輸出方案,提交審批。
這就是一條任務(wù)鏈,包括目標(biāo)理解、任務(wù)拆解、數(shù)據(jù)檢索、工具調(diào)用、多輪推理、狀態(tài)保持、異常處理、結(jié)果校驗(yàn)等。也由此,帶來了新的云工作負(fù)載。
它有狀態(tài),不是每次都從零開始,要記住任務(wù)進(jìn)度、歷史偏好、上下文、長(zhǎng)期記憶等;
也是長(zhǎng)鏈路的,可能會(huì)持續(xù)幾小時(shí)、甚至跨天執(zhí)行的復(fù)雜的任務(wù);
有工具、跨系統(tǒng),必須連接瀏覽器、Office、數(shù)據(jù)庫(kù)、郵件、CRM、ERP、OA、工單系統(tǒng)等等;
既具有自主性,自己判斷下一步;但又有權(quán)限邊界,不能想看什么就看什么,想改什么就改什么;
還要可審計(jì),因?yàn)橐坏┲悄荏w進(jìn)入企業(yè)系統(tǒng),每一次查詢、每一次調(diào)用、每一次修改,都可能影響真實(shí)業(yè)務(wù),也必須可解釋、可回滾。
為了讓智能體更絲滑進(jìn)入生產(chǎn)環(huán)境,也需要基礎(chǔ)設(shè)施具備Harness “駕馭工程”,為智能體搭建腳手架。
對(duì)比而言,過去的云,承載的是應(yīng)用;大模型時(shí)代,AI云承載的是模型;而智能體時(shí)代,AI云要承載的是任務(wù)鏈。
這就是改變。
Google Cloud在報(bào)告《State of infrastructure in the agentic AI era》中也認(rèn)為,隨著智能體工作負(fù)載從試點(diǎn)轉(zhuǎn)向生產(chǎn),83%的組織需要升級(jí)基礎(chǔ)設(shè)施來支持生產(chǎn)級(jí)自主系統(tǒng)。
另外,智能體時(shí)代,Token(詞元)的性質(zhì),也和對(duì)話消耗不同。不再是計(jì)費(fèi)單位,更像生產(chǎn)資料。
這時(shí)的關(guān)鍵,是基礎(chǔ)設(shè)施要讓Token更智能。AI云,除了提供Token,更要能夠管理、組織Token,讓每一個(gè)token盡量轉(zhuǎn)化成有效動(dòng)作,而不是變成無意義的重復(fù)推理。就像百度智能云沈抖在Create大會(huì)上所說,AI云的下半場(chǎng),不是比誰消耗了更多tokens,而是比誰能用好每一個(gè)token。
簡(jiǎn)言之,智能體,不是一個(gè)應(yīng)用功能,而是一類基礎(chǔ)設(shè)施問題。
02 普及之路上的降本核心
隨著路徑收斂,技術(shù)要走進(jìn)大眾生活,還有另一個(gè)重要要素:成本夠低。
就像汽車,早期只是富人的玩具。流水線模式、T型車,大幅降低了單車成本,隨后才有了汽車時(shí)代的誕生;光伏,也是度電成本足夠下降后,才真正開啟了綠電時(shí)代;
云計(jì)算,也并不是因?yàn)榉?wù)器上云這個(gè)概念才贏得客戶,而是通過資源池化、彈性調(diào)度和按需付費(fèi)等方式,令單位算力成本大幅下降,才成為了基礎(chǔ)設(shè)施。
AI也逃不過這個(gè)規(guī)律。模型能力當(dāng)然重要、智能體也有價(jià)值,但真正的普及,還是需要成本足夠低。
降本之路,有幾個(gè)挑戰(zhàn):
首先要降低推理成本,一個(gè)重要方式是做好上下文管理。
智能體要處理的上下文長(zhǎng)度,是Chatbot的1000倍,還會(huì)隨任務(wù)輪次增加而不斷增加,一個(gè)任務(wù)動(dòng)輒燒百萬tokens。
合理的做法是,該檢索的檢索,該壓縮的壓縮,該緩存的緩存,該沉淀為長(zhǎng)期記憶的沉淀為長(zhǎng)期記憶。智能體需要的不是“讀完所有資料”,而是在正確時(shí)間拿到正確上下文。
比如,百度智能云就用Agent-First的理念重構(gòu)產(chǎn)品,盡可能減少token的重復(fù)計(jì)算,推理速度比市場(chǎng)水平快了25%。也通過顯存、內(nèi)存到SSD的分層池化,把KV Cache命中率做到90%。
針對(duì)長(zhǎng)鏈路推理,也可以通過PD分離、緩存調(diào)度等方式,實(shí)現(xiàn)異構(gòu)調(diào)度提升推理性能。
谷歌I/O大會(huì)上,也專門強(qiáng)調(diào)了降低成本的重要性。一種做法是繼續(xù)提升大模型能力,大會(huì)上還提到如果頭部企業(yè)將80%的Token負(fù)載遷移至3.5 Flash,一年可節(jié)省10億美金。
其次,集群調(diào)度管理,也是成本管理的核心。這一點(diǎn)經(jīng)常被低估,但它會(huì)成為智能體時(shí)代AI云的核心能力。
訓(xùn)練的算力需求相對(duì)集中,推理的算力需求更加分散、差異化;而智能體的算力需求就更復(fù)雜了。它是長(zhǎng)鏈路任務(wù),涉及CPU、GPU、內(nèi)存、SSD、網(wǎng)絡(luò)、工具、數(shù)據(jù)庫(kù)等等之間來回切換。如果調(diào)度不好,算力就會(huì)極大浪費(fèi)。
最后是數(shù)據(jù)中心的效能管理。
現(xiàn)在動(dòng)輒是吉瓦級(jí)AIDC,規(guī)模擴(kuò)大的同時(shí),架構(gòu)也在變化。傳統(tǒng)數(shù)據(jù)中心的架構(gòu),以供配電為核心。今天的AIDC,核心是網(wǎng)絡(luò)。要確保計(jì)算與網(wǎng)絡(luò)距離最短,最大限度提升計(jì)算效率來降本。同時(shí),制冷系統(tǒng)、電力資源規(guī)劃等工程能力,也越來越重要。
這些挑戰(zhàn),都說明一個(gè)變化:云廠商之間,過去比誰有更多GPU,后來比誰的推理價(jià)格更低。接下來,真正重要的可能是:
誰能幫助客戶用更少token、更少算力、更少能耗,完成更多業(yè)務(wù)閉環(huán)。
03 為什么必須有“新全棧”?
全棧,這個(gè)詞已經(jīng)是耳熟能詳了。但如果要應(yīng)對(duì)智能體時(shí)代,可能還不夠。
因?yàn)橹悄荏w時(shí)代,成本、上下文、工具連接、模型調(diào)度、安全治理、任務(wù)評(píng)估,彼此擰在一起,這便給傳統(tǒng)“模塊化AI云”帶來煩惱:
如果只提供算力,企業(yè)還要自己找模型、搭RAG、接工具、管運(yùn)維等等。最后看似每個(gè)模塊都買到了,真正跑起來卻到處漏風(fēng);
如果只提供模型API,模型能回答問題,但不等于智能體能進(jìn)入企業(yè)系統(tǒng)干活;
如果只提供智能體開發(fā)平臺(tái),底層推理成本和集群效率又很難控制。智能體演示時(shí)很順,規(guī)模一上來,就問題繁多。
可以說,智能體不是“一個(gè)模型加幾個(gè)插件”,而是一條生產(chǎn)線,任何一環(huán)割裂,都會(huì)影響最后的任務(wù)完成率。因此,不僅需要全棧,更需要“新全棧”。
在國(guó)內(nèi),百度作為為數(shù)不多的“芯、云、模、體”全棧AI公司,在國(guó)內(nèi)最早喊出“全棧AI”理念。在前不久的Create2026大會(huì)上,又進(jìn)化為了“新全棧”AI云。
新的核心,就是面向大規(guī)模智能體應(yīng)用。他們提出兩條主線:
一條是每瓦性能更強(qiáng)、性價(jià)比更高的 AI Infra;另一條是單位token智能水平更好的Agent Infra。
前者的亮點(diǎn)包括多個(gè)基于自研昆侖芯P800的萬卡集群,使得集群有效訓(xùn)練率達(dá)到97%,并對(duì)主流國(guó)產(chǎn)模型適配,通過優(yōu)化,令推理效率提升50%;通過網(wǎng)絡(luò)架構(gòu)迭代,端到端時(shí)延優(yōu)化了50%等。
后者的亮點(diǎn)則包括將MaaS模型服務(wù)升級(jí)為“Token Factory詞元工廠”,推理速度比市場(chǎng)水平快25%;優(yōu)化駕馭工程,令一整條執(zhí)行鏈路穩(wěn)定工作,比如辦公場(chǎng)景的工具調(diào)用成功率達(dá)到95%。
最終,模型、Harness、Skills和反饋數(shù)據(jù)形成飛輪,讓企業(yè)把每一個(gè)Token更高效地轉(zhuǎn)化為生產(chǎn)力。
這些變化也體現(xiàn)在了業(yè)績(jī)上。前幾天百度公布Q1財(cái)報(bào),AI業(yè)務(wù)收入136億元,同比增長(zhǎng)49%,而且首次超過一般性業(yè)務(wù)收入的一半。這其中,AI云業(yè)務(wù)收入88億元,同比增長(zhǎng)79%。GPU云收入更是同比增長(zhǎng)184%。
在海外,谷歌雖然沒有喊出“新全棧”的口號(hào),但在I/O大會(huì)上,也展現(xiàn)面向智能體重塑的全棧整合,從而消除智能體“生產(chǎn)線”上的所有摩擦力。
在最底層,自研TPU不斷迭代,訓(xùn)練、推理各有一款專門的芯片,性能越來越強(qiáng);模型層,Gemini 3 Flash版本,面向長(zhǎng)程智能體任務(wù),兼顧性能與速度;平臺(tái)層,也升級(jí)了Antigravity這個(gè)agent-first開發(fā)平臺(tái),用于編排和構(gòu)建智能體;
應(yīng)用層,最新的Gemini Spark是很有代表性的產(chǎn)品,定義是7X24小時(shí)運(yùn)行的個(gè)人AI智能體。可以在后臺(tái)工作、可以擴(kuò)展到第三方工具,而且可以運(yùn)行在谷歌云上,而不只是在本地窗口。除此之外,搜索、工作臺(tái)等等產(chǎn)品線,也都有智能體的更新。
谷歌生態(tài)內(nèi)每月處理的Token量高達(dá)3.2億億次,沒錯(cuò),單位里兩個(gè)億。擁有這么高吞吐量、還可以穩(wěn)定運(yùn)行、獲得用戶口碑、而且商業(yè)可行,就是谷歌全棧優(yōu)勢(shì)的最佳證明。
無論邏輯推演、實(shí)際應(yīng)用效果,還是財(cái)務(wù)數(shù)據(jù),都說明,智能體浪潮下,新全棧,不是廠商展示肌肉,而是產(chǎn)業(yè)基礎(chǔ)設(shè)施的必然形態(tài)。也會(huì)成為云廠商的分水嶺。
04 結(jié)尾
加拿大哲學(xué)家麥克盧漢,有一句常被引用的話:我們塑造工具,此后工具塑造我們。
汽車最初只是更快的馬車替代品,但它最終塑造了城市道路、郊區(qū)生活、物流體系和現(xiàn)代制造業(yè);互聯(lián)網(wǎng)最初只是信息傳輸網(wǎng)絡(luò),但最終塑造了商業(yè)、媒體、社交和全球協(xié)作方式;智能手機(jī)最初只是把電腦裝進(jìn)口袋,但它最終塑造了移動(dòng)支付、即時(shí)通訊、短視頻、外賣、本地生活,以及幾乎所有消費(fèi)互聯(lián)網(wǎng)的入口。
真正重要的技術(shù),從來不只是提高效率。更會(huì)改變?nèi)藗兘M織工作、分配資源、連接彼此的方式。
AI也如此。大模型塑造了人與機(jī)器的交互方式;而智能體,將成為新的任務(wù)執(zhí)行單元,深入我們的社會(huì),改變我們的生產(chǎn)關(guān)系。
趨勢(shì)必然來臨,而新全棧AI云,則是隨之迭代的基礎(chǔ)設(shè)施,托住需求、加速重塑。
-----------全文完。
理工/金融 復(fù)合背景
暢銷書《英偉達(dá)之道》譯者
百億私募/頭部自媒體 雙重經(jīng)歷
看清科技、商業(yè)本質(zhì),講出精彩故事
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.