无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

為什么谷歌、百度,都在打造“新全棧”AI云

0
分享至


文:董指導(dǎo)

很多產(chǎn)業(yè)的加速,不是從技術(shù)發(fā)明那一刻開始,而是從路線收斂后才啟動(dòng)的。

就像智能手機(jī)的加速,是在產(chǎn)業(yè)認(rèn)知收斂到“大屏觸控+應(yīng)用生態(tài)”之后。開發(fā)者知道該為什么平臺(tái)寫應(yīng)用,芯片廠商知道該為移動(dòng)計(jì)算優(yōu)化,用戶也終于明白,手機(jī)不再只是通訊工具,而是隨身的計(jì)算平臺(tái)。各類資源集中方向,移動(dòng)浪潮撲面而來。

AI如今也走到了類似時(shí)刻。盡管底層技術(shù)仍在分叉、演進(jìn),但應(yīng)用共識(shí)正在收斂:AI 不能只會(huì)回答,還要能執(zhí)行;不能只做內(nèi)容生成器,還要進(jìn)入流程、調(diào)用工具、完成任務(wù)。

剛剛結(jié)束的Google I/O開發(fā)者大會(huì)上,谷歌宣布全面轉(zhuǎn)向AI智能體驅(qū)動(dòng)時(shí)代,并發(fā)布了個(gè)人智能體助手、智能體開發(fā)平臺(tái)等;

5月中旬的百度Create大會(huì),不僅發(fā)布了多款智能體,也發(fā)布了智能體時(shí)代的衡量指標(biāo)DAA(日活躍智能體數(shù));

DeepSeek也在陸續(xù)發(fā)布了智能體相關(guān)的崗位招聘。

每一次技術(shù)方向收斂,也都會(huì)帶來基礎(chǔ)設(shè)施重構(gòu)。

智能手機(jī)收斂到觸屏應(yīng)用生態(tài)后,移動(dòng)芯片、操作系統(tǒng)、應(yīng)用商店和移動(dòng)網(wǎng)絡(luò)被重構(gòu);電動(dòng)車收斂到純電智能平臺(tái)后,電池、電驅(qū)、域控和充電網(wǎng)絡(luò)成為新基礎(chǔ)設(shè)施。

當(dāng)AI應(yīng)用范式向智能體收斂后,云,作為基礎(chǔ)設(shè)施也必須重構(gòu)。因?yàn)橹悄荏w有新的負(fù)載管理、環(huán)境需求、成本管控等等。于是,業(yè)內(nèi)也在探索新全棧AI云。

理解這個(gè)變化,對(duì)于理解AI、智能體,都非常關(guān)鍵。

01 從聊天到做事,新的負(fù)載要求

一次對(duì)話問答很簡(jiǎn)單,但智能體更像一個(gè)項(xiàng)目經(jīng)理。

比如,銷售智能體要處理客戶線索,除了讀取資料、歷史記錄,還要查看庫(kù)存和價(jià)格政策,生成跟進(jìn)話術(shù),創(chuàng)建工單,提醒銷售,甚至把結(jié)果寫回系統(tǒng);

調(diào)度智能體要給工廠排產(chǎn),需要讀取訂單、庫(kù)存、設(shè)備狀態(tài)、工藝約束、交付時(shí)間、物流計(jì)劃,還要在產(chǎn)能、成本、交期之間做權(quán)衡,最后輸出方案,提交審批。

這就是一條任務(wù)鏈,包括目標(biāo)理解、任務(wù)拆解、數(shù)據(jù)檢索、工具調(diào)用、多輪推理、狀態(tài)保持、異常處理、結(jié)果校驗(yàn)等。也由此,帶來了新的云工作負(fù)載。

它有狀態(tài),不是每次都從零開始,要記住任務(wù)進(jìn)度、歷史偏好、上下文、長(zhǎng)期記憶等;

也是長(zhǎng)鏈路的,可能會(huì)持續(xù)幾小時(shí)、甚至跨天執(zhí)行的復(fù)雜的任務(wù);

有工具、跨系統(tǒng),必須連接瀏覽器、Office、數(shù)據(jù)庫(kù)、郵件、CRM、ERP、OA、工單系統(tǒng)等等;

既具有自主性,自己判斷下一步;但又有權(quán)限邊界,不能想看什么就看什么,想改什么就改什么;

還要可審計(jì),因?yàn)橐坏┲悄荏w進(jìn)入企業(yè)系統(tǒng),每一次查詢、每一次調(diào)用、每一次修改,都可能影響真實(shí)業(yè)務(wù),也必須可解釋、可回滾。

為了讓智能體更絲滑進(jìn)入生產(chǎn)環(huán)境,也需要基礎(chǔ)設(shè)施具備Harness “駕馭工程”,為智能體搭建腳手架。

對(duì)比而言,過去的云,承載的是應(yīng)用;大模型時(shí)代,AI云承載的是模型;而智能體時(shí)代,AI云要承載的是任務(wù)鏈。

這就是改變。

Google Cloud在報(bào)告《State of infrastructure in the agentic AI era》中也認(rèn)為,隨著智能體工作負(fù)載從試點(diǎn)轉(zhuǎn)向生產(chǎn),83%的組織需要升級(jí)基礎(chǔ)設(shè)施來支持生產(chǎn)級(jí)自主系統(tǒng)。

另外,智能體時(shí)代,Token(詞元)的性質(zhì),也和對(duì)話消耗不同。不再是計(jì)費(fèi)單位,更像生產(chǎn)資料。

這時(shí)的關(guān)鍵,是基礎(chǔ)設(shè)施要讓Token更智能。AI云,除了提供Token,更要能夠管理、組織Token,讓每一個(gè)token盡量轉(zhuǎn)化成有效動(dòng)作,而不是變成無意義的重復(fù)推理。就像百度智能云沈抖在Create大會(huì)上所說,AI云的下半場(chǎng),不是比誰消耗了更多tokens,而是比誰能用好每一個(gè)token。

簡(jiǎn)言之,智能體,不是一個(gè)應(yīng)用功能,而是一類基礎(chǔ)設(shè)施問題。

02 普及之路上的降本核心

隨著路徑收斂,技術(shù)要走進(jìn)大眾生活,還有另一個(gè)重要要素:成本夠低。

就像汽車,早期只是富人的玩具。流水線模式、T型車,大幅降低了單車成本,隨后才有了汽車時(shí)代的誕生;光伏,也是度電成本足夠下降后,才真正開啟了綠電時(shí)代;

云計(jì)算,也并不是因?yàn)榉?wù)器上云這個(gè)概念才贏得客戶,而是通過資源池化、彈性調(diào)度和按需付費(fèi)等方式,令單位算力成本大幅下降,才成為了基礎(chǔ)設(shè)施。

AI也逃不過這個(gè)規(guī)律。模型能力當(dāng)然重要、智能體也有價(jià)值,但真正的普及,還是需要成本足夠低。

降本之路,有幾個(gè)挑戰(zhàn):

首先要降低推理成本,一個(gè)重要方式是做好上下文管理。

智能體要處理的上下文長(zhǎng)度,是Chatbot的1000倍,還會(huì)隨任務(wù)輪次增加而不斷增加,一個(gè)任務(wù)動(dòng)輒燒百萬tokens。

合理的做法是,該檢索的檢索,該壓縮的壓縮,該緩存的緩存,該沉淀為長(zhǎng)期記憶的沉淀為長(zhǎng)期記憶。智能體需要的不是“讀完所有資料”,而是在正確時(shí)間拿到正確上下文。

比如,百度智能云就用Agent-First的理念重構(gòu)產(chǎn)品,盡可能減少token的重復(fù)計(jì)算,推理速度比市場(chǎng)水平快了25%。也通過顯存、內(nèi)存到SSD的分層池化,把KV Cache命中率做到90%

針對(duì)長(zhǎng)鏈路推理,也可以通過PD分離、緩存調(diào)度等方式,實(shí)現(xiàn)異構(gòu)調(diào)度提升推理性能。

谷歌I/O大會(huì)上,也專門強(qiáng)調(diào)了降低成本的重要性。一種做法是繼續(xù)提升大模型能力,大會(huì)上還提到如果頭部企業(yè)將80%的Token負(fù)載遷移至3.5 Flash,一年可節(jié)省10億美金。

其次,集群調(diào)度管理,也是成本管理的核心。這一點(diǎn)經(jīng)常被低估,但它會(huì)成為智能體時(shí)代AI云的核心能力。

訓(xùn)練的算力需求相對(duì)集中,推理的算力需求更加分散、差異化;而智能體的算力需求就更復(fù)雜了。它是長(zhǎng)鏈路任務(wù),涉及CPU、GPU、內(nèi)存、SSD、網(wǎng)絡(luò)、工具、數(shù)據(jù)庫(kù)等等之間來回切換。如果調(diào)度不好,算力就會(huì)極大浪費(fèi)。

最后是數(shù)據(jù)中心的效能管理。

現(xiàn)在動(dòng)輒是吉瓦級(jí)AIDC,規(guī)模擴(kuò)大的同時(shí),架構(gòu)也在變化。傳統(tǒng)數(shù)據(jù)中心的架構(gòu),以供配電為核心。今天的AIDC,核心是網(wǎng)絡(luò)。要確保計(jì)算與網(wǎng)絡(luò)距離最短,最大限度提升計(jì)算效率來降本。同時(shí),制冷系統(tǒng)、電力資源規(guī)劃等工程能力,也越來越重要。

這些挑戰(zhàn),都說明一個(gè)變化:云廠商之間,過去比誰有更多GPU,后來比誰的推理價(jià)格更低。接下來,真正重要的可能是:

誰能幫助客戶用更少token、更少算力、更少能耗,完成更多業(yè)務(wù)閉環(huán)。

03 為什么必須有“新全棧”?

全棧,這個(gè)詞已經(jīng)是耳熟能詳了。但如果要應(yīng)對(duì)智能體時(shí)代,可能還不夠。

因?yàn)橹悄荏w時(shí)代,成本、上下文、工具連接、模型調(diào)度、安全治理、任務(wù)評(píng)估,彼此擰在一起,這便給傳統(tǒng)“模塊化AI云”帶來煩惱:

如果只提供算力,企業(yè)還要自己找模型、搭RAG、接工具、管運(yùn)維等等。最后看似每個(gè)模塊都買到了,真正跑起來卻到處漏風(fēng);

如果只提供模型API,模型能回答問題,但不等于智能體能進(jìn)入企業(yè)系統(tǒng)干活;

如果只提供智能體開發(fā)平臺(tái),底層推理成本和集群效率又很難控制。智能體演示時(shí)很順,規(guī)模一上來,就問題繁多。

可以說,智能體不是“一個(gè)模型加幾個(gè)插件”,而是一條生產(chǎn)線,任何一環(huán)割裂,都會(huì)影響最后的任務(wù)完成率。因此,不僅需要全棧,更需要“新全棧”。

在國(guó)內(nèi),百度作為為數(shù)不多的“芯、云、模、體”全棧AI公司,在國(guó)內(nèi)最早喊出“全棧AI”理念。在前不久的Create2026大會(huì)上,又進(jìn)化為了“新全棧”AI云。

新的核心,就是面向大規(guī)模智能體應(yīng)用。他們提出兩條主線:

一條是每瓦性能更強(qiáng)、性價(jià)比更高的 AI Infra;另一條是單位token智能水平更好的Agent Infra

前者的亮點(diǎn)包括多個(gè)基于自研昆侖芯P800的萬卡集群,使得集群有效訓(xùn)練率達(dá)到97%,并對(duì)主流國(guó)產(chǎn)模型適配,通過優(yōu)化,令推理效率提升50%;通過網(wǎng)絡(luò)架構(gòu)迭代,端到端時(shí)延優(yōu)化了50%等。

后者的亮點(diǎn)則包括將MaaS模型服務(wù)升級(jí)為“Token Factory詞元工廠”,推理速度比市場(chǎng)水平快25%;優(yōu)化駕馭工程,令一整條執(zhí)行鏈路穩(wěn)定工作,比如辦公場(chǎng)景的工具調(diào)用成功率達(dá)到95%。

最終,模型、Harness、Skills和反饋數(shù)據(jù)形成飛輪,讓企業(yè)把每一個(gè)Token更高效地轉(zhuǎn)化為生產(chǎn)力。

這些變化也體現(xiàn)在了業(yè)績(jī)上。前幾天百度公布Q1財(cái)報(bào),AI業(yè)務(wù)收入136億元,同比增長(zhǎng)49%,而且首次超過一般性業(yè)務(wù)收入的一半。這其中,AI云業(yè)務(wù)收入88億元,同比增長(zhǎng)79%。GPU云收入更是同比增長(zhǎng)184%。

在海外,谷歌雖然沒有喊出“新全棧”的口號(hào),但在I/O大會(huì)上,也展現(xiàn)面向智能體重塑的全棧整合,從而消除智能體“生產(chǎn)線”上的所有摩擦力。

在最底層,自研TPU不斷迭代,訓(xùn)練、推理各有一款專門的芯片,性能越來越強(qiáng);模型層,Gemini 3 Flash版本,面向長(zhǎng)程智能體任務(wù),兼顧性能與速度;平臺(tái)層,也升級(jí)了Antigravity這個(gè)agent-first開發(fā)平臺(tái),用于編排和構(gòu)建智能體;

應(yīng)用層,最新的Gemini Spark是很有代表性的產(chǎn)品,定義是7X24小時(shí)運(yùn)行的個(gè)人AI智能體。可以在后臺(tái)工作、可以擴(kuò)展到第三方工具,而且可以運(yùn)行在谷歌云上,而不只是在本地窗口。除此之外,搜索、工作臺(tái)等等產(chǎn)品線,也都有智能體的更新。

谷歌生態(tài)內(nèi)每月處理的Token量高達(dá)3.2億億次,沒錯(cuò),單位里兩個(gè)億。擁有這么高吞吐量、還可以穩(wěn)定運(yùn)行、獲得用戶口碑、而且商業(yè)可行,就是谷歌全棧優(yōu)勢(shì)的最佳證明。

無論邏輯推演、實(shí)際應(yīng)用效果,還是財(cái)務(wù)數(shù)據(jù),都說明,智能體浪潮下,新全棧,不是廠商展示肌肉,而是產(chǎn)業(yè)基礎(chǔ)設(shè)施的必然形態(tài)。也會(huì)成為云廠商的分水嶺。

04 結(jié)尾

加拿大哲學(xué)家麥克盧漢,有一句常被引用的話:我們塑造工具,此后工具塑造我們。

汽車最初只是更快的馬車替代品,但它最終塑造了城市道路、郊區(qū)生活、物流體系和現(xiàn)代制造業(yè);互聯(lián)網(wǎng)最初只是信息傳輸網(wǎng)絡(luò),但最終塑造了商業(yè)、媒體、社交和全球協(xié)作方式;智能手機(jī)最初只是把電腦裝進(jìn)口袋,但它最終塑造了移動(dòng)支付、即時(shí)通訊、短視頻、外賣、本地生活,以及幾乎所有消費(fèi)互聯(lián)網(wǎng)的入口。

真正重要的技術(shù),從來不只是提高效率。更會(huì)改變?nèi)藗兘M織工作、分配資源、連接彼此的方式。

AI也如此。大模型塑造了人與機(jī)器的交互方式;而智能體,將成為新的任務(wù)執(zhí)行單元,深入我們的社會(huì),改變我們的生產(chǎn)關(guān)系。

趨勢(shì)必然來臨,而新全棧AI云,則是隨之迭代的基礎(chǔ)設(shè)施,托住需求、加速重塑。

-----------全文完。

理工/金融 復(fù)合背景

暢銷書《英偉達(dá)之道》譯者

百億私募/頭部自媒體 雙重經(jīng)歷

看清科技、商業(yè)本質(zhì),講出精彩故事

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
板橋水庫(kù)潰壩:24萬人一夜消逝,塵封28年,真相遠(yuǎn)比天災(zāi)殘酷

板橋水庫(kù)潰壩:24萬人一夜消逝,塵封28年,真相遠(yuǎn)比天災(zāi)殘酷

小玡說故事
2026-05-15 20:07:35
退休最好方式不是閑逛、打牌,而是在60~65歲這五年,規(guī)劃好這4點(diǎn)

退休最好方式不是閑逛、打牌,而是在60~65歲這五年,規(guī)劃好這4點(diǎn)

小鹿姐姐情感說
2026-05-26 12:01:26
瓦爾迪歸來!萊斯特傳奇39歲目標(biāo)重返英超

瓦爾迪歸來!萊斯特傳奇39歲目標(biāo)重返英超

綠茵情報(bào)局
2026-05-27 05:17:50
從5人到0人:皇馬在西班牙隊(duì)的消亡史,不止是一份名單那么簡(jiǎn)單

從5人到0人:皇馬在西班牙隊(duì)的消亡史,不止是一份名單那么簡(jiǎn)單

落夜足球
2026-05-26 16:46:48
告別潮濕悶熱 上海開啟晴好模式

告別潮濕悶熱 上海開啟晴好模式

魯中晨報(bào)
2026-05-27 07:26:46
韓國(guó)超模自曝身材煩惱:太豐滿也是一種負(fù)擔(dān),1個(gè)穿搭秘訣化解困擾

韓國(guó)超模自曝身材煩惱:太豐滿也是一種負(fù)擔(dān),1個(gè)穿搭秘訣化解困擾

赴一場(chǎng)山海啊
2026-05-25 00:12:48
連戰(zhàn)方面確認(rèn)不和解后,多名藍(lán)營(yíng)大佬表態(tài),王金平喊話?cǎi)R英九一事

連戰(zhàn)方面確認(rèn)不和解后,多名藍(lán)營(yíng)大佬表態(tài),王金平喊話?cǎi)R英九一事

一口娛樂
2026-05-26 16:49:37
97年我跑長(zhǎng)途捎了一位尼姑,尼姑下車時(shí)送我三句話,三年后全應(yīng)驗(yàn)

97年我跑長(zhǎng)途捎了一位尼姑,尼姑下車時(shí)送我三句話,三年后全應(yīng)驗(yàn)

千秋文化
2026-04-29 19:09:51
曼聯(lián)又被截胡!切爾西砸 5000 萬搶世界前三王牌!去年就鐵心加盟

曼聯(lián)又被截胡!切爾西砸 5000 萬搶世界前三王牌!去年就鐵心加盟

瀾歸序
2026-05-27 06:01:17
波多野結(jié)衣公開擇偶標(biāo)準(zhǔn),想嫁給中國(guó)男人,她遠(yuǎn)比你想象的更優(yōu)秀

波多野結(jié)衣公開擇偶標(biāo)準(zhǔn),想嫁給中國(guó)男人,她遠(yuǎn)比你想象的更優(yōu)秀

花哥扒娛樂
2026-05-14 20:10:50
宏遠(yuǎn)速遞!朱芳雨深夜發(fā)聲,杜鋒續(xù)約受影響,焦泊喬留隊(duì)幾率大增

宏遠(yuǎn)速遞!朱芳雨深夜發(fā)聲,杜鋒續(xù)約受影響,焦泊喬留隊(duì)幾率大增

多特體育說
2026-05-27 11:43:19
鄒市明冉瑩穎同步發(fā)文:7年敗光2億,二人最終還是邁出了這一步!

鄒市明冉瑩穎同步發(fā)文:7年敗光2億,二人最終還是邁出了這一步!

拳擊時(shí)空
2026-05-27 04:59:52
N長(zhǎng)進(jìn)漲超1500% 單簽盈利達(dá)30萬

N長(zhǎng)進(jìn)漲超1500% 單簽盈利達(dá)30萬

每日經(jīng)濟(jì)新聞
2026-05-27 09:45:15
香港明星豪宅太假,陳凱琳請(qǐng)客,十幾個(gè)人把餐廳擠得跟個(gè)卡座似的

香港明星豪宅太假,陳凱琳請(qǐng)客,十幾個(gè)人把餐廳擠得跟個(gè)卡座似的

西樓知趣雜談
2026-05-26 21:49:36
白鹿原網(wǎng)紅“孤獨(dú)樹”被砍掉枝葉變“禿頭”,村委會(huì):打卡游客太多踩壞麥田,村民不得已砍掉樹枝

白鹿原網(wǎng)紅“孤獨(dú)樹”被砍掉枝葉變“禿頭”,村委會(huì):打卡游客太多踩壞麥田,村民不得已砍掉樹枝

極目新聞
2026-05-27 12:01:03
問政四川丨47萬元電車行駛中動(dòng)力中斷,車主質(zhì)疑存在重大安全隱患,4S店拒換車?記者調(diào)查

問政四川丨47萬元電車行駛中動(dòng)力中斷,車主質(zhì)疑存在重大安全隱患,4S店拒換車?記者調(diào)查

新浪財(cái)經(jīng)
2026-05-26 18:56:13
爭(zhēng)議合集:漏判雷霆干擾+球權(quán)判錯(cuò)+未給馬刺挑戰(zhàn)+給雷霆5罰

爭(zhēng)議合集:漏判雷霆干擾+球權(quán)判錯(cuò)+未給馬刺挑戰(zhàn)+給雷霆5罰

硯底沉香
2026-05-27 12:40:45
團(tuán)長(zhǎng)來縣里看我,見我在夜市擺攤,第二天市委組織部通知我去報(bào)到

團(tuán)長(zhǎng)來縣里看我,見我在夜市擺攤,第二天市委組織部通知我去報(bào)到

千秋文化
2026-05-14 20:38:51
浙江44歲男子突然性情大變,工作場(chǎng)合頻繁開低俗玩笑,醫(yī)生提醒:神經(jīng)梅毒,極易被誤診

浙江44歲男子突然性情大變,工作場(chǎng)合頻繁開低俗玩笑,醫(yī)生提醒:神經(jīng)梅毒,極易被誤診

都市快報(bào)橙柿互動(dòng)
2026-05-26 19:46:41
快訊!鄭欽文的“失敗”是必然結(jié)果!

快訊!鄭欽文的“失敗”是必然結(jié)果!

達(dá)文西看世界
2026-05-27 12:37:02
2026-05-27 14:55:00
董指導(dǎo)聊科技 incentive-icons
董指導(dǎo)聊科技
遠(yuǎn)川研究所原所長(zhǎng),得到APP“光伏產(chǎn)業(yè)報(bào)告”主理人,多家公司產(chǎn)業(yè)研究顧問。聚焦科技、能源領(lǐng)域。
143文章數(shù) 16關(guān)注度
往期回顧 全部

科技要聞

韜定律:全球在卷納米數(shù) 華為換了一把尺子

頭條要聞

專家:全國(guó)多地降雨量突破歷史極值 這是一種異常現(xiàn)象

頭條要聞

專家:全國(guó)多地降雨量突破歷史極值 這是一種異常現(xiàn)象

體育要聞

這群老阿姨,是最硬核的馬刺球迷

娛樂要聞

小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

財(cái)經(jīng)要聞

ST巖石退市背后:A股“炒殼”時(shí)代終結(jié)

汽車要聞

極狐問道V9今日將正式上市 搭載華為雪鸮增程系統(tǒng)

態(tài)度原創(chuàng)

時(shí)尚
教育
藝術(shù)
數(shù)碼
手機(jī)

多巴胺“粉”,赫本是這樣穿的!

教育要聞

4個(gè)有效的課堂激勵(lì)手段,簡(jiǎn)單又好用!

藝術(shù)要聞

這個(gè)夏天去蘇州過幾天清閑安逸的日子

數(shù)碼要聞

買顯卡送真黃金!技嘉40周年RTX 5090促銷:買就贈(zèng)1克999純金

手機(jī)要聞

魅族科技官宣手機(jī)服務(wù)堅(jiān)守如初,稱官方售后等依然會(huì)持續(xù)提供保障

無障礙瀏覽 進(jìn)入關(guān)懷版