網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

當智能體需要無處不在，算力該如何多端流轉(zhuǎn)？

2026-06-03 13:13:23　來源: 光錐智能

北京舉報

分享至

云與邊緣融合為一個統(tǒng)一的系統(tǒng)，構(gòu)建一個計算的連續(xù)體。

文｜劉俊宏

編｜王一粟

一只龍蝦引爆了Token經(jīng)濟學。

2026年初，智能體OpenClaw（龍蝦）改變了所有AI公司的商業(yè)模式。

AI開始從“被動響應(yīng)”邁向“自主行動”。用戶不再滿足于讓AI“回答問題”，而是要求它能規(guī)劃任務(wù)、調(diào)用API、跨系統(tǒng)協(xié)作、甚至在物理世界執(zhí)行動作。

智能體不再是云端一個大模型，而是分裂成一群小助手，實時在手機、PC、機器人等邊緣設(shè)備、云端之間跑來跑去，幫你訂機票、開車、做實驗。

智能體不僅是無處不在，還會自主運行、互相協(xié)同。這就帶來了許多新的算力需求和挑戰(zhàn)。

首先，是智能體自主運行，與軟件交互的速度遠超人類。在所有工作流中，Token將以機器速度生成，而非人類速度。

“2026年，全球每10秒約317億Token需求；到2030年，同樣是每10秒，這一數(shù)值將達到1.27萬億，增幅高達40倍。而這一爆發(fā)式增長，正是由智能體AI生成的海量Token所驅(qū)動。”高通CEO安蒙預測。

另外，無處不在的智能體AI，分布式地流轉(zhuǎn)在不同設(shè)備之間，要的是一個無處不在、能夠提供連續(xù)服務(wù)的計算平臺。

“我們不會再單獨去談云端與邊緣，因為它們將融合成為一個統(tǒng)一的系統(tǒng)。”高通認為，云與邊緣不是非此即彼。安蒙在發(fā)言中稱，“AI是在云端還是在邊緣側(cè)運行，是由智能體來決定。計算資源將被充分利用，AI將在所有設(shè)備上運行。”

這就意味著，推理能力將被分布到最合適的位置，在token成本、功耗、延遲和隱私之間實現(xiàn)最優(yōu)平衡。

智能體時代已來所有設(shè)備都將成為AI的端點

機器人，被看作是智能體在物理世界的最佳載體之一。

2026年，機器人的智能被分成了三層。其中，第一層是即時執(zhí)行，對應(yīng)人類不需要思考的動作，例如站穩(wěn)腳跟；第二層是具體動作執(zhí)行，這部分對應(yīng)機器人跟場景的交互，例如跳舞；第三層是邏輯推理，這部分對應(yīng)真實世界物理關(guān)系的理解，例如推理一個完整任務(wù)并理解前因后果。

三層智能層層遞進又相互補充，安蒙總結(jié)說：“研發(fā)機器人不只是研發(fā)它的‘大腦’，還需要配備核心計算單元、運動控制模塊，以及各類驅(qū)動執(zhí)行能力。想要在機器人領(lǐng)域取得成功，你必須懂得如何將其設(shè)計為一套分層式計算系統(tǒng)。”

同樣的現(xiàn)象，也出現(xiàn)在智能汽車上。在此前，智能汽車和座艙互不相干，而在2026年艙駕一體成為關(guān)鍵詞之后，汽車智能也變成了一個由兩層級智能整合的系統(tǒng)，用戶現(xiàn)在可以直接用語音讓汽車啟動智駕。

這場改變的原因，就是AI智能體讓之前只能當Chatbot的AI能直接辦事。“AI正從簡單響應(yīng)指令、輔助人機交互的工具，進化為能夠自主采取行動的系統(tǒng)。這是AI正在演進的方向，并將迎來前所未有的規(guī)模化普及。”安蒙說。這也是為什么高通將2026看作是“智能體之年”。

但同時，在看到端側(cè)開始逐漸承載運行智能體的需求之后，安蒙也意識到當下所有的算力廠商面臨前所未有的機遇和挑戰(zhàn)，“它正在重塑計算架構(gòu)，將催生對新型設(shè)備和計算能力的巨大需求，而這一升級周期，有望成為行業(yè)有史以來規(guī)模最大的周期之一。”

事實上，在過去的三年里終端硬件廠商做了不少AI落地的鋪墊。

例如從2024年底開始，手機和PC行業(yè)就大量在設(shè)備中集成NPU，智能汽車座艙和智駕芯片的算力參數(shù)也變得越來越大。但現(xiàn)實是，許多PC的NPU算力調(diào)度還很有限，手機的各種AI功能大部分還要默認聯(lián)網(wǎng)執(zhí)行，用戶對端側(cè)AI實際的使用感知非常有限。

但在智能體時代，或許這些之前準備好的基礎(chǔ)設(shè)施終于要真正用起來了。

“這些設(shè)備都將成為智能體的端點（endpoint）。而且，智能體也不會受限于任何單一設(shè)備或單一生態(tài)系統(tǒng)。所有能夠?qū)⒂脩襞c智能體連接起來的一切，都將成為AI的端點。”

正如安蒙所說。當智能體需要在設(shè)備上即時響應(yīng)、自主規(guī)劃、跨應(yīng)用執(zhí)行復雜任務(wù)時，端側(cè)平臺必須成為智能體能夠原生棲息的運行環(huán)境。如此一來，由智能體主導的工作流就能將任務(wù)分布到最合適的位置——終端設(shè)備、邊緣側(cè)、本地服務(wù)器以及云端。

這意味著，當AI開始主導“自己”的工作，開始調(diào)動多個云側(cè)和端側(cè)AI設(shè)備來共同提供算力。那之前單一堆疊AI加速器的方法將不再適用，AI計算平臺必須進行系統(tǒng)級的重新設(shè)計。

計算連續(xù)體智能體AI新基建

當智能體代替人類操控，需要什么樣的新基建？

云端、手機端、PC端、車端，智能體的計算該怎么協(xié)同分配？

高通給出的答案是“計算連續(xù)體”，讓智能體在整個算力鏈條里面自由流轉(zhuǎn)。

這套方案并不只是簡單的算力分攤，讓不同環(huán)節(jié)的AI終端共同產(chǎn)出Token。而是一套讓推理能力被分布到最合適的位置，在單Token成本、功耗、延遲和隱私之間取得最優(yōu)平衡的全新基建體系。

這種認識，也是當下算力基礎(chǔ)設(shè)施廠商的共識。

例如AWS OpenSearch Service總經(jīng)理Tia White近日在LinkedIn發(fā)帖稱，智能體的通信需求跟人類完全不一樣，“它們可能毫無征兆地出現(xiàn)流量峰值，也可能悄然進入空閑狀態(tài)”。而面對智能體產(chǎn)生的數(shù)據(jù)流量對現(xiàn)有計算網(wǎng)絡(luò)的沖擊，邊緣計算公司Cloudflare高級產(chǎn)品經(jīng)理Lai Yi Ohlsen表示：“非人類流量將在2027年上半年的某個時候超過人類流量。”

重塑整個計算鏈路的好處，Omdia在一份報告中指出，通過在設(shè)備間分布式部署AI能力，80%的本地處理率可將云端運營成本從55億美元降至約12億美元，每年節(jié)省43億美元，同時改善延遲、能效和可靠性。

這項改造具體如何實現(xiàn)？高通在本次大會上提供了一套包含“三大支柱”的解決方案。

首先，第一支柱是“規(guī)模化覆蓋”，這回答的是“智能體到底在哪運行”。

在高通的構(gòu)想中，智能體不會局限于某一位置，而是需要在終端設(shè)備、邊緣、本地環(huán)境和數(shù)據(jù)中心之間動態(tài)遷移。高通在其中負責提供統(tǒng)一架構(gòu)，算力平臺覆蓋從毫瓦級（終端側(cè)）到千瓦級（數(shù)據(jù)中心），使推理與規(guī)劃工作負載在各層級之間實現(xiàn)無縫流動。

這種智能體原生的基礎(chǔ)設(shè)施，能支撐智能體運行時的流量爆發(fā)。基于高通計算平臺的統(tǒng)一調(diào)度，Token的生成就可以避免傳統(tǒng)云端的單點瓶頸或端側(cè)算力比較小的天花板。進而在保證AI性能的同時降低總體成本，并保持響應(yīng)速度。

整套流程，簡單來說就像是解一道數(shù)學題。之前是博士生提供完整答案，但高通的思路是博士生負責給出解題思路，研究生負責列算式，大學生負責每一步計算。

更重要的是，由于整個計算平臺都在高通的架構(gòu)內(nèi)，這就像是整個團隊“心有靈犀”。在端側(cè)和云端融合之后，智能體還能獲得跨層級的一致性，進一步保證運算效果又快，還不會“跑偏”。

高通給出的第二支柱，是“原生AI設(shè)備及系統(tǒng)”，這回答的是“智能體應(yīng)用怎么落地”。

畢竟，用戶是需要通過具體的終端設(shè)備來使用AI的。這代表著智能體在設(shè)備上提供始終在線的服務(wù)，必須滿足即時性能、隱私保護和可靠性三重約束。換句話說，就是要想實現(xiàn)AI聰明地“到處跑”（規(guī)模化覆蓋），就必須要先讓設(shè)備天生“會AI”（原生系統(tǒng)）。

高通在這一層的布局覆蓋了智能手機、AI PC、可穿戴設(shè)備、智能汽車、機器人、邊緣推理設(shè)備以及面向新形態(tài)的系統(tǒng)級設(shè)計。

在PC上，高通這次帶來了面向入門級PC的驍龍C平臺；在具身智能領(lǐng)域，高通展示了高性能機器人參考設(shè)計平臺高通躍龍IQ10 RRD。最令人意外的是，高通這次還正式公布了面向數(shù)據(jù)中心的新品牌——高通飛龍（Dragonfly）。從個人設(shè)備，到數(shù)據(jù)中心，高通的計算平臺即將實現(xiàn)閉環(huán)。

值得注意的是，高通在這些業(yè)務(wù)領(lǐng)域都落地了高性能CPU和推理專用加速器。這讓每一種產(chǎn)品都能夠提供智能體規(guī)劃所需的通用計算和處理人工智能神經(jīng)網(wǎng)絡(luò)推理的能力。

不僅如此，高通的計算平臺一如既往地能夠兼顧成本和功耗控制，讓消費者能夠以高性價比買到智能體長時間的陪伴。

“每種設(shè)備都需要合適的AI平臺，因為它們各不相同、用途上也存在差異。關(guān)鍵在于讓智能和能效在任何地方都實現(xiàn)最大化。”安蒙總結(jié)說。

最后一個支柱是“智能連接”，這回答的是“智能體之間如何協(xié)同”。

當端側(cè)設(shè)備都具有AI能力，連接本身也必須具備智能。如果說前面兩大支柱都還在智能體的計算層面，那么連接讓智能體能夠互相聊天、實時合作，就像一群小分隊在戰(zhàn)場上瞬間協(xié)同作戰(zhàn)。

這一點，Omdia在報告中也指出，要實現(xiàn)AI的有效規(guī)模化，科技行業(yè)需要優(yōu)先發(fā)展跨設(shè)備的協(xié)同規(guī)劃能力，整合邊緣系統(tǒng)與云服務(wù)。畢竟，通信是智能體協(xié)作最關(guān)鍵的部分，如果不能及時交換信息，那分布式計算可謂毫無意義。

要滿足這一需求，可能要寄托于即將到來的6G網(wǎng)絡(luò)。

但對于這部分，高通早已做好了相關(guān)布局。安蒙展望說，“網(wǎng)絡(luò)本身就是一個AI原生網(wǎng)絡(luò)，其分布式AI計算與推理能力從無線基站一直延伸到中心機房乃至數(shù)據(jù)中心。”這意味著，萬物智能的時代終于到來了。

通過“計算連續(xù)體”的方案可以看到，高通在AI時代的布局已遠不止個人終端與通信，而是覆蓋從可穿戴設(shè)備到數(shù)據(jù)中心的完整算力網(wǎng)絡(luò)。從最小的邊緣算力到云端基礎(chǔ)設(shè)施，高通都能提供相關(guān)產(chǎn)品，并試圖用一套相互連接的解決方案將它們串成整體。

“高通在智能手機、PC、車載計算和機器人領(lǐng)域有著領(lǐng)先的每瓦特性能表現(xiàn)，并正在將這一優(yōu)勢延伸至數(shù)據(jù)中心”。

正如安蒙所言。高通的標簽即將在智能體時代發(fā)生改變——從過去的芯片公司，升級為AI智能體解決方案公司。

護城河的深度取決于AI應(yīng)用的廣度

高通的轉(zhuǎn)變是今年Computex大會的一個縮影。

在AI大模型時代之前，Computex就像是個“電腦配件大賣場”。在2023-2025年AI大模型剛開始的時期，大會內(nèi)容主要是硬件廠商嘗試與AI接軌，“堆基礎(chǔ)設(shè)施造大模型”的狂歡。而在今年，大會的風向徹底轉(zhuǎn)向以AI為中心，在場的每一個廠商都在討論AI在“物理世界+智能體時代”的具體落地。

尤其是今年有不少廠商都宣布，將擴大AI領(lǐng)域布局。

例如，今年英偉達就一口氣發(fā)布了CPU、PC芯片、人形機器人等多項產(chǎn)品，準備從AI基礎(chǔ)設(shè)施的定位擴展到物理AI全棧。AMD這次的主線是從純硬件，轉(zhuǎn)向做Agent Computers（本地智能體），試圖搶占英偉達在開發(fā)者和邊緣AI的份額。Intel靠18A工藝“翻身”之后，開始規(guī)劃做“從手持設(shè)備到數(shù)據(jù)中心”的AI全棧硬件。

“討論的重點，從來都不是在云端能運行的東西也能在邊緣運行。我們需要的是，該在云端運行的東西在云端運行，該在邊緣的在邊緣運行，這是完全不同的概念。”

正如安蒙所說，在當下階段，單純的算法或是硬件已經(jīng)不能回答智能體是否能用好的問題。要想智能體真正在全棧算力硬件自由流轉(zhuǎn)，不僅需要廠商擁有AI布局的廣度，更需要吃透智能體應(yīng)用的每一個環(huán)節(jié)。

為此，高通在本次大會現(xiàn)場準備了大量真實演示，試圖驗證計算連續(xù)體這套端到端系統(tǒng)級布局的可行性。

其中一些Demo由高通親自操刀，作為技術(shù)標桿展示其深度。例如，智能體發(fā)票助手能夠通過攝像頭掃描收據(jù)，自動完成從翻譯到生成文件，展示了端側(cè)多模態(tài)AI的完整工作流。另一些Demo來自合作伙伴，覆蓋了從創(chuàng)意生產(chǎn)到軟件開發(fā)的完整工作流，展示的是生態(tài)的廣度。

端云協(xié)同的好處，安蒙舉了個例子說：“以一段真實的Claude Code運行場景為例，規(guī)劃器會對工作負載進行智能調(diào)度：將部分任務(wù)留在設(shè)備端本地計算，把必要內(nèi)容上傳至云端。通過這種分布式智能體AI架構(gòu)，充分利用跨計算連續(xù)體的所有算力資源，可節(jié)省約140萬Token，在獲得相同結(jié)果的前提下減少成本60%。”

這種成本的降低，對燒錢如流水的token來說，簡直就是久旱逢甘霖。

為了實現(xiàn)這種效果，高通背后做了大量布局。

例如在去年6月，高通宣布收購Alphawave Semi，這是一家擅長高速有線連接的公司，補齊了數(shù)據(jù)中心AI推理加速卡在scale-up（PCIe）和scale-out（Ethernet）方面的需求，這是高通能進一步押注數(shù)據(jù)中心算力卡的關(guān)鍵。

另外，高通嘗試用躍龍品牌覆蓋從工業(yè)邊緣側(cè)到機器人大腦的計算平臺。這次大會上，高通帶來了面向機器人的計算平臺的全棧參考設(shè)計——高通躍龍IQ10 RRD。據(jù)了解，高通躍龍IQ10 RRD不僅能同時支持工業(yè)機器人、自主移動機器人（AMR）及人形機器人，而且還集成了端到端的軟件棧，主打“開箱即用”。

而在消費端，本次高通在之前的主打PC高性能的驍龍X平臺基礎(chǔ)上，帶來了面向入門級筆記本的驍龍C平臺。從產(chǎn)品預期上來說，或許搭載驍龍C平臺的PC有點類似Chromebook，主打輕應(yīng)用和辦公需求。但兩者的區(qū)別是驍龍C平臺集成了NPU，這意味著新一代入門PC的產(chǎn)品門檻，除了功耗和性能之外，還要能用上端側(cè)AI。

從芯片到連接，從可穿戴設(shè)備到數(shù)據(jù)中心，從消費端到工業(yè)場景，高通構(gòu)建了一條貫穿物理世界的完整算力連續(xù)體。

這種全方位的布局，讓高通在智能體時代抓住了真正全面整合的機會。當其他算力廠商仍在強調(diào)“暴力計算”與參數(shù)規(guī)模時，高通卻用邊緣AI網(wǎng)絡(luò)、每瓦特性能和極致的TCO（總體擁有成本）優(yōu)勢，提出了一套截然不同的系統(tǒng)性答案。

在智能體成為關(guān)鍵詞的2026年，AI已經(jīng)大幅降低了人類獲取更高智能的門檻。而高通正在做的，是將這一門檻進一步拉低到人人可及。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.