![]()
云與邊緣融合為一個統(tǒng)一的系統(tǒng),構(gòu)建一個計算的連續(xù)體。
文|劉俊宏
編|王一粟
一只龍蝦引爆了Token經(jīng)濟學。
2026年初,智能體OpenClaw(龍蝦)改變了所有AI公司的商業(yè)模式。
AI開始從“被動響應(yīng)”邁向“自主行動”。用戶不再滿足于讓AI“回答問題”,而是要求它能規(guī)劃任務(wù)、調(diào)用API、跨系統(tǒng)協(xié)作、甚至在物理世界執(zhí)行動作。
智能體不再是云端一個大模型,而是分裂成一群小助手,實時在手機、PC、機器人等邊緣設(shè)備、云端之間跑來跑去,幫你訂機票、開車、做實驗。
智能體不僅是無處不在,還會自主運行、互相協(xié)同。這就帶來了許多新的算力需求和挑戰(zhàn)。
首先,是智能體自主運行,與軟件交互的速度遠超人類。在所有工作流中,Token將以機器速度生成,而非人類速度。
“2026年,全球每10秒約317億Token需求;到2030年,同樣是每10秒,這一數(shù)值將達到1.27萬億,增幅高達40倍。而這一爆發(fā)式增長,正是由智能體AI生成的海量Token所驅(qū)動。”高通CEO安蒙預測。
另外,無處不在的智能體AI,分布式地流轉(zhuǎn)在不同設(shè)備之間,要的是一個無處不在、能夠提供連續(xù)服務(wù)的計算平臺。
![]()
“我們不會再單獨去談云端與邊緣,因為它們將融合成為一個統(tǒng)一的系統(tǒng)。”高通認為,云與邊緣不是非此即彼。安蒙在發(fā)言中稱,“AI是在云端還是在邊緣側(cè)運行,是由智能體來決定。計算資源將被充分利用,AI將在所有設(shè)備上運行。”
這就意味著,推理能力將被分布到最合適的位置,在token成本、功耗、延遲和隱私之間實現(xiàn)最優(yōu)平衡。
智能體時代已來所有設(shè)備都將成為AI的端點
機器人,被看作是智能體在物理世界的最佳載體之一。
2026年,機器人的智能被分成了三層。其中,第一層是即時執(zhí)行,對應(yīng)人類不需要思考的動作,例如站穩(wěn)腳跟;第二層是具體動作執(zhí)行,這部分對應(yīng)機器人跟場景的交互,例如跳舞;第三層是邏輯推理,這部分對應(yīng)真實世界物理關(guān)系的理解,例如推理一個完整任務(wù)并理解前因后果。
三層智能層層遞進又相互補充,安蒙總結(jié)說:“研發(fā)機器人不只是研發(fā)它的‘大腦’,還需要配備核心計算單元、運動控制模塊,以及各類驅(qū)動執(zhí)行能力。想要在機器人領(lǐng)域取得成功,你必須懂得如何將其設(shè)計為一套分層式計算系統(tǒng)。”
同樣的現(xiàn)象,也出現(xiàn)在智能汽車上。在此前,智能汽車和座艙互不相干,而在2026年艙駕一體成為關(guān)鍵詞之后,汽車智能也變成了一個由兩層級智能整合的系統(tǒng),用戶現(xiàn)在可以直接用語音讓汽車啟動智駕。
這場改變的原因,就是AI智能體讓之前只能當Chatbot的AI能直接辦事。“AI正從簡單響應(yīng)指令、輔助人機交互的工具,進化為能夠自主采取行動的系統(tǒng)。這是AI正在演進的方向,并將迎來前所未有的規(guī)模化普及。”安蒙說。這也是為什么高通將2026看作是“智能體之年”。
但同時,在看到端側(cè)開始逐漸承載運行智能體的需求之后,安蒙也意識到當下所有的算力廠商面臨前所未有的機遇和挑戰(zhàn),“它正在重塑計算架構(gòu),將催生對新型設(shè)備和計算能力的巨大需求,而這一升級周期,有望成為行業(yè)有史以來規(guī)模最大的周期之一。”
事實上,在過去的三年里終端硬件廠商做了不少AI落地的鋪墊。
例如從2024年底開始,手機和PC行業(yè)就大量在設(shè)備中集成NPU,智能汽車座艙和智駕芯片的算力參數(shù)也變得越來越大。但現(xiàn)實是,許多PC的NPU算力調(diào)度還很有限,手機的各種AI功能大部分還要默認聯(lián)網(wǎng)執(zhí)行,用戶對端側(cè)AI實際的使用感知非常有限。
但在智能體時代,或許這些之前準備好的基礎(chǔ)設(shè)施終于要真正用起來了。
“這些設(shè)備都將成為智能體的端點(endpoint)。而且,智能體也不會受限于任何單一設(shè)備或單一生態(tài)系統(tǒng)。所有能夠?qū)⒂脩襞c智能體連接起來的一切,都將成為AI的端點。”
正如安蒙所說。當智能體需要在設(shè)備上即時響應(yīng)、自主規(guī)劃、跨應(yīng)用執(zhí)行復雜任務(wù)時,端側(cè)平臺必須成為智能體能夠原生棲息的運行環(huán)境。如此一來,由智能體主導的工作流就能將任務(wù)分布到最合適的位置——終端設(shè)備、邊緣側(cè)、本地服務(wù)器以及云端。
這意味著,當AI開始主導“自己”的工作,開始調(diào)動多個云側(cè)和端側(cè)AI設(shè)備來共同提供算力。那之前單一堆疊AI加速器的方法將不再適用,AI計算平臺必須進行系統(tǒng)級的重新設(shè)計。
計算連續(xù)體智能體AI新基建
當智能體代替人類操控,需要什么樣的新基建?
云端、手機端、PC端、車端,智能體的計算該怎么協(xié)同分配?
高通給出的答案是“計算連續(xù)體”,讓智能體在整個算力鏈條里面自由流轉(zhuǎn)。
這套方案并不只是簡單的算力分攤,讓不同環(huán)節(jié)的AI終端共同產(chǎn)出Token。而是一套讓推理能力被分布到最合適的位置,在單Token成本、功耗、延遲和隱私之間取得最優(yōu)平衡的全新基建體系。
![]()
這種認識,也是當下算力基礎(chǔ)設(shè)施廠商的共識。
例如AWS OpenSearch Service總經(jīng)理Tia White近日在LinkedIn發(fā)帖稱,智能體的通信需求跟人類完全不一樣,“它們可能毫無征兆地出現(xiàn)流量峰值,也可能悄然進入空閑狀態(tài)”。而面對智能體產(chǎn)生的數(shù)據(jù)流量對現(xiàn)有計算網(wǎng)絡(luò)的沖擊,邊緣計算公司Cloudflare高級產(chǎn)品經(jīng)理Lai Yi Ohlsen表示:“非人類流量將在2027年上半年的某個時候超過人類流量。”
重塑整個計算鏈路的好處,Omdia在一份報告中指出,通過在設(shè)備間分布式部署AI能力,80%的本地處理率可將云端運營成本從55億美元降至約12億美元,每年節(jié)省43億美元,同時改善延遲、能效和可靠性。
![]()
這項改造具體如何實現(xiàn)?高通在本次大會上提供了一套包含“三大支柱”的解決方案。
首先,第一支柱是“規(guī)模化覆蓋”,這回答的是“智能體到底在哪運行”。
在高通的構(gòu)想中,智能體不會局限于某一位置,而是需要在終端設(shè)備、邊緣、本地環(huán)境和數(shù)據(jù)中心之間動態(tài)遷移。高通在其中負責提供統(tǒng)一架構(gòu),算力平臺覆蓋從毫瓦級(終端側(cè))到千瓦級(數(shù)據(jù)中心),使推理與規(guī)劃工作負載在各層級之間實現(xiàn)無縫流動。
這種智能體原生的基礎(chǔ)設(shè)施,能支撐智能體運行時的流量爆發(fā)。基于高通計算平臺的統(tǒng)一調(diào)度,Token的生成就可以避免傳統(tǒng)云端的單點瓶頸或端側(cè)算力比較小的天花板。進而在保證AI性能的同時降低總體成本,并保持響應(yīng)速度。
整套流程,簡單來說就像是解一道數(shù)學題。之前是博士生提供完整答案,但高通的思路是博士生負責給出解題思路,研究生負責列算式,大學生負責每一步計算。
更重要的是,由于整個計算平臺都在高通的架構(gòu)內(nèi),這就像是整個團隊“心有靈犀”。在端側(cè)和云端融合之后,智能體還能獲得跨層級的一致性,進一步保證運算效果又快,還不會“跑偏”。
高通給出的第二支柱,是“原生AI設(shè)備及系統(tǒng)”,這回答的是“智能體應(yīng)用怎么落地”。
畢竟,用戶是需要通過具體的終端設(shè)備來使用AI的。這代表著智能體在設(shè)備上提供始終在線的服務(wù),必須滿足即時性能、隱私保護和可靠性三重約束。換句話說,就是要想實現(xiàn)AI聰明地“到處跑”(規(guī)模化覆蓋),就必須要先讓設(shè)備天生“會AI”(原生系統(tǒng))。
高通在這一層的布局覆蓋了智能手機、AI PC、可穿戴設(shè)備、智能汽車、機器人、邊緣推理設(shè)備以及面向新形態(tài)的系統(tǒng)級設(shè)計。
在PC上,高通這次帶來了面向入門級PC的驍龍C平臺;在具身智能領(lǐng)域,高通展示了高性能機器人參考設(shè)計平臺高通躍龍IQ10 RRD。最令人意外的是,高通這次還正式公布了面向數(shù)據(jù)中心的新品牌——高通飛龍(Dragonfly)。從個人設(shè)備,到數(shù)據(jù)中心,高通的計算平臺即將實現(xiàn)閉環(huán)。
![]()
值得注意的是,高通在這些業(yè)務(wù)領(lǐng)域都落地了高性能CPU和推理專用加速器。這讓每一種產(chǎn)品都能夠提供智能體規(guī)劃所需的通用計算和處理人工智能神經(jīng)網(wǎng)絡(luò)推理的能力。
不僅如此,高通的計算平臺一如既往地能夠兼顧成本和功耗控制,讓消費者能夠以高性價比買到智能體長時間的陪伴。
“每種設(shè)備都需要合適的AI平臺,因為它們各不相同、用途上也存在差異。關(guān)鍵在于讓智能和能效在任何地方都實現(xiàn)最大化。”安蒙總結(jié)說。
![]()
最后一個支柱是“智能連接”,這回答的是“智能體之間如何協(xié)同”。
當端側(cè)設(shè)備都具有AI能力,連接本身也必須具備智能。如果說前面兩大支柱都還在智能體的計算層面,那么連接讓智能體能夠互相聊天、實時合作,就像一群小分隊在戰(zhàn)場上瞬間協(xié)同作戰(zhàn)。
這一點,Omdia在報告中也指出,要實現(xiàn)AI的有效規(guī)模化,科技行業(yè)需要優(yōu)先發(fā)展跨設(shè)備的協(xié)同規(guī)劃能力,整合邊緣系統(tǒng)與云服務(wù)。畢竟,通信是智能體協(xié)作最關(guān)鍵的部分,如果不能及時交換信息,那分布式計算可謂毫無意義。
要滿足這一需求,可能要寄托于即將到來的6G網(wǎng)絡(luò)。
但對于這部分,高通早已做好了相關(guān)布局。安蒙展望說,“網(wǎng)絡(luò)本身就是一個AI原生網(wǎng)絡(luò),其分布式AI計算與推理能力從無線基站一直延伸到中心機房乃至數(shù)據(jù)中心。”這意味著,萬物智能的時代終于到來了。
通過“計算連續(xù)體”的方案可以看到,高通在AI時代的布局已遠不止個人終端與通信,而是覆蓋從可穿戴設(shè)備到數(shù)據(jù)中心的完整算力網(wǎng)絡(luò)。從最小的邊緣算力到云端基礎(chǔ)設(shè)施,高通都能提供相關(guān)產(chǎn)品,并試圖用一套相互連接的解決方案將它們串成整體。
“高通在智能手機、PC、車載計算和機器人領(lǐng)域有著領(lǐng)先的每瓦特性能表現(xiàn),并正在將這一優(yōu)勢延伸至數(shù)據(jù)中心”。
正如安蒙所言。高通的標簽即將在智能體時代發(fā)生改變——從過去的芯片公司,升級為AI智能體解決方案公司。
護城河的深度取決于AI應(yīng)用的廣度
高通的轉(zhuǎn)變是今年Computex大會的一個縮影。
在AI大模型時代之前,Computex就像是個“電腦配件大賣場”。在2023-2025年AI大模型剛開始的時期,大會內(nèi)容主要是硬件廠商嘗試與AI接軌,“堆基礎(chǔ)設(shè)施造大模型”的狂歡。而在今年,大會的風向徹底轉(zhuǎn)向以AI為中心,在場的每一個廠商都在討論AI在“物理世界+智能體時代”的具體落地。
尤其是今年有不少廠商都宣布,將擴大AI領(lǐng)域布局。
例如,今年英偉達就一口氣發(fā)布了CPU、PC芯片、人形機器人等多項產(chǎn)品,準備從AI基礎(chǔ)設(shè)施的定位擴展到物理AI全棧。AMD這次的主線是從純硬件,轉(zhuǎn)向做Agent Computers(本地智能體),試圖搶占英偉達在開發(fā)者和邊緣AI的份額。Intel靠18A工藝“翻身”之后,開始規(guī)劃做“從手持設(shè)備到數(shù)據(jù)中心”的AI全棧硬件。
“討論的重點,從來都不是在云端能運行的東西也能在邊緣運行。我們需要的是,該在云端運行的東西在云端運行,該在邊緣的在邊緣運行,這是完全不同的概念。”
正如安蒙所說,在當下階段,單純的算法或是硬件已經(jīng)不能回答智能體是否能用好的問題。要想智能體真正在全棧算力硬件自由流轉(zhuǎn),不僅需要廠商擁有AI布局的廣度,更需要吃透智能體應(yīng)用的每一個環(huán)節(jié)。
![]()
為此,高通在本次大會現(xiàn)場準備了大量真實演示,試圖驗證計算連續(xù)體這套端到端系統(tǒng)級布局的可行性。
其中一些Demo由高通親自操刀,作為技術(shù)標桿展示其深度。例如,智能體發(fā)票助手能夠通過攝像頭掃描收據(jù),自動完成從翻譯到生成文件,展示了端側(cè)多模態(tài)AI的完整工作流。另一些Demo來自合作伙伴,覆蓋了從創(chuàng)意生產(chǎn)到軟件開發(fā)的完整工作流,展示的是生態(tài)的廣度。
端云協(xié)同的好處,安蒙舉了個例子說:“以一段真實的Claude Code運行場景為例,規(guī)劃器會對工作負載進行智能調(diào)度:將部分任務(wù)留在設(shè)備端本地計算,把必要內(nèi)容上傳至云端。通過這種分布式智能體AI架構(gòu),充分利用跨計算連續(xù)體的所有算力資源,可節(jié)省約140萬Token,在獲得相同結(jié)果的前提下減少成本60%。”
這種成本的降低,對燒錢如流水的token來說,簡直就是久旱逢甘霖。
為了實現(xiàn)這種效果,高通背后做了大量布局。
例如在去年6月,高通宣布收購Alphawave Semi,這是一家擅長高速有線連接的公司,補齊了數(shù)據(jù)中心AI推理加速卡在scale-up(PCIe)和scale-out(Ethernet)方面的需求,這是高通能進一步押注數(shù)據(jù)中心算力卡的關(guān)鍵。
另外,高通嘗試用躍龍品牌覆蓋從工業(yè)邊緣側(cè)到機器人大腦的計算平臺。這次大會上,高通帶來了面向機器人的計算平臺的全棧參考設(shè)計——高通躍龍IQ10 RRD。據(jù)了解,高通躍龍IQ10 RRD不僅能同時支持工業(yè)機器人、自主移動機器人(AMR)及人形機器人,而且還集成了端到端的軟件棧,主打“開箱即用”。
而在消費端,本次高通在之前的主打PC高性能的驍龍X平臺基礎(chǔ)上,帶來了面向入門級筆記本的驍龍C平臺。從產(chǎn)品預期上來說,或許搭載驍龍C平臺的PC有點類似Chromebook,主打輕應(yīng)用和辦公需求。但兩者的區(qū)別是驍龍C平臺集成了NPU,這意味著新一代入門PC的產(chǎn)品門檻,除了功耗和性能之外,還要能用上端側(cè)AI。
從芯片到連接,從可穿戴設(shè)備到數(shù)據(jù)中心,從消費端到工業(yè)場景,高通構(gòu)建了一條貫穿物理世界的完整算力連續(xù)體。
這種全方位的布局,讓高通在智能體時代抓住了真正全面整合的機會。當其他算力廠商仍在強調(diào)“暴力計算”與參數(shù)規(guī)模時,高通卻用邊緣AI網(wǎng)絡(luò)、每瓦特性能和極致的TCO(總體擁有成本)優(yōu)勢,提出了一套截然不同的系統(tǒng)性答案。
在智能體成為關(guān)鍵詞的2026年,AI已經(jīng)大幅降低了人類獲取更高智能的門檻。而高通正在做的,是將這一門檻進一步拉低到人人可及。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.