无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

端側算力的“奇點”時刻—需求,模型,芯片的三維共振

0
分享至

端側算力的真正爆發可能不在手機和電腦上,而在會動的機器人身上。

5月18日,國盛證券通信行業研究團隊(分析師宋嘉吉、黃瀚、邵帥)發布深度研究報告,梳理了端側算力在需求、模型、芯片三個維度的最新進展,并作出判斷:端側算力正走入"奇點"時刻。

這份報告的起點,是一次坦誠的自我復盤。

兩年前,國盛證券曾發布端側算力深度報告,預判手機、PC等AI設備上的本地算力將迎來高速增長。但現實是——這些設備上的AI功能,大多數仍依賴云端算力,端側算力并未如期放量。

端側算力(On-Device Computing / Edge Computing)是指直接在用戶終端設備(如智能手機、AI眼鏡、PC、智能家居、現在可能包括機器人等)上執行的數據處理和計算能力,無需完全依賴遠程云端服務器。

報告用兩句話總結了這段歷史:"不要低估云端模型的能力邊界",以及"需求不是憑空想象的"。

云端太強,傳統端側需求被"壓住了"

過去三年,云端大模型的進化速度遠超預期。

報告指出,隨著"超節點"、"PD分離"等云端算力架構部署,云端模型在能力快速提升的同時,單位Token成本在加速降低。

以文生圖為例:三年前高通還在端側部署Stable Diffusion,端側只能生成512×512的底圖,邏輯性較差;而云端的GPT-4o、Nano Banana等模型已經可以在10秒內生成4K高分辨率圖像,且邏輯細節遠勝端側。


原本支撐端側算力的三大理由——隱私性、低成本、低時延——也在云端的強勢進化下逐一被動搖。報告認為,"隱私性"和"低成本"這兩個需求正在被證偽,真正站得住腳的,只剩下"低時延"這一個。

但這里說的低時延,不是指人類等待AI回復的速度。騰訊混元T1模型的吐字速度已達60-80 token/秒,首字秒出,早已低于人類舒適反應區間。

報告所說的低時延,是設備對外部信號的內生處理速度

人腦處理視覺-運動反應約需180-200毫秒;而一個設備從接收信號、傳送云端解析、再傳回本地執行,往往需要2-5秒以上——如果是圖片等多模態信號,還會更長。


這就是云端算力無法觸及的盲區。報告用了一個類比:把人體神經換成無線信號,把大腦換成云端算力,整個鏈路的穩定性和延遲就會被無線拉長。

需求在哪里?在會動的機器人上

鎖定"低時延"這一核心命題后,真正的需求方向也隨之清晰:讓"類人終端"更像人。

分析師將當前類人終端按智能程度分為四類:

  • 第一類:攝像頭等感知硬件,需要處理更多路信號、更精細的識別模型

  • 第二類:工具機器人(割草、泳池等),需要識別更多場景——比如割草機器人能識別寵物糞便、石頭、積雪、落葉,就能進化為四季可用的"庭院機器人"

  • 第三類:智能車,需要理解異形障礙物和極端復雜場景

  • 第四類:人形機器人,需要實時理解物理世界并產生互動,輸入涵蓋視覺、聽覺、觸覺,輸出是復雜肢體動作


分析師核心判斷是:這一輪端側需求,不是資本市場的一廂情愿,而是來自"客戶需求增長疊加行業能力進化的閉環結果"——割草機器人、送餐機器人、無人汽車的普及,讓用戶在接受基礎功能的同時,也開始提出更高要求。


模型三級跳:從“看圖識字”到“預判未來”

需求側的演進,離不開模型側的支撐。報告梳理了端側視覺模型的進化路徑,邏輯清晰。

第一代:YOLO模型

大模型時代之前,機器視覺依賴CNN算法下的YOLO模型。其原理是把圖像劃分為網格,讓每個格子負責預測其中的物體——報告打了個比方:就像"一個經驗豐富的保安站在高處快速掃視人群,只要某個格子里大概率出現了'車'或者'人'的特征,它就立刻畫一個框圈出來"??欤杏矀弘y以處理異形物體和3D畫面,也無法理解物品之間的邏輯關聯。


第二代:Vision Transformer(ViT)

大模型思路引入視覺領域后,ViT打開了新天花板。它把圖像切成小方塊,像做閱讀理解一樣,思考每個碎片與全圖其他碎片的關系。報告的描述很形象:"看到左上角的'貓耳朵',它會立刻通過邏輯聯想到右下角的'貓尾巴',即使它們隔得很遠。"


ViT更消耗算力,這恰恰打通了端側算力升級的邏輯——更強的算力可以真正轉化為更強的能力,而不是"空有算力卻無法提升能力"。

第三代:VLM→VLA→世界模型

智能駕駛加速了這一演進。

  • VLM(視覺-語言模型):能看懂圖像并翻譯成語義信息,相當于"坐在副駕的解說員",把路況變成機器能聽懂的"情報"

  • VLA(視覺-語言-動作模型):在VLM基礎上加入"動作"維度,直接從視覺感知輸出控制指令——"方向盤左打10度"、"油門踩下20%",實現從眼睛直達手腳的端到端控制。英偉達已于近期發布開源VLA模型Alpamayo

  • 世界模型:更進一步,引入預測機制,在執行動作前預演未來幾秒的多種情況,"通過生成未來的視頻畫面來評估風險,從而在無數個'平行宇宙'中選出最安全的那一條路去走"


機器人前沿:GEM模型

相比智能駕駛,讓機器人理解并與物理世界互動的難度更高一個量級。智能車的目標是"避免與外界互動",機器人則必須實時與外界產生物理和語言接觸。

報告認為,GEM(Grounding Embedding Model)是解決這一難題的可能路徑之一。簡單說,它能把機器人的感知數據(攝像頭畫面、激光雷達點云)和高層指令("把藍色的杯子遞給我")映射到同一個特征空間,讓機器人即使沒見過某個物體,也能通過語義理解完成動作。谷歌的RT-2模型已在探索這一方向,將圖像、動作、語言全部token化來實現對齊。


報告指出,GEM模型當前的主要痛點在于不同模態信號的對齊,以及災難性遺忘、模態鴻溝等問題,"不僅需要模型工程上的持續優化,在未來執行層面,也需要專門的算力芯片架構進行配合"。

芯片之爭:NPU遇到天花板,GPGPU向下滲透

模型需求確定了,芯片是最終落腳點。報告詳細分析了NPU與GPGPU兩條路線的優劣。

NPU:從YOLO起家,遭遇架構瓶頸

NPU的第一波放量來自YOLO模型——安防攝像頭、初級自主移動機器人大量搭載NPU芯片。瑞芯微RK系列憑借性價比和低功耗成為主流選擇,其營業收入從2016年的12.98億元增長至2025年的44.02億元。


但進入大模型時代,NPU遇到了架構層面的硬約束:在掃地機器人等低功耗場景下,如果要運行以ViT為基座的模型替代YOLO,算力需求將接近100TFLOPS。更關鍵的是,NPU缺少CUDA CORE,所有指令由CPU下發,而端側功耗和成本限制下無法使用高性能CPU——"一旦在較弱的CPU下掛在了過多的NPU核,用于AI任務的指令就會占據CPU所有的通信總線,從而使得設備宕機"。

當前有兩條破局路徑:

  • 高通躍龍IQ10:換裝更好的CPU和更大面積的NPU核,并融合部分GPU任務調度結構

  • 瑞芯微RK182x:采用3D-DRAM+協處理器雙軌并行,通過堆疊封裝加大NPU與存儲間的帶寬,同時將AI推理從主芯片解放出來,緩解總線擁堵


GPGPU:從云端繼承,生態優勢放大

相比NPU,GPGPU的端側路徑更順滑。云端GPGPU本就是全功能芯片,走向端側只需按需縮減面積和核心數量,不存在NPU面臨的架構改造難題。

英偉達智能駕駛業務收入從2021財年的5.36億美元增長至2026財年的23.49億美元,Orin、Thor系列已推出覆蓋不同價位和算力段的產品線。


但GPGPU的核心優勢不只是硬件,更在于生態。報告指出,大部分端側模型的預訓練和微調都需要借助CUDA生態完成,"如果在端側使用GPGPU架構的算力,那么無論是部署速度,部署效果都會遠超需要轉譯的NPU環境"。同時,英偉達在FP4等低精度推理方面已有成熟方案,可以直接下放端側,而NPU則追趕艱難。


分析師的結論是:看好GPGPU架構在端側滲透率持續提升。但英偉達高昂的售價注定其不會成為市場唯一選擇,這也為高通(通信+計算融合的SOC方案)和國內芯片公司(以性價比切入下沉市場)留出了空間。

投資布局:芯片、模組、存儲三條線

分析師將端側算力的投資機會分為三個環節:

芯片:價值量提升最大的環節。關注NPU迭代與GPGPU向下滲透。報告特別指出,端側設備中算力成本占比將顯著提升,"這一邏輯與云端基建類似"。

模組:報告稱之為"旱澇保收的中間商"。端側算力客戶極度分散,模組公司承擔連接上游芯片和下游萬千用戶的橋梁作用。無論哪種芯片路線最終勝出,模組廠商都能受益。在IoT時代已實現全球"東生西落"的中國模組公司,被認為不會缺席這一輪增長。

存儲:3D-DRAM是報告重點提及的新方向。端側芯片的推理能力同樣受內存大小和帶寬制約,3D-DRAM通過將DRAM與NPU堆疊封裝,在低成本、低功耗前提下提升帶寬。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
距開賽僅24天!巴薩官宣1億紅星骨折+將手術 傷缺2個月無緣世界杯

距開賽僅24天!巴薩官宣1億紅星骨折+將手術 傷缺2個月無緣世界杯

我愛英超
2026-05-18 22:24:01
京東官宣今年618從5月30日晚8點開始,未來有望實現包裹全流程無人配送直達用戶手中

京東官宣今年618從5月30日晚8點開始,未來有望實現包裹全流程無人配送直達用戶手中

極目新聞
2026-05-18 16:25:23
普京落地北京前!克宮明說了:訪華團不跟美國比,但有一事很特殊

普京落地北京前!克宮明說了:訪華團不跟美國比,但有一事很特殊

老鼜尾聲電影解說
2026-05-19 10:30:09
成吉思汗大墓或被找到,專家準備挖掘時,蒙古總理卻出面進行制止

成吉思汗大墓或被找到,專家準備挖掘時,蒙古總理卻出面進行制止

浩渺青史
2026-05-01 00:56:48
涉嫌嚴重違紀違法!貴州省信訪局局長馬磊任上被查

涉嫌嚴重違紀違法!貴州省信訪局局長馬磊任上被查

大眾新聞報社記者
2026-05-19 10:07:01
成績再好也沒用!小學老師透露:真正吃香的孩子,有這3個共同點

成績再好也沒用!小學老師透露:真正吃香的孩子,有這3個共同點

輝哥說動漫
2026-05-17 09:56:46
恭喜!遼寧男籃26歲兩冠中鋒吳昌澤完婚 郎才女貌獲網友祝福

恭喜!遼寧男籃26歲兩冠中鋒吳昌澤完婚 郎才女貌獲網友祝福

醉臥浮生
2026-05-19 10:04:12
女子花4萬在北京買房,20年后拆遷賠1035萬,房主卻說房子不賣了

女子花4萬在北京買房,20年后拆遷賠1035萬,房主卻說房子不賣了

林子說事
2026-05-18 15:42:45
57歲高曉松近況曝光!親自澄清網絡謠言,自己每天就是讀書種菜

57歲高曉松近況曝光!親自澄清網絡謠言,自己每天就是讀書種菜

小徐講八卦
2026-05-19 09:29:29
傳聞:王亞樵一死斧頭幫就散了?十萬兄弟改頭換面,先殺叛徒報仇

傳聞:王亞樵一死斧頭幫就散了?十萬兄弟改頭換面,先殺叛徒報仇

卡西莫多的故事
2026-03-10 10:33:15
記者:當年為了避免梅西被西班牙搶走,阿根廷緊急安排比賽!

記者:當年為了避免梅西被西班牙搶走,阿根廷緊急安排比賽!

歷史第一人梅西
2026-05-19 11:07:46
世界局勢,已經到了矛盾大爆發的邊緣!

世界局勢,已經到了矛盾大爆發的邊緣!

柏年說政經
2026-05-17 18:00:03
他曾任廣州市長,一生清廉,卸任26年后去世,為何引發集體追憶?

他曾任廣州市長,一生清廉,卸任26年后去世,為何引發集體追憶?

近史談
2026-05-19 10:45:45
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
30年前初戀白月光,相伴30年老伴,56歲大爺該怎么選?

30年前初戀白月光,相伴30年老伴,56歲大爺該怎么選?

墨染塵香
2026-05-18 09:03:32
繼續壓制,馬刺賽季對雷霆5勝1負&打破其賽季季后賽不敗金身

繼續壓制,馬刺賽季對雷霆5勝1負&打破其賽季季后賽不敗金身

懂球帝
2026-05-19 12:18:24
DDR5暴漲414%即將終結!三星前芯片總裁:中國DRAM擴產 明年把價格打下來

DDR5暴漲414%即將終結!三星前芯片總裁:中國DRAM擴產 明年把價格打下來

快科技
2026-05-19 10:04:22
孩子不記得你給他買了多少玩具,玩多少地方,但會記住這5個瞬間

孩子不記得你給他買了多少玩具,玩多少地方,但會記住這5個瞬間

新東方家庭教育
2026-05-19 10:07:40
陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

杰絲聊古今
2026-05-03 13:35:27
爭議 7500萬神鋒落選巴西隊+賽季49場造29球 安帥:我得考慮另1人

爭議 7500萬神鋒落選巴西隊+賽季49場造29球 安帥:我得考慮另1人

風過鄉
2026-05-19 06:27:15
2026-05-19 12:39:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
146280文章數 2653600關注度
往期回顧 全部

科技要聞

蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

頭條要聞

美兩電子戰機相撞在空中互相卡住 美軍目前僅有幾十架

頭條要聞

美兩電子戰機相撞在空中互相卡住 美軍目前僅有幾十架

體育要聞

58順位的保羅,最強第三中鋒

娛樂要聞

張雪峰42歲冥誕,學生家長自發緬懷

財經要聞

從賣流量到賣Token,運營商算力生意破局

汽車要聞

40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

態度原創

健康
房產
教育
本地
公開課

專家揭秘干細胞回輸的安全風險

房產要聞

7516元/㎡,161套一次全甩!??谧≌畹蛢r出現了!

教育要聞

為什么現在的孩子這么脆弱?別人對你的方式,都是你自己教的!

本地新聞

別搜晉江小說了,去看真的晉江

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版