![]()
最近數碼圈的一場口水戰,直接把各大廠在AI時代的濾鏡給震碎了。
小米工程師在微博上公開吐槽:“現在做大模型,某些公司只會比嗓門、比情懷、搞捆綁。” 吃瓜群眾都覺得,這槍口對準的就是剛在HDC 2026大會上高調宣布余承東重新掛帥、發誓要拿下行業第一的華為盤古大模型。
![]()
圖源(雷科技)
在外行眼里這不過是日常互懟,但在雷科技(ID:leitech)看來,這幾句吐槽剛好戳中了2026年手機AI戰場的集體焦慮。
大家都發現云端堆參數、跑分沖榜的戲碼已經不吃香了,現在的手機AI想活命,就得看這兩個趨勢:
一個是端側AI能不能在本地硬扛住算力壓榨;
二是系統級的智能體(Agent)能不能真正幫用戶干活,把App之間那堵墻給砸穿。
順著這兩條線,雷科技(ID:leitech)結合近半年的實測體驗和行業觀察,把各大廠的底層猛料全翻了出來,看看這場AI新戰事里,各家手里到底攥著什么牌。
拆解八大手機巨頭AI真實底牌
1、華為:手握全棧自主體系,“軟硬芯云”筑起圍墻
在HDC 2026大會上,華為所展現出的打法不僅是單點技術的突破,更是目前行業內極其罕見的“全棧全場景”體系化作戰。
從底層的算力芯片到最上層的AI應用,華為正在用一條完全自主的技術鏈條筑起生態壁壘。
依托昇騰算力架構和完備的云端算力基礎設施,為大模型的持續演進提供了源源不斷的數據吞吐保障。
在端側,華為深度融合了“麒麟芯片親和”技術,遵循能效比與算力協同的“韜定律”,成功將原生30B入端模型(包含2B激活參數)常駐在常規運存中。借由量化剪枝和專家預測算法,手機在本地運行時不僅做到了高頻小任務的低時延響應,還避開了發熱功耗紅線。
作為整套體系的智力中樞,openPangu 2.0大模型今年再次展現了技術厚度。不僅支持高達512K的長上下文,還計劃陸續開源7大核心組件,實現了端云協同。
系統層面,Harmony OS更是國產唯一的全自研系統,最新發布的HarmonyOS 7將“Agent親和系統架構”放在了核心位置,直接重構了應用與系統的關系,能直接將傳統應用拆解、重組為可隨時調用的Skills和智能體,實現服務的一語直達。
站在最前端的小藝系統智能體,日均喚醒已高達30億次,具備2100+系統級能力和500+伙伴精選Skill。在HarmonyOS 7的加持下,小藝變成了一個擁有空間感知、能跨設備執行復雜流轉任務的超級調度官。
華為最大的優勢,是它終于有機會把芯片、系統、生態和AI串成一套閉環,為擁有多設備的用戶提供了高度連貫的Agent流轉體驗,也進一步夯實了鴻蒙生態的壁壘。
2、蘋果:放棄自研AI請外援,借力打力的超級玩家
WWDC 2026上亮出的Apple Intelligence和全新Siri AI,雖然對國行用戶來說依舊是海市蜃樓,但它把系統層融合玩出了高段位。蘋果的核心大模型AFM,本質上是找谷歌買了一份Gemini的食譜,拿回來自己魔改私有化的產物。
蘋果把交互和系統權限挖得極深,Siri AI不僅有了獨立的交互歷史App,還長出了多模態屏幕感知能力。它能看著屏幕上的賬單直接算AA制每個人給多少錢,能跨App翻找私人郵件并自動規劃三天兩夜的行程。
在應用層,Safari和快捷指令玩起了Vibe Coding。相冊甚至能利用端側模型將2D照片重新渲染,拓展出帶有Z軸深度信息的空間構圖壁紙。
靠著嚴苛的私有云計算(PCC)架構,蘋果守住了的隱私底線。借谷歌的大腦幫自己充值智商,同時牢牢捏住系統調度大管家的地位,蘋果依然精于算計。
加上蘋果在軟件生態的號召力,Siri AI可能會是成長最快的Agent。
3、小米:深耕自研技術基座,模型與算力兩手抓
小米在2026年是深耕端側算力的代表。今年他們直接投了160多億元搞AI,剛發布的Xiaomi MiMo-V2.5-Pro旗艦基座,端側激活參數直接飆到了42B。
為了讓如此龐大的模型適配更多設備,小米專攻FP4(4位浮點數)量化技術。它在極限壓縮模型體積的同時最大化保留原生推理精度,其特調版甚至在通用GPU上把生成速度飆到了1000 tokens/s。
有了算力兜底,小米之前開啟了移動端原生智能體Xiaomi miclaw的小范圍封測。它直接深入系統底層,能調用50多種系統級工具。比如收到購票短信,它能自動完成讀短信、建日歷、設鬧鐘、查天氣甚至提前打開乘車碼等7步操作,全程只需你最后確認。
更狠的是,它完整接入了米家IoT生態,能讀取并調度超10億臺智能設備。
不拼純軟件應用,而是用Agent去盤活龐大的米家硬件生態,這才是小米獨有的護城河。
4、OPPO:讓AI不炫技只干活,一切圍繞用戶需求
兩年前高調官宣“all in AI手機”的OPPO,在ODC25和ColorOS 16上,終于用一套AI思路重構了系統。他們沒走堆參數的路線,而是推出了三大技術底座:
On-Device Compute(端側智能計算)在本地跑出了峰值300 tokens/s的理論性能和128K長上下文;
PersonaX記憶共生引擎為用戶構建了多模態的“終生記憶”;
Agent Matrix智能體生態框架則賦予了小布跨設備執行任務的能力。
在功能層,刷B站時激活“一鍵閃記”,AI不僅能近乎實時生成大綱和思維導圖,點擊大綱時間軸還能一鍵跳回視頻對應段落。利用圖像識別的一鍵記賬和一鍵記錄取餐碼功能也很實用,甚至配有專屬動態圖標。
比起模型算力和各種技術細節,這種能幫你省掉日常麻煩、越用越懂你的“小確幸”,對普通用戶來說才是最容易感知的。
5、vivo:深耕端側輕量化,回歸最真實場景
作為國內最早深耕自研大模型矩陣的廠商之一,vivo從2023年發布藍心大模型開始,就一直在端側輕量化這條路上狂奔。
vivo深知用戶的痛點:如果斷了網,AI是不是就變成廢品了?通過小V記憶 2.0,vivo在手機本地直接構建起了一張完全離線的知識圖譜。在不聯網、絕對保護隱私的情況下,依然能讓藍心小V從海量照片和復雜文件中精準檢索。
前文雷科技(ID:leitech)實測提到,雖然千元機跑大模型被折磨得夠嗆,但在旗艦機vivo X300 Pro上僅用32秒就能搞定復雜的圖片識別。這種算力調度的深厚功底,讓人對即將發布的端側AI折疊屏vivo Fold 6充滿期待。
6、榮耀:AI手機激進派,不卷參數卷交互
榮耀在2026年基本不提自家大模型參數,而是走了一條討巧的路線,把精力砸在了重構底層交互和硬件形態上。
在硬件形態上,MWC 2026展示的Robot Phone背部搭載了微型三軸機械防抖云臺,鏡頭能像脖子一樣自動追蹤主體,甚至隨音樂律動,給同質化的影像旗艦提供了一種物理交互思路。
在系統側,YOYO智能體基于AHI(個人+全局+邊端協同)戰略,可自動執行場景突破3000+,并且帶頭首發接入微信A2A協議。
榮耀這種避實就虛的打法,用系統級的調度去連接第三方垂域大模型,反而讓他們在打破App孤島這條路上跑得相當順暢。
7、谷歌:將Gemini塞入安卓,建立端側生態霸權
作為安卓生態的親爹,谷歌在AI時代的野心絕不僅限于做個App,而是要徹底掌控系統底座。
在端側下沉方面,谷歌推出了主打完全離線運行的Gemma 4模型,并在Google AI Edge Gallery中測試Mobile Actions功能,試圖讓自然語言指令直接轉化為系統級操作。
雖然前文雷科技(ID:leitech)實測它在千元機上表現不佳,但這其實是谷歌在給全行業“立規矩”,用系統級軟件生態的硬性要求,倒逼高通、聯發科等芯片廠商加快中低端NPU的算力迭代下放。
谷歌最恐怖的底牌在于其生態的統治力,上有谷歌全家桶,下有安卓生態,Gemini本身也有很強的實力,當蘋果需要找Gemini深度融合,當各家安卓旗艦將其作為全場景Agent的核心大腦,谷歌其實已經贏麻了。
谷歌不僅在制定端側AI的系統級調度標準,更是在重新發放未來十年移動生態的入場券。
8、三星:堅持“外包”路線,全球化左右逢源
在端側大模型和Agent這條賽道上,三星的走法相當務實,起步太晚,不如直接找外包。
在海外市場,三星深度綁定谷歌,Galaxy S26系列直接用Gemini大模型做底座。在MWC展會演示中,其Agent能直接在后臺掃描家庭群聊,檢測到大家討論點披薩,就會自動在后臺打開外賣App把商品塞進購物車,直到付款前一步才停下來讓用戶確認。
而在國內市場,為了合規,三星靈活地接入了百度文心一言、美圖等國內大廠的AI服務。
聽起來像是在吃百家飯,但我必須承認三星在體驗打磨上的功力。
無論是即圈即搜、通話實時翻譯,還是相冊智能修圖,三星把這些看似東拼西湊的能力縫合得極其順滑。只要能配合自家頂級的硬件讓消費者用得舒服,用誰家的引擎并不重要。
旗艦機可以了,如何讓AI下沉到中低端?
把大模型直接塞進手機本地運行,聽起來很好,不依賴網絡、零延遲、還絕對保護隱私。
但現實是,旗艦機跑本地AI是在享受科技,中低端機跑本地AI純粹是在受刑。
今年4月谷歌推出了主打完全離線運行的移動端模型Gemma 4,網上拿萬元旗艦機跑測試全在叫好。
但雷科技(ID:leitech)拿搭載天璣7400中端芯片、配有NPU 655的vivo Y500 Pro去跑,結果直接讓人看傻眼。
回答成了無效信息的重災區:讓它推薦長途高鐵看的電影,它在本地哼哧哼哧跑了500字,足足花了2.8分鐘,最后還廢話連篇地提醒我記得帶耳機。
邏輯題直接整不會了:做一道排座位的邏輯推理題,它在本地亮屏算了3.3分鐘(期間還不能退后臺),結果最后給出的還是個錯誤答案。
識圖直接卡到死機:丟一張大商場的圖,它認不出圖里那么大一個Apple Store招牌;再丟一張綠植圖,它直接在原地轉圈加載了5分鐘,直接卡死。
作為對比,同款模型在旗艦機vivo X300 Pro上,1.6分鐘就能跑完邏輯題,圖片識別只要32秒。
這就是冰冷的行業現實,沒有強大的硬件算力兜底,端側大模型純粹就是折磨用戶的營銷噱頭。
為了解決本地運存和帶寬被擠爆的痛點,大廠們開始在底層魔改算法。
比如小米專攻FP4(4位浮點數)量化技術,在極限壓縮模型體積的同時最大化保留原生推理精度,在通用GPU上把生成速度飆到了1000 tokens/s。
傳音則走實用路線,把離線模型壓縮進手機,在網絡不好的非洲和中東地區,實現了多種復雜方言的離線實時翻譯,實打實地用端側AI消除了數字鴻溝。
不只是搜索畫圖,智能體手機要幫你干活
2026年的AI手機,本質是在搶操作系統入口。
大廠們集體患上入口焦慮,電源鍵、負一屏、側邊欄全塞滿了AI,甚至有些廠商開始測試實體AI按鍵。
但入口堆得越多,用戶越懵。真正實用的Agent,是要手機自己能完成操作,幫用戶減少操作步驟。
行業過去最頭疼的是App之間的孤島效應,手機助手想發個微信,得靠暴力讀屏和模擬點擊,稍微碰上風控就得卡殼,比如說去年的豆包手機。
而最近微信終于把大門打開了一條縫,聯合華為、榮耀、小米等大廠推出了A2A(Agent-to-Agent)協議。大模型不用再裝作聽不懂,而是手機助手直接把工單發給微信Agent,由微信自己執行并返回結果。
雷科技(ID:leitech)拿榮耀Magic8 RS實測,喚醒YOYO后說一句“給三明治發微信說原神啟動”,系統能一句話跨越生態壁壘直接執行。
而沒接入A2A的手機助手遇到這指令,最遠只能走到“打開微信”這一步,然后就被系統彈窗拒絕。
微信這次開放,給全行業提供了一個大廠智能體之間高效協作、互不搶流量的基建范本。
在MWC 2026上,我們也看到不少優秀樣本,努比亞M153則通過端側Nebula-GUI在后臺開虛擬機,直接模擬人類手指去各種沒API的App里操作,完成一句話跨平臺比價和預訂。
結束語
盤完2026年這一整圈大廠的真實底牌,不難發現,不管高管們在臺前怎么唇槍舌劍,真到了落地的層面,大家都朝著相同的方向發展:
- 模型必須向端側壓縮,否則低配算力純粹是在折磨用戶;
- AI必須進化為多模態Agent,從AI手機到Agent手機,未來的智能手機必須長出眼睛和手去打破App之間的圍墻;
- 隱私安全必須成為不可動搖的底線。
AI手機真正的戰爭,不在于誰的模型名字更長,在于誰能讓普通人每天省出多少時間。畢竟,手機不是論文答辯現場,最后決定勝負的,不是參數表,而是每天拿起來的那幾分鐘。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.