![]()
最近幾天,關(guān)于第二代豆包 AI 手機,又有了新的消息。行業(yè)媒體芯流智庫獨家報道稱,中興努比亞已經(jīng)全面收縮其他手機線,把核心資源集中到第二代豆包 AI 手機上,并計劃月內(nèi)發(fā)布。
沒幾天了。
雖然這個說法目前還沒有得到中興通訊、努比亞或者字節(jié)跳動的官方確認,但它從過去半年公開的信息看,努比亞和字節(jié)跳動花了很大力氣推動新一代豆包 AI 手機。包括今年 2 月底的 MWC 上,努比亞總裁倪飛其實就預(yù)告了這款「定義手機新物種」的第二代豆包 AI 手機。
![]()
圖片來源:微博
再而往前三四個月,第一代豆包手機以努比亞 M153 的形式出現(xiàn),盡管還是一臺搭載豆包手機助手技術(shù)預(yù)覽版的「工程樣機」,但產(chǎn)品的實際完成度已經(jīng)很高了。
更耐人尋味的,也是豆包手機真正引發(fā)討論的地方:用戶可以通過自然語言讓它跨應(yīng)用操作,做比價、修圖、查票、下單、發(fā)消息,甚至在某些場景里像一個真正拿著手機的人一樣,一步步點開 App、識別界面、完成任務(wù)。
第一代豆包手機直接把過去幾年手機廠商反復(fù)講的「AI 手機」,實際推進到了「AI 替你操作手機」這一步。
但當(dāng) AI 不再只是回答問題,而是基于 GUI(圖形用戶界面)代替用戶點擊屏幕、調(diào)用應(yīng)用、訪問相冊、處理支付和社交關(guān)系,不可避免地碰到權(quán)限和隱私問題,也沖擊了今天的互聯(lián)網(wǎng)商業(yè)生態(tài)。
第一代豆包手機很快撞上了這堵墻。微信、支付寶、銀行、購物平臺……都本能地緊張,對它的調(diào)用和操作做出限制,外界也開始更大規(guī)模地討論系統(tǒng)級權(quán)限、模擬輸入、賬號安全和隱私邊界。
這是第二代豆包 AI 手機必須回答的問題:不能只比第一代更快、更貴、更像旗艦,還要解決隱私難題,從一臺「工程樣機」,變成一臺普通人放心使用的量產(chǎn)機。
硬件升級,給 Agent 留出空間
目前關(guān)于第二代豆包 AI 手機的硬件信息并不多,比較明確的消息是,有望搭載第五代驍龍 8 至尊版。考慮到第一代 M153 已經(jīng)用了驍龍 8 至尊版、16GB+512GB、6.78 英寸 LTPO 屏和 6000mAh 電池,第二代繼續(xù)用旗艦平臺并不意外。
![]()
一代豆包 AI 手機,圖片來源:雷科技
用傳統(tǒng)手機邏輯看,這些參數(shù)其實沒什么新鮮感。2026 年的安卓旗艦,誰沒有旗艦芯片、大電池?但第二代豆包 AI 手機真正應(yīng)該變化的地方,是硬件圍繞 Agent 重新做取舍。
過去手機硬件服務(wù)的中心是 App。芯片要保證應(yīng)用啟動快,屏幕要保證顯示好,影像要保證拍照強,電池要保證一天夠用。AI Agent 加進來以后,手機會多出一類持續(xù)運行的任務(wù):
要理解用戶指令,能識別屏幕內(nèi)容,可以隨時調(diào)用相機、麥克風(fēng)、定位、相冊、日歷、通知和應(yīng)用狀態(tài),要在云端模型和端側(cè)模型之間做判斷,還要盡可能不拖慢系統(tǒng)、不明顯增加發(fā)熱和耗電。
這意味著第二代豆包 AI 手機需要的不只是更強的 SoC,更要一整套圍繞端側(cè) AI 的系統(tǒng)工程。
另外按照高通對這顆平臺的描述,第五代驍龍 8 至尊版除了 CPU、GPU、NPU 性能的繼續(xù)提升,這代的核心升級還有端側(cè)學(xué)習(xí)、實時感知、個人知識圖譜和 Agentic AI 能力。
如果第二代豆包 AI 手機搭載這顆芯片,它最該利用起來的就是端側(cè)能力。比如可以把一部分個人記憶、偏好、常用聯(lián)系人、常用任務(wù)流程放在端側(cè)處理。用戶說「幫我訂明天去廣州的票」,它不應(yīng)該每次都從零開始問一遍偏好,而是應(yīng)該知道用戶常坐哪類席別、常用哪個出行 App、發(fā)票抬頭是什么、是否傾向早上出發(fā)。
![]()
圖片來源:高通
端側(cè)記憶越充分,AI 越像一個真正理解用戶習(xí)慣的助手。
再比如,多模態(tài)理解也應(yīng)該更多走端側(cè)。用戶在任意界面問「這個靠譜嗎」「幫我總結(jié)一下」「把這里的地址發(fā)給他」,AI 需要快速理解屏幕內(nèi)容。每次截圖上傳云端,速度、隱私和穩(wěn)定性都會有壓力。
更強的 NPU、內(nèi)存和本地模型,可以讓這些輕量任務(wù)在手機上直接完成。
還有一個更容易被忽略的地方:散熱和續(xù)航。傳統(tǒng)旗艦手機的高負載主要來自游戲和影像,用戶可以感知,也通常有明確時長。但 Agent 的高負載可能更碎、更頻繁。它不一定每次都跑滿性能,卻可能一整天在后臺等待、監(jiān)聽、識別、摘要、檢索。
所以,第二代產(chǎn)品大概率會繼續(xù)堆大電池,也可能在散熱、內(nèi)存、存儲和系統(tǒng)調(diào)度上都會有改進。甚至可以進一步推測,它的硬件設(shè)計會圍繞幾個 AI 入口強化:獨立 AI 鍵、更高質(zhì)量的麥克風(fēng)、更穩(wěn)定的語音喚醒、更強的屏幕內(nèi)容識別、更好的隱私提示,以及更適合長時間握持和語音交互的機身設(shè)計。
從一代到二代,從「操作」到「協(xié)作」
更重要的還是 AI。到了今天,幾乎可以斷定第二代豆包 AI 手機在「代理」路徑上會有很大的改變,因為外部環(huán)境已經(jīng)完全不一樣了。
![]()
圖片來源:OpenClaw
過去半年,OpenClaw、Claude Code、Codex 等重量級產(chǎn)品,讓 Agent 生態(tài)發(fā)生了一個很重要的變化,即互聯(lián)網(wǎng)平臺加速擁抱 Agent,通過 MCP、A2A 協(xié)議或者官方 Skill 實現(xiàn) Agent 的交互。
MCP 解決的是 AI 如何連接工具和數(shù)據(jù)源。它把過去一個個定制化接口,變成一種更通用的連接方式。對開發(fā)者來說,AI 不必為每個服務(wù)單獨寫一套調(diào)用邏輯;對服務(wù)方來說,它也可以用更標準的方式暴露自己的能力。
A2A 解決的則是智能體之間如何通信。手機系統(tǒng)助手可以是一個 Agent,微信、支付寶、飛書、淘寶背后也可以有自己的 Agent。
系統(tǒng)助手不一定非要像人一樣去點微信界面,而是可以向微信的 Agent 發(fā)出一個明確請求:給某個聯(lián)系人發(fā)一條消息,或者發(fā)起一次視頻通話。微信再在自己的安全邊界內(nèi)執(zhí)行,并把結(jié)果返回給手機助手。
聽起來只是技術(shù)路線變化,但對 AI 手機卻是非常關(guān)鍵。第一代豆包手機嘗試「替用戶操作 App」,但基于 GUI 的 Agent 技術(shù)路線對現(xiàn)有生態(tài)沖擊太大,相比之下,基于協(xié)議的 Agent 技術(shù)路線反而越走越寬。
微信最近與多家手機廠商推進 A2A 助手能力,就是一個很明確的信號。微信并沒有完全打開自己的生態(tài),但它開始允許手機系統(tǒng)助手在特定場景下調(diào)用微信能力,比如發(fā)送消息、發(fā)起音視頻通話。整個過程強調(diào)雙重授權(quán),也強調(diào)由微信自己執(zhí)行并返回結(jié)果。
![]()
圖片來源:微博
包括豆包,過去半年也學(xué)起了千問,一方面連接自身的電商、支付等服務(wù)能力,一方面也在連接第三方平臺的服務(wù)。比如今天,豆包 APP 就在北京、杭州兩地啟動了一鍵打車的灰度測試,由曹操出行負責(zé)提供打車服務(wù),用戶直接在聊天框里說出行需求,系統(tǒng)自動識別地點、人數(shù)、偏好,匹配路線和價格后一鍵確認下單。
![]()
圖片來源:微博
所以可以預(yù)見的是,第二代豆包 AI 手機可能會保留 GUI Agent,因為大量中長尾 App 不可能馬上接入標準協(xié)議,但面對一些高風(fēng)險服務(wù)和強勢平臺,需要更多協(xié)議化、授權(quán)化的連接。
能用 A2A 或類似機制調(diào)用的,就不要再強行模擬點擊。必須模擬點擊的,也要有更清晰的權(quán)限提示、操作回放、關(guān)鍵步驟確認和風(fēng)險攔截。這會讓第二代豆包手機看起來沒有第一代那么「野」,但也更接近一臺真正能賣給普通人的手機。
成熟的AI手機應(yīng)該更「克制」
過去兩年,手機行業(yè)講了太多 AI,很多功能聽起來熱鬧,但真正給用戶帶來的改變卻不大,所以豆包手機狠狠刺激了一波手機行業(yè),也讓 AI 手機的競爭加快進入應(yīng)用生態(tài)和操作權(quán)限的深水區(qū):
手機廠商忙著重新定義系統(tǒng)助手,互聯(lián)網(wǎng)平臺忙著重新定義開放邊界,芯片廠商要繼續(xù)為端側(cè) Agent 提供更強大的算力和能效,開發(fā)者也要考慮自己的 App 如何被 AI 調(diào)用、被 AI 理解、被 AI 分發(fā)。
所以第二代豆包 AI 手機會不會長成這樣?我們還無從確認。
但真正成熟的 AI 手機,在人與 Agent、Agent 與設(shè)備的交互上應(yīng)該是更克制的:在大多數(shù)場景里應(yīng)該讓用戶少操作,但在關(guān)鍵場景里必須讓用戶清楚地看見 AI 正在做什么。它可以幫用戶填表、比價、整理行程、修圖、總結(jié)文件、發(fā)起溝通,但涉及付款、發(fā)消息、賬號登錄、金融等敏感操作時,應(yīng)該有明確的確認和可追溯記錄。
另一方面,就像雷科技之前文章中表達的,AI 手機不能把 GUI Agent 當(dāng)成唯一答案,也不應(yīng)該全盤拋棄 GUI Agent 的通用性優(yōu)勢,畢竟面對很多中長尾 App,開發(fā)者從精力、成本考慮就不可能在第一時間適配 Agent 的交互。
同時 AI 手機也不能只依賴云端模型,端側(cè) AI 能力的改進也勢在必行,端側(cè)低延遲、少打擾、能記住偏好、能理解上下文的一系列能力,才能確保日常的體驗。
如果第二代豆包 AI 手機都能做到這些,它的意義不只屬于豆包和努比亞。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.