亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

誰(shuí)在決定AI手機(jī)的未來(lái):模型、系統(tǒng),還是生態(tài)?

0
分享至

手機(jī)可能是首個(gè)真正被 AI 接管的終端。全球有數(shù)十億智能手機(jī)用戶,每天生產(chǎn)著海量的數(shù)據(jù)。這些數(shù)據(jù)成為 AI 的燃料,反過(guò)來(lái),AI 讓手機(jī)更加智能。

當(dāng)蘋果還在持續(xù)評(píng)估 Siri 的底層供應(yīng)商之時(shí),安卓手機(jī)廠商已經(jīng)摩拳擦掌,在能部署 AI 功能的地方都塞上了 AI。無(wú)論是字節(jié)跳動(dòng)與手機(jī)廠商中興在操作系統(tǒng)層面合作推出的豆包 AI 手機(jī)工程樣機(jī),還是智譜開源能夠自動(dòng)化操作手機(jī)界面的 AI Agent 模型 AutoGLM,都引起了市場(chǎng)對(duì) AI 手機(jī)或手機(jī) Agent 的高度關(guān)注。

按照業(yè)界的預(yù)期,Agent 將非常深刻地改變?cè)谥悄芙K端上的人機(jī)交互邏輯。從主動(dòng)式的 AI 響應(yīng)對(duì)話,到“次拋型”的 APP,千人千面的終端服務(wù)將成為可能。

無(wú)論是 AI 手機(jī)還是在手機(jī)中開源 Agent 模型,對(duì)于 Agent 應(yīng)用與終端的普及、提高行業(yè)智能體體驗(yàn)的底線都有正向的影響。開源模型也在一定程度上緩解了終端廠商的數(shù)據(jù)安全焦慮,并能夠更好地融合進(jìn)廠商原有的 Agent 助手系統(tǒng),而非必須“另起爐灶”。與此同時(shí),互聯(lián)網(wǎng)應(yīng)用也獲得了一個(gè)強(qiáng)大的基礎(chǔ),用于開發(fā)應(yīng)用內(nèi)的自主操控智能體應(yīng)用。

在當(dāng)下的實(shí)踐中,手機(jī)應(yīng)用主要分為娛樂(lè)、查詢和工作三類。相比點(diǎn)外賣、買咖啡這些日常小事,AI 手機(jī)里的 Agent 更大的價(jià)值可能在于提升工作效率——幫用戶快速搞定那些原本復(fù)雜耗時(shí)的任務(wù),比如深度信息搜索、全網(wǎng)比價(jià)購(gòu)物、個(gè)人數(shù)據(jù)查詢管理等。這些事情以前可能要折騰半天,現(xiàn)在 Agent 能幫你幾分鐘就解決。

例如,Agent 可以通過(guò)整理手機(jī)中的聊天記錄、照片視頻、購(gòu)物歷史等數(shù)據(jù),幫你回憶某段時(shí)間的生活軌跡或重要事件。

然而,現(xiàn)在移動(dòng)終端面臨的核心問(wèn)題是:缺乏統(tǒng)一的 Agent 生態(tài)系統(tǒng),無(wú)法有效打通不同應(yīng)用之間的功能調(diào)用。加上行業(yè)內(nèi)尚未就 Agent 生態(tài)標(biāo)準(zhǔn)形成統(tǒng)一共識(shí),這些因素共同導(dǎo)致 AI 手機(jī)很難通過(guò)應(yīng)用工具調(diào)用的方式實(shí)現(xiàn)真正的智能操作。

因此,為了讓手機(jī) Agent 能夠通用地使用不同應(yīng)用,目前只能“曲線救國(guó)”——通過(guò)圖形用戶界面(GUI,Graphical User Interface)的方式,模擬人手操作來(lái)控制手機(jī)。操作邏輯其實(shí)就是多模態(tài)理解:先看懂手機(jī)當(dāng)前的屏幕截圖,然后像人一樣去點(diǎn)擊相應(yīng)的 APP 和按鈕,最后完成具體任務(wù)。

這種方式適用性很強(qiáng),理論上能操作各種 APP。但問(wèn)題是移動(dòng)設(shè)備的算力和存儲(chǔ)有限,面臨兩難選擇:7B 以下的小模型處理復(fù)雜 GUI 任務(wù)力不從心;而 7B 以上的大模型雖然功能強(qiáng)大,但體積太大、成本太高,在手機(jī)上跑起來(lái)很困難。

AI 手機(jī)的路線之爭(zhēng):云端還是端側(cè)?

目前,AI 手機(jī)(包括手機(jī) Agent)主要分為三條技術(shù)路線:純?cè)贫四P汀⒓兌藗?cè)模型和端云協(xié)同模型。

純?cè)贫四P投嘤糜谝苿?dòng)端(例如 AI 手機(jī)等)需要多個(gè)步驟和任務(wù)部署的復(fù)雜任務(wù)。另外,在多 APP 操作的場(chǎng)景下,由于任務(wù)相對(duì)較難,需要較強(qiáng)的推理能力和多模態(tài)理解,也會(huì)更多地使用云端模型。

盡管云端模型整體性能效果比端側(cè)模型強(qiáng),但問(wèn)題在于數(shù)據(jù)存放在云端,面臨包括照片、視頻、聊天信息、郵件等在內(nèi)的數(shù)據(jù)隱私問(wèn)題。此外,高成本和帶寬也是不容忽視的關(guān)鍵問(wèn)題。因此,在一些涉及個(gè)人數(shù)據(jù)、隱私性較強(qiáng)的場(chǎng)景則需要純端側(cè)模型。對(duì)于端云協(xié)同框架,則適用于云端和端側(cè)能力差別不顯著的場(chǎng)景。

一個(gè)關(guān)鍵的問(wèn)題付出水面:在手機(jī)這樣算力、能耗和隱私都極度受限的終端上,是否真的存在一種現(xiàn)實(shí)解法——既不過(guò)度依賴云端,又能跑得動(dòng) GUI Agent?

近期,香港大學(xué)黃超教授團(tuán)隊(duì)給出了一個(gè)平衡成本和性能的新方案,我們從這個(gè)案例中或許可以看到一些啟發(fā)。研究團(tuán)隊(duì)開源了一個(gè)叫 OpenPhone 的項(xiàng)目(Mobile Agentic Foundation Models)[1]。在該項(xiàng)目中,不僅開源了一個(gè)純端側(cè) 3B 尺寸的小模型,還提供了一套端云協(xié)同的方案,這樣既能在隱私敏感的場(chǎng)景下用本地模型處理,又能在隱私不敏感的復(fù)雜任務(wù)上調(diào)用云端大模型來(lái)保證完成質(zhì)量。

考慮手機(jī)的能耗限制和實(shí)際部署的可能性,研究人員基于開源的 Qwen2.5-VL-3B 模型和自動(dòng)化生成的 GUI 數(shù)據(jù),通過(guò)監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)策略實(shí)現(xiàn)了與通用的 7B 模型相當(dāng)?shù)男阅堋?/p>


(來(lái)源:arXiv)

OpenPhone 還引入了一種類似于思維鏈(CoT,Chain of Thought)的長(zhǎng)推理機(jī)制。該機(jī)制的“巧妙之處”在于,將包括屏幕狀態(tài)、任務(wù)進(jìn)度和推理過(guò)程等在內(nèi)的每一步信息,從存儲(chǔ)原始高分辨率截圖壓縮成精簡(jiǎn)的文本描述,有效地降低了歷史上下文的存儲(chǔ)負(fù)擔(dān),從而實(shí)現(xiàn)了 Agent 的長(zhǎng)期反思以及決策能力。

在 138 項(xiàng)手機(jī)任務(wù)的測(cè)試中,OpenPhone 在性能接近 9B 模型的情況下,速度提升了 4 倍?!皬亩藗?cè)測(cè)試結(jié)果來(lái)看,訓(xùn)練數(shù)據(jù)對(duì)于 GUI Agent 的表現(xiàn)至關(guān)重要,OpenPhone 提供了一套可以最大化人工標(biāo)記數(shù)據(jù)價(jià)值的數(shù)據(jù)生成管道,利用有限的數(shù)據(jù)來(lái)盡可能增強(qiáng) GUI Agent 的能力?!秉S超告訴 DeepTech。

該研究證明,盡管小模型在泛化能力上不如大模型,但其在手機(jī) Agent 場(chǎng)景中,可通過(guò)長(zhǎng)推理等方式激發(fā)小模型的執(zhí)行任務(wù)能力,其在移動(dòng)端的潛力同樣不容忽視。


圖丨 OpenPhone 的總體框架(來(lái)源:arXiv)

黃超解釋道:“在 OpenPhone 項(xiàng)目中,端云協(xié)同框架不僅可節(jié)約模型本身的 token 開銷,還能降低成本。但是,如果模型云端效果顯著好于端側(cè),則依然會(huì)采用云端模型來(lái)進(jìn)行操作?!?/p>

研究團(tuán)隊(duì)坦言,該框架在實(shí)際部署過(guò)程中,可能會(huì)面臨大量工程性的優(yōu)化問(wèn)題。近期,他們也在和企業(yè)界溝通探討未來(lái)合作的方式。“盡管目前 AI 手機(jī)的大部分解決方案依賴于云端,但業(yè)界對(duì)端側(cè)突破仍寄予厚望。從我們與企業(yè)的交流來(lái)看,他們更傾向于在端側(cè)解決,云端可能只是當(dāng)前的權(quán)宜之計(jì)。”黃超表示。

可以看到,端云協(xié)同是在當(dāng)下平衡隱私和效果(成功率)的一個(gè)比較可行的方案。如果不考慮能耗和終端部署情況,端側(cè)處理最為理想,并能幫設(shè)備廠商節(jié)約云端算力。未來(lái),端云協(xié)同仍會(huì)是一個(gè)比較理想的范式。

業(yè)內(nèi)人士告訴 DeepTech,端云協(xié)同長(zhǎng)期來(lái)看是最佳選擇,不過(guò)短期內(nèi)受制于端側(cè)芯片算力和內(nèi)存限制,端上不太可能完整運(yùn)行所有 AI 手機(jī)需要的模型功能,仍需要較長(zhǎng)的時(shí)間和行業(yè)內(nèi)的軟硬協(xié)同發(fā)展。

因此,比較理想的狀態(tài)自然是簡(jiǎn)單任務(wù)能路由到端側(cè)直接運(yùn)行,復(fù)雜任務(wù)路由到云端執(zhí)行,但是實(shí)現(xiàn)這樣的目標(biāo)需要先跑通 AI 手機(jī)生態(tài)實(shí)現(xiàn)意圖理解的數(shù)據(jù)飛輪,模型才可能將來(lái)做到這一目標(biāo)。

AI 手機(jī)真正的難題:誰(shuí)來(lái)開放操作系統(tǒng)的權(quán)限?

回到一個(gè) AI 手機(jī)繞不過(guò)的問(wèn)題:包括社交軟件、操作軟件或信息查詢軟件在內(nèi)的主流 APP,會(huì)禁止手機(jī) Agent 的訪問(wèn)權(quán)限。

從智能手機(jī)的角度來(lái)看,如果用戶通過(guò)手機(jī) Agent 來(lái)操作所有 APP,即通過(guò) GUI 方式進(jìn)行訪問(wèn),那么 APP 有可能喪失流量入口,直接導(dǎo)致 APP 賴以為生的廣告價(jià)值歸零。

有專家指出,現(xiàn)在的問(wèn)題在于,整個(gè)移動(dòng)端的 AI 手機(jī)整體生態(tài)會(huì)往哪里走,可能取決于手機(jī)廠商的戰(zhàn)略制定??傮w來(lái)看,解決這個(gè)問(wèn)題有兩種方案:一是 AI 手機(jī)廠商有一套自己的生態(tài),二是未來(lái)可能也會(huì)涉及到流量入口的合作。

在 DeepTech 與幾位業(yè)內(nèi)人士的交流中,普遍認(rèn)為 AI 手機(jī)的生態(tài)并非僅依賴某幾家企業(yè)或技術(shù)進(jìn)步的問(wèn)題,而是整個(gè)行業(yè)共同面臨的生態(tài)問(wèn)題,包括技術(shù)提供方(例如 AI 助手能力提供方、操作系統(tǒng)廠商、硬件供應(yīng)鏈模型企業(yè))、應(yīng)用與服務(wù)方(例如端硬件、互聯(lián)網(wǎng)應(yīng)用)、用戶、開發(fā)者和監(jiān)管機(jī)構(gòu)等。

對(duì)于手機(jī)操作系統(tǒng)本身的權(quán)限開放,業(yè)內(nèi)人士指出,需要謹(jǐn)慎但堅(jiān)定的推動(dòng),不宜操之過(guò)急但也萬(wàn)不可故步自封。其類似自動(dòng)駕駛上路的發(fā)展,可以考慮在滿足審計(jì)安全要求下,通過(guò)試點(diǎn)硬件產(chǎn)品和應(yīng)用場(chǎng)景開放合作,逐步推動(dòng)相關(guān)場(chǎng)景落地和教育,并且同步建設(shè)起更完整的生態(tài)機(jī)制。

談及在操作系統(tǒng)層面兼顧支持高效模型調(diào)度、有效管理本地安全權(quán)限以及保障用戶隱私策略的策略,一位業(yè)內(nèi)人士告訴 DeepTech,這是一個(gè)較復(fù)雜的問(wèn)題,短期來(lái)看需要先建立 Agent 與用戶、系統(tǒng)和應(yīng)用之間的互信授權(quán)機(jī)制,同時(shí)建立起關(guān)于 Agent 的審計(jì)與安全柵欄,明確智能體“上路”的水平要求和安全底線。長(zhǎng)期來(lái)看,該方向的發(fā)展極大程度取決于 AI 和大模型本身的發(fā)展進(jìn)度,需要審時(shí)度勢(shì)地考慮實(shí)際發(fā)展情況進(jìn)行決策。

此外還需要看到的是,無(wú)論是云端還是端側(cè)模型,AI 手機(jī)任務(wù)的成功率目前尚不及人類水平,未來(lái)還需要在準(zhǔn)確率和可靠性方面同步提升。并且,純 GUI Agent 整體響應(yīng)速度還有很大的提升空間。

黃超認(rèn)為,未來(lái)模型上下文協(xié)議(MCP,Model Context Protocol)生態(tài)輔助 GUI 作為解決方案,有望提升手機(jī) Agent 的整體響應(yīng)速度和準(zhǔn)確率?!熬拖裰悄苁謾C(jī)需要 APP Store,AI 手機(jī)也需要類似的平臺(tái),讓整個(gè)社區(qū)都活躍起來(lái)貢獻(xiàn)高質(zhì)量的 MCP,再去調(diào)用它們。從生態(tài)角度來(lái)看,APP 只有保持開放狀態(tài)并放出自己的 MCP,構(gòu)建一套更加完善高效的合作模式,才能守住自己的流量,否則流量也有可能會(huì)被其他類似 APP 搶走。未來(lái)應(yīng)用可能會(huì)呈現(xiàn)出兩種交互模式:一種是面向智能體的交互,另一種是面向人類的交互。”

可見(jiàn),AI 手機(jī)真正廣泛應(yīng)用的標(biāo)志,不在于模型多強(qiáng),而是不同 APP 應(yīng)用廠商如何共建手機(jī)智能體的環(huán)境。當(dāng)然,這同樣需要整個(gè)生態(tài)系統(tǒng)共同推動(dòng)技術(shù)的發(fā)展和落地。

參考資料:

1.https://arxiv.org/abs/2510.22009v1

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女子高空拋撒百萬(wàn)港幣后續(xù):正面照曝光,原因公開,親屬曝出內(nèi)情

女子高空拋撒百萬(wàn)港幣后續(xù):正面照曝光,原因公開,親屬曝出內(nèi)情

解鎖世界風(fēng)云
2026-04-15 20:34:10
特朗普稱有能力在“一小時(shí)內(nèi)”摧毀伊朗的橋梁和發(fā)電廠

特朗普稱有能力在“一小時(shí)內(nèi)”摧毀伊朗的橋梁和發(fā)電廠

新華社
2026-04-15 20:15:07
麥當(dāng)娜:與保鏢的性愛(ài)視頻,被保鏢拍賣后,她的反應(yīng)讓人稱贊

麥當(dāng)娜:與保鏢的性愛(ài)視頻,被保鏢拍賣后,她的反應(yīng)讓人稱贊

七阿姨愛(ài)八卦
2026-04-15 17:23:47
南通一客運(yùn)站掛出招租橫幅!一代人的擠車記憶,真的落幕了?

南通一客運(yùn)站掛出招租橫幅!一代人的擠車記憶,真的落幕了?

好通網(wǎng)
2026-04-15 08:46:44
江西男子徐平安去世,年僅24歲,愛(ài)健身一身肌肉,確診后不到一年

江西男子徐平安去世,年僅24歲,愛(ài)健身一身肌肉,確診后不到一年

社會(huì)日日鮮
2026-04-15 05:53:10
企業(yè)增值稅的設(shè)計(jì):虧損了也要交稅

企業(yè)增值稅的設(shè)計(jì):虧損了也要交稅

生命可以承受之輕
2026-04-15 06:48:23
兩岸命運(yùn)掌握在自己手上!鄭麗文喊話賴清德:為和平大業(yè)愿意溝通

兩岸命運(yùn)掌握在自己手上!鄭麗文喊話賴清德:為和平大業(yè)愿意溝通

海峽導(dǎo)報(bào)社
2026-04-15 17:04:04
采訪了100個(gè)娶了小三的男人,他們幾乎都說(shuō)了同一句話,讓人恍然

采訪了100個(gè)娶了小三的男人,他們幾乎都說(shuō)了同一句話,讓人恍然

千秋文化
2026-04-15 20:18:32
A股迎重磅新政:三十年來(lái)首次延長(zhǎng)交易時(shí)長(zhǎng),牛市要來(lái)了

A股迎重磅新政:三十年來(lái)首次延長(zhǎng)交易時(shí)長(zhǎng),牛市要來(lái)了

人生錄
2026-04-15 16:18:11
王哲林20+16上海險(xiǎn)勝?gòu)V州豪取20連勝 徐昕10+15伯頓36+10

王哲林20+16上海險(xiǎn)勝?gòu)V州豪取20連勝 徐昕10+15伯頓36+10

醉臥浮生
2026-04-15 21:22:42
張子強(qiáng)團(tuán)伙中,唯一聽了李嘉誠(chéng)建議買28套豪宅的青年,后來(lái)如何了

張子強(qiáng)團(tuán)伙中,唯一聽了李嘉誠(chéng)建議買28套豪宅的青年,后來(lái)如何了

深度報(bào)
2026-04-14 22:45:47
臭氣熏天,記者現(xiàn)場(chǎng)“yue”個(gè)不停!網(wǎng)友:很久沒(méi)看到這么有“活人感”的報(bào)道,隔著屏幕都能感受到

臭氣熏天,記者現(xiàn)場(chǎng)“yue”個(gè)不停!網(wǎng)友:很久沒(méi)看到這么有“活人感”的報(bào)道,隔著屏幕都能感受到

深圳晚報(bào)
2026-04-15 14:53:52
泰國(guó)征兵再出“美女”奇葩名場(chǎng)面!有人盛裝亮相美成天仙,有人為逃避吃成200斤?

泰國(guó)征兵再出“美女”奇葩名場(chǎng)面!有人盛裝亮相美成天仙,有人為逃避吃成200斤?

英國(guó)報(bào)姐
2026-04-14 21:12:12
反轉(zhuǎn)!巴西部長(zhǎng)強(qiáng)行封殺比亞迪,盧拉深夜震怒:立刻卷鋪蓋走人!

反轉(zhuǎn)!巴西部長(zhǎng)強(qiáng)行封殺比亞迪,盧拉深夜震怒:立刻卷鋪蓋走人!

共工之錨
2026-04-15 00:31:36
張雪峰去世不到一個(gè)月,員工宣布離職,低價(jià)挖客戶,賬號(hào)已私密

張雪峰去世不到一個(gè)月,員工宣布離職,低價(jià)挖客戶,賬號(hào)已私密

180視角
2026-04-15 17:52:51
上萬(wàn)美軍封鎖下,多艘貨船成功通過(guò)霍爾木茲海峽,美軍稱已完全切斷伊朗海上進(jìn)出口貿(mào)易;美國(guó)為何在此時(shí)打出“封鎖牌”?伊朗如何反擊?

上萬(wàn)美軍封鎖下,多艘貨船成功通過(guò)霍爾木茲海峽,美軍稱已完全切斷伊朗海上進(jìn)出口貿(mào)易;美國(guó)為何在此時(shí)打出“封鎖牌”?伊朗如何反擊?

每日經(jīng)濟(jì)新聞
2026-04-15 10:59:49
王博被驅(qū)逐!三大核心缺席廣廈惜敗山西 布朗空砍41分

王博被驅(qū)逐!三大核心缺席廣廈惜敗山西 布朗空砍41分

醉臥浮生
2026-04-15 21:51:38
不想訪華了?特朗普召回美駐華大使,貝森特?fù)P言:中國(guó)“不可靠”

不想訪華了?特朗普召回美駐華大使,貝森特?fù)P言:中國(guó)“不可靠”

影孖看世界
2026-04-15 22:29:46
何潤(rùn)東瞿穎內(nèi)衣廣告爆了!網(wǎng)友:太頂了!

何潤(rùn)東瞿穎內(nèi)衣廣告爆了!網(wǎng)友:太頂了!

品牌頭版
2026-04-15 20:29:41
女子利用天氣預(yù)報(bào)頻繁購(gòu)買飛機(jī)延誤險(xiǎn),5年買中900多次,獲賠近300萬(wàn),被抓時(shí):我符合保險(xiǎn)理賠要求

女子利用天氣預(yù)報(bào)頻繁購(gòu)買飛機(jī)延誤險(xiǎn),5年買中900多次,獲賠近300萬(wàn),被抓時(shí):我符合保險(xiǎn)理賠要求

譚老師地理大課堂
2026-04-15 20:11:42
2026-04-15 23:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16580文章數(shù) 514879關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

教育
時(shí)尚
健康
親子
公開課

教育要聞

千城百縣看中國(guó)|山東定陶:創(chuàng)意滿格大課間

赫本愛(ài)穿的傘裙,好優(yōu)雅!

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

親子要聞

母嬰命懸一線,兇險(xiǎn)性前置胎盤穿透膀胱,這家醫(yī)院如何力挽狂瀾

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版