網易首頁 > 網易號 > 正文申請入駐

iPhone塞進完整版Gemini？蘋果這步棋有點意思

2026-05-30 05:07:51　來源: 薛定諤的BUG

北京舉報

分享至

想象一下這樣的場景：蘋果的工程師們坐在會議室里，面前擺著最新的iPhone原型機。他們要做的事情聽起來有點瘋狂——把谷歌那個參數多得嚇人的Gemini模型，硬生生塞進一臺手機里。

The Information的報道揭開了這個正在進行中的項目。蘋果正準備推出"完全重新構建的Siri"，為此和谷歌簽了一份多年合同，要使用Gemini來驅動新版語音助手。但現在的問題是，Gemini太大了，大到iPhone根本裝不下。

蘋果這些年一直在強調一個理念：AI在設備本地運行，才能保護用戶隱私。這次對Gemini的改造也延續了這個思路，但現實情況是，完全靠手機自己處理顯然不現實。新的Siri會采用混合方案，部分任務在手機上完成，部分還是要靠云端服務器。

這里就出現了一個矛盾。搭載Gemini的Siri同時運行在設備和云端，這和蘋果一直堅持的"本地AI保護隱私"路線并不完全一致。Ars Technica和The Information的報道都指向了這一點：云端組件的引入幾乎是不可避免的。

說到手機跑AI，每次新芯片發布時，廠商都會強調AI性能有多強。蘋果也在自家芯片上搭載了專門處理AI和機器學習任務的NPU——Neural Engine，每次升級都要拿出來說一遍。這讓人容易產生一個錯覺：手機能輕松運行強大的AI模型。

實際情況要復雜得多。大多數手機GPU在AI推理時能處理的token數反而比專門的NPU更多。而Neural Engine這類NPU的設計目標是特定場景下的高效處理，它能讓AI推理速度變快，但最大的短板是內存不夠——根本裝不下巨型模型。

現在手機上能跑的AI模型都很小，參數規模通常在幾十億個左右。而谷歌最新的Gemini是數萬億參數級別，想在iPhone上直接運行，差距不是一點點。再加上手機端的模型通常會做量化處理，用低精度換速度，結果就是生成的回答質量會打折扣，偶爾冒出一兩句讓人摸不著頭腦的話。

谷歌其實有移動端專用的Gemini Nano，但那個是為Magic Cue、語音摘要這類特定功能設計的。Siri的定位完全不同，它是一個對話型助手，用戶對它說話，它要能執行各種操作。Ars Technica指出，這是完全不同的體驗，需要完全不同的模型。有意思的是，谷歌自己的Android系統倒沒有在本地跑AI模型，和Gemini的對話都是直接送到云端處理。

消息顯示，蘋果和谷歌簽完合同后就開始動手優化Gemini了。Ars Technica把這個過程描述為"讓資源消耗少的輕量模型去模仿大型昂貴模型的學習過程"。花足夠時間的話，可以把關鍵功能保留下來，去掉那些不太重要的部分。這樣一來，Siri或許能在本地處理一部分任務，但The Information明確說了：云端部分的引入跑不掉。

蘋果為Apple Intelligence服務搭建了一套叫Private Cloud Compute的服務器，在設計上強調了隱私保護。但問題是，要在Private Cloud Compute上運行谷歌的龐然大物Gemini，據The Information的報道，這件事異常困難。

之前就有消息說，新版Siri的聊天功能可能不會在蘋果自己的服務器上運行。最新的進展是，Gemini不會跑在谷歌的服務器上。蘋果簽了另一個合同，要用NVIDIA的保密計算技術來運行Gemini。這種技術能讓數據在云端處理期間，GPU上的內容一直保持加密狀態。蘋果靠這個安排，依然可以宣稱自己在重視用戶隱私。

所有答案可能要到6月才能揭曉。蘋果的年度開發者大會WWDC26定在2026年6月8日那一周開幕，6月8日當天有主題演講。按慣例，全新的Siri會和其他新系統、新功能一起對外展示。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.