想象一下這樣的場景:蘋果的工程師們坐在會議室里,面前擺著最新的iPhone原型機。他們要做的事情聽起來有點瘋狂——把谷歌那個參數多得嚇人的Gemini模型,硬生生塞進一臺手機里。
The Information的報道揭開了這個正在進行中的項目。蘋果正準備推出"完全重新構建的Siri",為此和谷歌簽了一份多年合同,要使用Gemini來驅動新版語音助手。但現在的問題是,Gemini太大了,大到iPhone根本裝不下。
![]()
蘋果這些年一直在強調一個理念:AI在設備本地運行,才能保護用戶隱私。這次對Gemini的改造也延續了這個思路,但現實情況是,完全靠手機自己處理顯然不現實。新的Siri會采用混合方案,部分任務在手機上完成,部分還是要靠云端服務器。
![]()
這里就出現了一個矛盾。搭載Gemini的Siri同時運行在設備和云端,這和蘋果一直堅持的"本地AI保護隱私"路線并不完全一致。Ars Technica和The Information的報道都指向了這一點:云端組件的引入幾乎是不可避免的。
說到手機跑AI,每次新芯片發布時,廠商都會強調AI性能有多強。蘋果也在自家芯片上搭載了專門處理AI和機器學習任務的NPU——Neural Engine,每次升級都要拿出來說一遍。這讓人容易產生一個錯覺:手機能輕松運行強大的AI模型。
實際情況要復雜得多。大多數手機GPU在AI推理時能處理的token數反而比專門的NPU更多。而Neural Engine這類NPU的設計目標是特定場景下的高效處理,它能讓AI推理速度變快,但最大的短板是內存不夠——根本裝不下巨型模型。
現在手機上能跑的AI模型都很小,參數規模通常在幾十億個左右。而谷歌最新的Gemini是數萬億參數級別,想在iPhone上直接運行,差距不是一點點。再加上手機端的模型通常會做量化處理,用低精度換速度,結果就是生成的回答質量會打折扣,偶爾冒出一兩句讓人摸不著頭腦的話。
谷歌其實有移動端專用的Gemini Nano,但那個是為Magic Cue、語音摘要這類特定功能設計的。Siri的定位完全不同,它是一個對話型助手,用戶對它說話,它要能執行各種操作。Ars Technica指出,這是完全不同的體驗,需要完全不同的模型。有意思的是,谷歌自己的Android系統倒沒有在本地跑AI模型,和Gemini的對話都是直接送到云端處理。
![]()
消息顯示,蘋果和谷歌簽完合同后就開始動手優化Gemini了。Ars Technica把這個過程描述為"讓資源消耗少的輕量模型去模仿大型昂貴模型的學習過程"。花足夠時間的話,可以把關鍵功能保留下來,去掉那些不太重要的部分。這樣一來,Siri或許能在本地處理一部分任務,但The Information明確說了:云端部分的引入跑不掉。
蘋果為Apple Intelligence服務搭建了一套叫Private Cloud Compute的服務器,在設計上強調了隱私保護。但問題是,要在Private Cloud Compute上運行谷歌的龐然大物Gemini,據The Information的報道,這件事異常困難。
之前就有消息說,新版Siri的聊天功能可能不會在蘋果自己的服務器上運行。最新的進展是,Gemini不會跑在谷歌的服務器上。蘋果簽了另一個合同,要用NVIDIA的保密計算技術來運行Gemini。這種技術能讓數據在云端處理期間,GPU上的內容一直保持加密狀態。蘋果靠這個安排,依然可以宣稱自己在重視用戶隱私。
所有答案可能要到6月才能揭曉。蘋果的年度開發者大會WWDC26定在2026年6月8日那一周開幕,6月8日當天有主題演講。按慣例,全新的Siri會和其他新系統、新功能一起對外展示。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.