網易首頁 > 網易號 > 正文申請入駐

蘋果把Siri交給了Gemini

2026-06-09 20:52:56　來源: 鏡相工作室

北京舉報

分享至

文丨邱庭

編輯丨程述白

2011年10月4日，蒂姆·庫克（Tim Cook）第一次以蘋果CEO身份主持發布會——這也是Siri在蘋果的第一次亮相。

十五年后，2026年6月9日，庫克站在WWDC（蘋果全球開發者大會）的舞臺中央，外界普遍認為這是他任內最后一屆開發者大會。Siri又一次成為了焦點。

只是，它已經不是當年的Siri了。

盡管受制于監管要求，新版Siri以及其他新的蘋果AI智能功能還無法在中國大陸地區上線，但它還是讓不少人興奮了起來。在一鏡到底的演示中，這個“新siri”能在絕大部分場景下直接調用、索引并讀取聊天記錄，支持跨應用執行任務，還能通過自然語言生成瀏覽器插件與快捷指令。

但驅動它思考的，已經不完全是蘋果自己的能力。發布會上，蘋果首次明確將Google Gemini納入Apple Foundation架構。據彭博社報道，蘋果為此需每年向Google支付10億美元。

●蘋果的第三代Apple Foundation Models（AFM）。圖源：發布會截圖

與此同時，蘋果同步推出Core AI框架，ChatGPT、Claude等第三方模型也能借此接入Siri和蘋果系統。

過去十五年里，Siri始終代表著蘋果對人工智能的理解：封閉、自研、謹慎，一切能力都生長在蘋果生態內部，2024年蘋果首次提出的Apple Intelligence構想也是全自研AI架構。但在AI模型的競賽里，蘋果沒能跑在前列。

十五年前，Siri開啟了語音助手時代；十五年后，它再次成為蘋果命運轉折點的見證者。只是這一次，蘋果不再是先鋒，而是追趕者了。

新的Siri

今年WWDC上，蘋果用了大半場發布會的時間講AI。

站在舞臺上的，是邁克?洛克威爾（Mike Rockwell）。這位長期負責Vision Pro系統架構的高管，在2025年初接手了Siri重構項目。蘋果展示了一組新的AI同心圓架構：用戶位于中心，中層是多模態與執行工具，最外層則是Siri、軟件與系統生態。

●蘋果新的AI架構。圖源：發布會截圖

Siri的新功能可以大致分為屏幕感知、圖片理解、文字處理、應用協同等幾大部分。用戶不再需要在不同應用之間來回切換：刷到一個圖片，可以直接識別圖片地點；看到一個地址，可以直接詢問Siri規劃路線；瀏覽網頁時，可以直接選中文字向Siri提問；收到活動邀請，可以直接讓Siri識別時間并加入日歷。

這種變化的重點不在更聰明，而在更絲滑與便捷。在Mac上，用戶可以直接選中多個文件提問，無需上傳；在iPhone上，可以通過攝像頭直接向Siri提問現實世界中的物體；在照片、郵件、備忘錄、Safari等應用中，AI被直接嵌入原有工作流，給拍攝好的照片重新設置構圖、整理瀏覽器標簽頁、把校對和優化功能嵌入鍵盤隨時調用。

●Siri在iPhone與Mac端的調用。圖源：發布會截圖

更重要的是，舊版Siri的邏輯是單輪問答，而新版系統則開始嘗試理解用戶“正在做什么”，它可以根據聊天對象與過往聊天記錄采用不同的交談語氣，可以基于郵件內容主動提示下一步操作，或在跨應用場景中預判用戶意圖，從而提前給出執行路徑。

蘋果試圖重新定義Siri，把它從一個客服轉化為調度中心，并推出了獨立的Siri應用。這也意味著蘋果推翻了很多以前的堅守：原本不想做聊天機器人，現在做了；原本對照片使用AI修圖持保留態度，現在也加了。

過去，蘋果在Siri到底使用自研模型還是外部模型的問題上搖擺不定。而現在，團隊放棄了完全自研Apple Foundation Models的方案，轉而選擇整合外部技術。在洽談合作的Google、Anthropic PBC和OpenAI三家公司里，蘋果最終選擇了Google。

如今的第三代Apple Foundation Models包含2款端側模型和3款運行在私有云計算平臺上的模型，其中多款借助Google Gemini模型進行“精煉”。本地模型與私有云架構，是為保證數據不會被蘋果與其他第三方公司訪問。

今年WWDC傳遞的信號是，Siri學會了看屏幕、總結網頁以及理解照片。但更關鍵的是蘋果戰略的轉變：在AI時代，它不再執著于做底層能力的提供者，而更傾向于成為這些能力的組織者。

從不被重視，到寄予厚望

回到2011年，Siri還是一個被賦予想象力的產品。它的起點不在蘋果，而是Siri.Inc開發的獨立App，2010年在App Store上線，定位是可以幫你訂餐廳、查天氣、做信息整合的“個人秘書”。其基礎技術來自于美國國防高級研究計劃局從2003年起，就開始投入約1.5億美元資金資助的虛擬代理人技術開發項目。

Siri上線3周后，蘋果創始人史蒂夫·喬布斯（Steve Jobs）對它產生了興趣，邀請創始人會面。兩個月后，蘋果宣布以2億美元收購Siri，并整合進了2012年面世的iPhone 4S里，成為了后者最重要的功能之一。

然而，2011年至2015年間，Siri的更新幾乎都是微調，例如增加多語言支持、簡單信息查詢、百科內容接入、“嘿Siri”喚醒等。甚至在iOS 15中，蘋果還刪除了Siri中涉及筆記、照片、叫車、支付等的功能。到今天，Siri上利用率最高的功能，仍然是2011年剛亮相時就具備的能力——設個鬧鐘。

Siri的技術護城河并不牢固。2012年三星S Voice在功能層面已與Siri接近；2014年的對比測試中，Google Now在信息理解與推薦能力上反超Siri；到2017年，美國科技媒體The Verge直接評價Siri“明顯落后于時代”，它的領先窗口期實際上極為短暫。

2018年，美國科技媒體The Information披露了一份關于Siri團隊變動的長篇報道。據受訪前員工回憶，在初期，Siri是在還沒準備好的情況下面世的，后端架構并未適配大規模用戶流量，一位蘋果員工后來重寫了一段代碼，才讓Siri某后端組件的服務器需求從約500臺縮減到了5臺。

蘋果內部對Siri的定位也未達成一致。一派認為，Siri的核心應該是搜索與檢索，另一派則堅持，Siri必須成為真正的助手。

一位前蘋果員工說，“喬布斯在Siri推出后的第二天去世了，蘋果也由此失去了前進的方向。”于是Siri的研發長期處于一種分裂的狀態，一部分人負責語音識別，一部分人負責系統集成，還有一部分人負責體驗層優化。在這種背景下，Siri團隊各自為戰，缺乏統一演進邏輯。

這種割裂也延伸到產品層面。要把Siri搭載至HomePod的消息，Siri團隊2015年才得知。那時候，蘋果為了與2014年底亞馬遜發布的Echo競爭，匆忙把Siri應用到了項目之中。發布后，《紐約時報》評價：“HomePod 上的Siri拉垮得令人尷尬”。后續HomePod的市場表現不佳，也被內部部分人士認為是Siri團隊能力不足的緣故。

●2017年，蘋果推出的內置Siri智能音箱“HomePod ”。圖源：Unsplash

與此同時，隱私爭議成為Siri長期陰影。2019年，Siri被指在用戶未主動喚醒時錄音，并將片段發送給外包商人工收聽，遭集體訴訟。2025年初，美國加州法院批準了蘋果就該案達成的和解協議，最終符合條件的用戶每臺設備獲賠約8.02美元，單人最高賠付不超過40.1美元。

Siri項目在蘋果內部也曾多次經歷領導權調整。從最初的iOS團隊主導，到2012年由比爾·斯塔西奧（Bill Stasior）帶領獨立團隊運作，再到2018年機器學習團隊介入......

直到生成式AI浪潮到來，Siri的重要性重新提前。新Siri命運的轉折點，在2025年初的一場會議。這場會議聚集了除CEO庫克以外大部分蘋果核心領導，會議確認Apple Intelligence的表現未達預期，新一代Siri的迭代也將推遲。

那時，庫克對時任AI負責人約翰?詹南德雷亞（John Giannandrea）失去信心。主導了Vision Pro新產品誕生的洛克威爾主動請纓，接下了Siri。

之后，洛克威爾把曾經負責Vision Pro和VisionOS操作系統的團隊帶來作為Siri的新負責團隊，并立即啟動使用第三方模型的方案。Siri的新路線由此確立了。

不做軟件，回歸硬件

蘋果與谷歌的這次合作，蘋果每年需向Google支付約10億美元，用于使用其AI技術與基礎設施能力。

過去二十年，蘋果的技術路徑幾乎建立在芯片自研、系統自研、服務自建的原則上。這一次使用Gemini，官方解釋是基于技術評估后的結果，認為Gemini提供了當前“最有能力的基礎模型”。

2022年，蘋果內部團隊構建的好幾個大語言模型，但因公司高層質疑“實用性不足”被擱置。此后，蘋果在AI上的投入節奏與規模也顯得保守。2025財年（2024.9–2025.9）其研發投入約345億美元，而同時期Meta約573.72億美元，谷歌約610.87億美元。

在Siri多次延期之后，蘋果實質上放棄了做全棧大模型的執著，轉而回歸其根植于硬件的生態優勢。下一任蘋果CEO熱門候選人約翰?特努斯（John Ternus）也正是如今的蘋果硬件工程高級副總裁。

對蘋果而言，原來的賽道更穩定，也更安全，即便不掌握模型本身，仍然可以在分發層獲益。據報道，2025年蘋果僅靠App Store就從生成式AI應用中抽成了近9億美元傭金，2026年預計突破10億美元。

●多款AI應用上架App Store。圖源：Unsplash

如今，蘋果還在加碼AI投入，只是方向變了。今年第一季度財報顯示，蘋果30年以來，研發支出占收入比例首次超過10%，單季度研發支出達到114億美元，同比增長34%。庫克談及研發數據時表示，公司加大投資部分原因是其看到的人工智能增長潛力。

不過，蘋果的投入結構與Google、Microsoft或Meta的路徑明顯不同。有分析認為，這部分的研發投入增長很大程度上可能與人才培訓、建模實驗、設備內AI、私有云計算、定制芯片、隱私保護有關，而非大規模數據中心部署，是端側優先的AI戰略，而不是云端模型競賽。

至于為何最終選擇Google Gemini，或許是出于整體戰略的考慮。

據2026年5月官方披露，Google Gemini月活躍用戶已經達到9億，在非英語地區的流量規模已經接近ChatGPT的七成。Google算過一筆賬：如果企業將80%的頂級模型調用替換為最新一代Gemini 3.5 Flash，一年可以節省10億美元。

此外，Gemini已經被系統性嵌入谷歌搜索、地圖、Gmail、YouTube、Chrome等核心產品。就在蘋果發布會前幾周，Google在自己的開發者活動上，將操作系統上的Gemini新功能重新命名為“Gemini Intelligence”，想要把Gemini從一個聊天機器人轉變為跨手機、瀏覽器、汽車和筆記本電腦的運作方。

另一個備選是OpenAI。但雙方關系并不穩定，據彭博社報道，一位匿名的OpenAI高管表示：“我們已經從產品角度做了所有事情。他們沒有，更糟的是，他們甚至沒有真正努力過。”而且，OpenAI去年以來為了發展硬件，挖角了數十名iPhone、Vision Pro頭顯、音頻技術以及幾乎所有硬件和設計部門的蘋果工程師，這在某種程度上削弱了雙方長期合作的意愿。

相比之下，Google在合作上也顯得更積極也更具連續性。在AI從工具轉向代理的過程中，誰掌握系統級入口，誰就掌握分發權，而iOS是全球最穩定的高價值入口之一。作為長期搜索合作伙伴，雙方早已在iOS搜索入口、廣告分發與流量結構上形成穩定關系。

蘋果以系統入口置換技術能力，谷歌借iPhone落地AI野心。兩家公司正通過軟硬件的深度捆綁，試圖在AI主導的下一代終端里，掌握系統級入口的控制權。

封面來源： pexels

參考資料

繼續閱讀：

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.