![]()
文丨邱庭
編輯丨程述白
2011年10月4日,蒂姆·庫克(Tim Cook)第一次以蘋果CEO身份主持發布會——這也是Siri在蘋果的第一次亮相。
十五年后,2026年6月9日,庫克站在WWDC(蘋果全球開發者大會)的舞臺中央,外界普遍認為這是他任內最后一屆開發者大會。Siri又一次成為了焦點。
只是,它已經不是當年的Siri了。
盡管受制于監管要求,新版Siri以及其他新的蘋果AI智能功能還無法在中國大陸地區上線,但它還是讓不少人興奮了起來。在一鏡到底的演示中,這個“新siri”能在絕大部分場景下直接調用、索引并讀取聊天記錄,支持跨應用執行任務,還能通過自然語言生成瀏覽器插件與快捷指令。
但驅動它思考的,已經不完全是蘋果自己的能力。發布會上,蘋果首次明確將Google Gemini納入Apple Foundation架構。據彭博社報道,蘋果為此需每年向Google支付10億美元。
![]()
●蘋果的第三代Apple Foundation Models(AFM)。圖源:發布會截圖
與此同時,蘋果同步推出Core AI框架,ChatGPT、Claude等第三方模型也能借此接入Siri和蘋果系統。
過去十五年里,Siri始終代表著蘋果對人工智能的理解:封閉、自研、謹慎,一切能力都生長在蘋果生態內部,2024年蘋果首次提出的Apple Intelligence構想也是全自研AI架構。但在AI模型的競賽里,蘋果沒能跑在前列。
十五年前,Siri開啟了語音助手時代;十五年后,它再次成為蘋果命運轉折點的見證者。只是這一次,蘋果不再是先鋒,而是追趕者了。
新的Siri
今年WWDC上,蘋果用了大半場發布會的時間講AI。
站在舞臺上的,是邁克?洛克威爾(Mike Rockwell)。這位長期負責Vision Pro系統架構的高管,在2025年初接手了Siri重構項目。蘋果展示了一組新的AI同心圓架構:用戶位于中心,中層是多模態與執行工具,最外層則是Siri、軟件與系統生態。
![]()
●蘋果新的AI架構。圖源:發布會截圖
Siri的新功能可以大致分為屏幕感知、圖片理解、文字處理、應用協同等幾大部分。用戶不再需要在不同應用之間來回切換:刷到一個圖片,可以直接識別圖片地點;看到一個地址,可以直接詢問Siri規劃路線;瀏覽網頁時,可以直接選中文字向Siri提問;收到活動邀請,可以直接讓Siri識別時間并加入日歷。
這種變化的重點不在更聰明,而在更絲滑與便捷。在Mac上,用戶可以直接選中多個文件提問,無需上傳;在iPhone上,可以通過攝像頭直接向Siri提問現實世界中的物體;在照片、郵件、備忘錄、Safari等應用中,AI被直接嵌入原有工作流,給拍攝好的照片重新設置構圖、整理瀏覽器標簽頁、把校對和優化功能嵌入鍵盤隨時調用。
![]()
●Siri在iPhone與Mac端的調用。圖源:發布會截圖
更重要的是,舊版Siri的邏輯是單輪問答,而新版系統則開始嘗試理解用戶“正在做什么”,它可以根據聊天對象與過往聊天記錄采用不同的交談語氣,可以基于郵件內容主動提示下一步操作,或在跨應用場景中預判用戶意圖,從而提前給出執行路徑。
蘋果試圖重新定義Siri,把它從一個客服轉化為調度中心,并推出了獨立的Siri應用。這也意味著蘋果推翻了很多以前的堅守:原本不想做聊天機器人,現在做了;原本對照片使用AI修圖持保留態度,現在也加了。
過去,蘋果在Siri到底使用自研模型還是外部模型的問題上搖擺不定。而現在,團隊放棄了完全自研Apple Foundation Models的方案,轉而選擇整合外部技術。在洽談合作的Google、Anthropic PBC和OpenAI三家公司里,蘋果最終選擇了Google。
如今的第三代Apple Foundation Models包含2款端側模型和3款運行在私有云計算平臺上的模型,其中多款借助Google Gemini模型進行“精煉”。本地模型與私有云架構,是為保證數據不會被蘋果與其他第三方公司訪問。
今年WWDC傳遞的信號是,Siri學會了看屏幕、總結網頁以及理解照片。但更關鍵的是蘋果戰略的轉變:在AI時代,它不再執著于做底層能力的提供者,而更傾向于成為這些能力的組織者。
從不被重視,到寄予厚望
回到2011年,Siri還是一個被賦予想象力的產品。它的起點不在蘋果,而是Siri.Inc開發的獨立App,2010年在App Store上線,定位是可以幫你訂餐廳、查天氣、做信息整合的“個人秘書”。其基礎技術來自于美國國防高級研究計劃局從2003年起,就開始投入約1.5億美元資金資助的虛擬代理人技術開發項目。
Siri上線3周后,蘋果創始人史蒂夫·喬布斯(Steve Jobs)對它產生了興趣,邀請創始人會面。兩個月后,蘋果宣布以2億美元收購Siri,并整合進了2012年面世的iPhone 4S里,成為了后者最重要的功能之一。
然而,2011年至2015年間,Siri的更新幾乎都是微調,例如增加多語言支持、簡單信息查詢、百科內容接入、“嘿Siri”喚醒等。甚至在iOS 15中,蘋果還刪除了Siri中涉及筆記、照片、叫車、支付等的功能。到今天,Siri上利用率最高的功能,仍然是2011年剛亮相時就具備的能力——設個鬧鐘。
Siri的技術護城河并不牢固。2012年三星S Voice在功能層面已與Siri接近;2014年的對比測試中,Google Now在信息理解與推薦能力上反超Siri;到2017年,美國科技媒體The Verge直接評價Siri“明顯落后于時代”,它的領先窗口期實際上極為短暫。
2018年,美國科技媒體The Information披露了一份關于Siri團隊變動的長篇報道。據受訪前員工回憶,在初期,Siri是在還沒準備好的情況下面世的,后端架構并未適配大規模用戶流量,一位蘋果員工后來重寫了一段代碼,才讓Siri某后端組件的服務器需求從約500臺縮減到了5臺。
蘋果內部對Siri的定位也未達成一致。一派認為,Siri的核心應該是搜索與檢索,另一派則堅持,Siri必須成為真正的助手。
一位前蘋果員工說,“喬布斯在Siri推出后的第二天去世了,蘋果也由此失去了前進的方向。”于是Siri的研發長期處于一種分裂的狀態,一部分人負責語音識別,一部分人負責系統集成,還有一部分人負責體驗層優化。在這種背景下,Siri團隊各自為戰,缺乏統一演進邏輯。
這種割裂也延伸到產品層面。要把Siri搭載至HomePod的消息,Siri團隊2015年才得知。那時候,蘋果為了與2014年底亞馬遜發布的Echo競爭,匆忙把Siri應用到了項目之中。發布后,《紐約時報》評價:“HomePod 上的Siri拉垮得令人尷尬”。后續HomePod的市場表現不佳,也被內部部分人士認為是Siri團隊能力不足的緣故。
![]()
●2017年,蘋果推出的內置Siri智能音箱“HomePod ”。圖源:Unsplash
與此同時,隱私爭議成為Siri長期陰影。2019年,Siri被指在用戶未主動喚醒時錄音,并將片段發送給外包商人工收聽,遭集體訴訟。2025年初,美國加州法院批準了蘋果就該案達成的和解協議,最終符合條件的用戶每臺設備獲賠約8.02美元,單人最高賠付不超過40.1美元。
Siri項目在蘋果內部也曾多次經歷領導權調整。從最初的iOS團隊主導,到2012年由比爾·斯塔西奧(Bill Stasior)帶領獨立團隊運作,再到2018年機器學習團隊介入......
直到生成式AI浪潮到來,Siri的重要性重新提前。新Siri命運的轉折點,在2025年初的一場會議。這場會議聚集了除CEO庫克以外大部分蘋果核心領導,會議確認Apple Intelligence的表現未達預期,新一代Siri的迭代也將推遲。
那時,庫克對時任AI負責人約翰?詹南德雷亞(John Giannandrea)失去信心。主導了Vision Pro新產品誕生的洛克威爾主動請纓,接下了Siri。
之后,洛克威爾把曾經負責Vision Pro和VisionOS操作系統的團隊帶來作為Siri的新負責團隊,并立即啟動使用第三方模型的方案。Siri的新路線由此確立了。
不做軟件,回歸硬件
蘋果與谷歌的這次合作,蘋果每年需向Google支付約10億美元,用于使用其AI技術與基礎設施能力。
過去二十年,蘋果的技術路徑幾乎建立在芯片自研、系統自研、服務自建的原則上。這一次使用Gemini,官方解釋是基于技術評估后的結果,認為Gemini提供了當前“最有能力的基礎模型”。
2022年,蘋果內部團隊構建的好幾個大語言模型,但因公司高層質疑“實用性不足”被擱置。此后,蘋果在AI上的投入節奏與規模也顯得保守。2025財年(2024.9–2025.9)其研發投入約345億美元,而同時期Meta約573.72億美元,谷歌約610.87億美元。
在Siri多次延期之后,蘋果實質上放棄了做全棧大模型的執著,轉而回歸其根植于硬件的生態優勢。下一任蘋果CEO熱門候選人約翰?特努斯(John Ternus)也正是如今的蘋果硬件工程高級副總裁。
對蘋果而言,原來的賽道更穩定,也更安全,即便不掌握模型本身,仍然可以在分發層獲益。據報道,2025年蘋果僅靠App Store就從生成式AI應用中抽成了近9億美元傭金,2026年預計突破10億美元。
![]()
●多款AI應用上架App Store。圖源:Unsplash
如今,蘋果還在加碼AI投入,只是方向變了。今年第一季度財報顯示,蘋果30年以來,研發支出占收入比例首次超過10%,單季度研發支出達到114億美元,同比增長34%。庫克談及研發數據時表示,公司加大投資部分原因是其看到的人工智能增長潛力。
不過,蘋果的投入結構與Google、Microsoft或Meta的路徑明顯不同。有分析認為,這部分的研發投入增長很大程度上可能與人才培訓、建模實驗、設備內AI、私有云計算、定制芯片、隱私保護有關,而非大規模數據中心部署,是端側優先的AI戰略,而不是云端模型競賽。
至于為何最終選擇Google Gemini,或許是出于整體戰略的考慮。
據2026年5月官方披露,Google Gemini月活躍用戶已經達到9億,在非英語地區的流量規模已經接近ChatGPT的七成。Google算過一筆賬:如果企業將80%的頂級模型調用替換為最新一代Gemini 3.5 Flash,一年可以節省10億美元。
此外,Gemini已經被系統性嵌入谷歌搜索、地圖、Gmail、YouTube、Chrome等核心產品。就在蘋果發布會前幾周,Google在自己的開發者活動上,將操作系統上的Gemini新功能重新命名為“Gemini Intelligence”,想要把Gemini從一個聊天機器人轉變為跨手機、瀏覽器、汽車和筆記本電腦的運作方。
另一個備選是OpenAI。但雙方關系并不穩定,據彭博社報道,一位匿名的OpenAI高管表示:“我們已經從產品角度做了所有事情。他們沒有,更糟的是,他們甚至沒有真正努力過。”而且,OpenAI去年以來為了發展硬件,挖角了數十名iPhone、Vision Pro頭顯、音頻技術以及幾乎所有硬件和設計部門的蘋果工程師,這在某種程度上削弱了雙方長期合作的意愿。
相比之下,Google在合作上也顯得更積極也更具連續性。在AI從工具轉向代理的過程中,誰掌握系統級入口,誰就掌握分發權,而iOS是全球最穩定的高價值入口之一。作為長期搜索合作伙伴,雙方早已在iOS搜索入口、廣告分發與流量結構上形成穩定關系。
蘋果以系統入口置換技術能力,谷歌借iPhone落地AI野心。兩家公司正通過軟硬件的深度捆綁,試圖在AI主導的下一代終端里,掌握系統級入口的控制權。
封面來源: pexels
參考資料
【 版權聲明】所有內容著作權歸屬鏡相工作室,未經書面許可,不得轉載、摘編或以其他形式使用,另有聲明除外,如需聯系鏡相可后臺留言。
繼續閱讀:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.