蘋果的 AI 翻身仗，還是從 Siri 開始

2026-06-09 08:35:49　來源: 鋅產(chǎn)業(yè)

浙江舉報

分享至

作者 | 山竹

出品 | 鋅產(chǎn)業(yè)

過去兩年，蘋果在 AI 上最尷尬的地方，不是沒有功能，而是沒有一個足夠有說服力的入口。

Apple Intelligence已經(jīng)出現(xiàn)在寫作工具、照片、通知、Safari、快捷指令和開發(fā)者框架里，但對普通用戶來說，這些能力更像散落在系統(tǒng)各處的零件。真正能把它們串起來的，原本應(yīng)該是 Siri。

問題也恰恰出在 Siri。

在 ChatGPT、Gemini、Claude 們把用戶重新教育成“直接開口提需求”的時候，Siri 過去多年留下的印象，仍然停在查天氣、設(shè)鬧鐘、放音樂這樣的語音助理階段。蘋果當(dāng)然知道這一點(diǎn)。所以在這場 WWDC 上，蘋果把 Apple Intelligence 的重點(diǎn)重新壓回 Siri，并給出了一個直接的新名字：Siri AI。

從這次發(fā)布會發(fā)布的內(nèi)容來看，這不是一次簡單的語音助手升級。蘋果試圖回答的是一個更大的問題：在大模型時代，操作系統(tǒng)公司到底應(yīng)該怎樣做 AI？

答案不是再造一個聊天機(jī)器人，而是把 AI 放回系統(tǒng)、App、屏幕、相冊、攝像頭和個人語境里。

01 Siri 終于不只是“聽命令”

這次發(fā)布會里，蘋果給 Siri AI 安排了幾組很有代表性的演示。

用戶可以問一場演唱會的時間和購票方式，Siri 能結(jié)合實(shí)時世界知識給出答案；可以繼續(xù)讓它在抽簽開放時提醒自己，Siri 會把答案轉(zhuǎn)化為系統(tǒng)動作；用戶還可以問屏幕上的照片位置，再追問朋友是否住在附近，Siri 會結(jié)合屏幕內(nèi)容、個人信息和地圖路線，把“問答”變成“完成一件事”。

這才是蘋果真正想講的 Siri AI：它不是你問一句、它答一句，而是能夠理解上下文、記住對話過程，并調(diào)用 App 動作完成任務(wù)。

更關(guān)鍵的是個人語境。發(fā)布會里有一個照片場景：用戶讓 Siri 找出上周末家庭旅行的照片，再進(jìn)一步篩選出包含幾位家人的照片，并添加到共享家庭相冊。這個演示看起來不如生成圖片炫，但它非常蘋果。

因?yàn)樗玫氖翘O果最強(qiáng)的資產(chǎn)：設(shè)備里的私人數(shù)據(jù)、系統(tǒng)級權(quán)限、相冊索引、聯(lián)系人關(guān)系、App 間動作，以及用戶長期沉淀下來的使用場景。

這也是蘋果與純云端 AI 助手的分野。ChatGPT 可以寫一封漂亮郵件，但它默認(rèn)不知道你剛剛看了哪張照片、朋友住在哪里、你的家庭共享相冊叫什么；蘋果則想讓 Siri 在不離開系統(tǒng)的情況下，把這些碎片拼起來。

過去的 Siri 像一個語音遙控器。新的 Siri AI，蘋果希望它變成一個系統(tǒng)代理。

02 Apple Intelligence 開始有了“操作系統(tǒng)感”

這次 Apple Intelligence 的底層敘事也發(fā)生了變化。

蘋果在發(fā)布會上強(qiáng)調(diào)了一個新架構(gòu)：更強(qiáng)的端側(cè)模型、Private Cloud Compute、系統(tǒng)協(xié)調(diào)器、個人上下文理解、屏幕感知、App Actions，以及依托 Spotlight 的語義索引。聽起來像一串技術(shù)名詞，但翻譯成用戶語言，其實(shí)就是三件事：

第一，AI 要知道你是誰、你有什么、你正在看什么;

第二，AI 不只是生成答案，還要能調(diào)用 App 做事;

第三，這一切要盡量在蘋果的隱私框架下完成。

這條路線并不是突然出現(xiàn)的。蘋果在 2024 年推出 Apple Intelligence 時，就已經(jīng)把個人上下文、屏幕感知、跨 App 動作列為 Siri 后續(xù)方向；

到 2025 年 iOS 26，蘋果又把 visual intelligence 擴(kuò)展到屏幕內(nèi)容，并開放 Foundation Models framework，讓開發(fā)者直接調(diào)用端側(cè)模型；

到了這次發(fā)布會，蘋果才真正試圖把這些能力合成一個更完整的產(chǎn)品故事。

Safari 可以用 Apple Intelligence 自動整理標(biāo)簽頁、監(jiān)測網(wǎng)頁變化，還可以讓用戶用自然語言描述需要的網(wǎng)頁擴(kuò)展；密碼 App 能在 Safari 中協(xié)助升級弱密碼；信息 App 能根據(jù)聊天上下文建議創(chuàng)建提醒、筆記，甚至根據(jù)對方要求幫你從相冊里找合適照片；日歷可以聽懂自然語言并自動生成或修改事件；電話 App 在你致電航空公司時，能從郵件里找出確認(rèn)碼，但蘋果強(qiáng)調(diào)它看的是“你正在打給誰”，不是“你在電話里說了什么”。

這些功能單獨(dú)看都不算驚天動地，但放在一起，它們呈現(xiàn)出蘋果對 AI 的取舍：蘋果不急著讓用戶每天打開一個獨(dú)立 AI App，而是試圖讓 AI 出現(xiàn)在用戶本來就要完成的動作中。

這也是為什么快捷指令值得單獨(dú)看。過去 Shortcuts 很強(qiáng)，但門檻也高。現(xiàn)在用戶可以直接描述“我下班離開公司時，給某人發(fā)送預(yù)計到家時間”，系統(tǒng)會自動組裝定位、地圖、信息等動作。它相當(dāng)于把原本屬于高級用戶的自動化能力，下放給普通用戶。

如果說 2024 年的 Apple Intelligence 還像功能菜單，2026 年這次發(fā)布會里的 Apple Intelligence，終于開始像操作系統(tǒng)的一部分。

03 蘋果AI最容易被用戶感知的戰(zhàn)場

在所有 AI 功能里，照片可能是最容易讓普通用戶立刻感知差異的地方。

這次蘋果圍繞 Image Playground 和 Photos 給了很大篇幅。

Image Playground 支持更高質(zhì)量的圖像生成，覆蓋更多風(fēng)格，包括照片級真實(shí)感，用戶可以從照片圖庫里選人，用自然語言生成派對邀請圖，再通過圈選對象、移動、縮放、添加蠟燭等方式繼續(xù)調(diào)整。它還會進(jìn)入聯(lián)系人海報、鎖屏壁紙等系統(tǒng)場景，開發(fā)者也能通過 Image Playground API 使用這些能力。

這部分很像蘋果對外部生成式 AI 浪潮的回應(yīng)。別人已經(jīng)把文生圖、圖像編輯、風(fēng)格轉(zhuǎn)換做成了高頻能力，蘋果不能缺席。但蘋果真正有辨識度的地方，還是 Photos 里的三項(xiàng)編輯：升級后的 Clean Up、Extend，以及 Spatial Reframing。

Clean Up 是去除干擾物，并用更真實(shí)的方式補(bǔ)全復(fù)雜場景；Extend 可以擴(kuò)展畫面邊緣，讓主體有更多空間，或在校正水平線時不裁掉重要內(nèi)容；Spatial Reframing 則更有野心，它試圖讓用戶在拍完照片后，像重新移動過相機(jī)一樣調(diào)整透視和構(gòu)圖。

發(fā)布會演示里，用戶可以拖動畫面，實(shí)時預(yù)覽透視變化，邊緣區(qū)域會先以模糊顯示，最后由生成模型補(bǔ)全。蘋果特別強(qiáng)調(diào)，這套能力結(jié)合了端側(cè)空間模型和 Private Cloud Compute 上的圖像生成模型，只在透視變化產(chǎn)生的空白區(qū)域生成新內(nèi)容，以保持照片與原始場景一致。

這句話其實(shí)很重要。

在 AI 修圖越來越強(qiáng)之后，照片編輯面臨一個新問題：它到底是在增強(qiáng)照片，還是在重寫現(xiàn)實(shí)？蘋果這次不斷強(qiáng)調(diào)“尊重原始瞬間”，就是想給自己的照片 AI 劃一條邊界。它要讓用戶獲得類似“當(dāng)時如果我再退一步、蹲低一點(diǎn)、向右移一點(diǎn)”的補(bǔ)救能力，而不是把照片變成完全不受約束的合成圖。

當(dāng)然，這條邊界不會永遠(yuǎn)清晰。只要生成模型介入照片，真實(shí)和修飾之間就會越來越難區(qū)分。但至少從發(fā)布會表達(dá)看，蘋果正在把照片 AI 包裝成攝影工作流的延伸，而不是內(nèi)容生成機(jī)器。

這很聰明。因?yàn)閷Υ蠖鄶?shù)用戶來說，他們未必每天需要一張憑空生成的圖片，但他們一定經(jīng)常遇到照片拍歪了、主體太擠、路人入鏡、比例不合適這些問題。

04 蘋果的優(yōu)勢，也是蘋果的約束

這場發(fā)布會最值得注意的，不是蘋果終于承認(rèn) Siri 要 AI 化，而是它依然堅持用蘋果式方法做 AI。

蘋果沒有把 AI 敘事完全交給一個萬能聊天框，也沒有把發(fā)布會變成模型參數(shù)競賽。它講的是端側(cè)模型、系統(tǒng)索引、隱私云、App 動作、攝像頭入口、照片編輯、快捷指令和開發(fā)者 API。這套表達(dá)沒有那么刺激，但很符合蘋果的產(chǎn)品邏輯。

優(yōu)勢很明顯。

蘋果擁有其他 AI 公司很難復(fù)制的入口：iPhone 的攝像頭、相冊、通知、電話、郵件、日歷、信息、Spotlight、快捷指令、Mac 文件系統(tǒng)、Vision Pro 的空間感知。只要 Siri AI 真能穩(wěn)定調(diào)動這些能力，它就不需要在“誰的聊天更聰明”這件事上和所有大模型正面肉搏。

但約束也同樣明顯。

第一，蘋果的 AI 必須跨設(shè)備、跨系統(tǒng)、跨語言、跨地區(qū)可用，這天然比做一個獨(dú)立網(wǎng)頁產(chǎn)品更慢。第二，蘋果的隱私承諾會限制它對用戶數(shù)據(jù)和云端模型的使用方式。第三，發(fā)布會已經(jīng)明確，Siri AI 面向開發(fā)者今天可試用，面向消費(fèi)者要到今年晚些時候 beta；歐盟的 iOS 和 iPadOS 初期不可用，中國區(qū) Siri AI 和新的 Apple Intelligence 功能也還要等待監(jiān)管要求。這意味著它依然帶著某種“期貨”氣質(zhì)。

所以，蘋果這次交出的不是最終答案，而是一張補(bǔ)考試卷。

過去兩年，外界對蘋果 AI 最大的不滿，是它看起來慢了半拍。現(xiàn)在蘋果試圖證明，慢并不等于缺席：當(dāng) AI 真正進(jìn)入操作系統(tǒng)，它應(yīng)該更懂你的個人場景，更能調(diào)動本地 App，更少要求你離開當(dāng)前任務(wù)。

但反過來說，蘋果也必須證明，謹(jǐn)慎不是拖延，隱私不是借口，系統(tǒng)級不是發(fā)布會里的漂亮結(jié)構(gòu)圖。

Siri AI 如果能按這次演示落地，它會讓 Apple Intelligence 第一次擁有清晰的中心。如果不能，蘋果在 AI 時代的尷尬也會更加集中地落到 Siri 身上。

這場 WWDC 之后，蘋果的 AI 故事終于不再散。

真正的問題變成了：Siri 這一次，能不能真的把它講完。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.