![]()
作者 | 山竹
出品 | 鋅產(chǎn)業(yè)
過去兩年,蘋果在 AI 上最尷尬的地方,不是沒有功能,而是沒有一個足夠有說服力的入口。
Apple Intelligence已經(jīng)出現(xiàn)在寫作工具、照片、通知、Safari、快捷指令和開發(fā)者框架里,但對普通用戶來說,這些能力更像散落在系統(tǒng)各處的零件。真正能把它們串起來的,原本應(yīng)該是 Siri。
問題也恰恰出在 Siri。
在 ChatGPT、Gemini、Claude 們把用戶重新教育成“直接開口提需求”的時候,Siri 過去多年留下的印象,仍然停在查天氣、設(shè)鬧鐘、放音樂這樣的語音助理階段。蘋果當(dāng)然知道這一點(diǎn)。所以在這場 WWDC 上,蘋果把 Apple Intelligence 的重點(diǎn)重新壓回 Siri,并給出了一個直接的新名字:Siri AI。
從這次發(fā)布會發(fā)布的內(nèi)容來看,這不是一次簡單的語音助手升級。蘋果試圖回答的是一個更大的問題:在大模型時代,操作系統(tǒng)公司到底應(yīng)該怎樣做 AI?
答案不是再造一個聊天機(jī)器人,而是把 AI 放回系統(tǒng)、App、屏幕、相冊、攝像頭和個人語境里。
01 Siri 終于不只是“聽命令”
這次發(fā)布會里,蘋果給 Siri AI 安排了幾組很有代表性的演示。
用戶可以問一場演唱會的時間和購票方式,Siri 能結(jié)合實(shí)時世界知識給出答案;可以繼續(xù)讓它在抽簽開放時提醒自己,Siri 會把答案轉(zhuǎn)化為系統(tǒng)動作;用戶還可以問屏幕上的照片位置,再追問朋友是否住在附近,Siri 會結(jié)合屏幕內(nèi)容、個人信息和地圖路線,把“問答”變成“完成一件事”。
這才是蘋果真正想講的 Siri AI:它不是你問一句、它答一句,而是能夠理解上下文、記住對話過程,并調(diào)用 App 動作完成任務(wù)。
更關(guān)鍵的是個人語境。發(fā)布會里有一個照片場景:用戶讓 Siri 找出上周末家庭旅行的照片,再進(jìn)一步篩選出包含幾位家人的照片,并添加到共享家庭相冊。這個演示看起來不如生成圖片炫,但它非常蘋果。
因?yàn)樗玫氖翘O果最強(qiáng)的資產(chǎn):設(shè)備里的私人數(shù)據(jù)、系統(tǒng)級權(quán)限、相冊索引、聯(lián)系人關(guān)系、App 間動作,以及用戶長期沉淀下來的使用場景。
這也是蘋果與純云端 AI 助手的分野。ChatGPT 可以寫一封漂亮郵件,但它默認(rèn)不知道你剛剛看了哪張照片、朋友住在哪里、你的家庭共享相冊叫什么;蘋果則想讓 Siri 在不離開系統(tǒng)的情況下,把這些碎片拼起來。
過去的 Siri 像一個語音遙控器。新的 Siri AI,蘋果希望它變成一個系統(tǒng)代理。
02 Apple Intelligence 開始有了“操作系統(tǒng)感”
這次 Apple Intelligence 的底層敘事也發(fā)生了變化。
蘋果在發(fā)布會上強(qiáng)調(diào)了一個新架構(gòu):更強(qiáng)的端側(cè)模型、Private Cloud Compute、系統(tǒng)協(xié)調(diào)器、個人上下文理解、屏幕感知、App Actions,以及依托 Spotlight 的語義索引。聽起來像一串技術(shù)名詞,但翻譯成用戶語言,其實(shí)就是三件事:
第一,AI 要知道你是誰、你有什么、你正在看什么;
第二,AI 不只是生成答案,還要能調(diào)用 App 做事;
第三,這一切要盡量在蘋果的隱私框架下完成。
這條路線并不是突然出現(xiàn)的。蘋果在 2024 年推出 Apple Intelligence 時,就已經(jīng)把個人上下文、屏幕感知、跨 App 動作列為 Siri 后續(xù)方向;
到 2025 年 iOS 26,蘋果又把 visual intelligence 擴(kuò)展到屏幕內(nèi)容,并開放 Foundation Models framework,讓開發(fā)者直接調(diào)用端側(cè)模型;
到了這次發(fā)布會,蘋果才真正試圖把這些能力合成一個更完整的產(chǎn)品故事。
Safari 可以用 Apple Intelligence 自動整理標(biāo)簽頁、監(jiān)測網(wǎng)頁變化,還可以讓用戶用自然語言描述需要的網(wǎng)頁擴(kuò)展;密碼 App 能在 Safari 中協(xié)助升級弱密碼;信息 App 能根據(jù)聊天上下文建議創(chuàng)建提醒、筆記,甚至根據(jù)對方要求幫你從相冊里找合適照片;日歷可以聽懂自然語言并自動生成或修改事件;電話 App 在你致電航空公司時,能從郵件里找出確認(rèn)碼,但蘋果強(qiáng)調(diào)它看的是“你正在打給誰”,不是“你在電話里說了什么”。
這些功能單獨(dú)看都不算驚天動地,但放在一起,它們呈現(xiàn)出蘋果對 AI 的取舍:蘋果不急著讓用戶每天打開一個獨(dú)立 AI App,而是試圖讓 AI 出現(xiàn)在用戶本來就要完成的動作中。
這也是為什么快捷指令值得單獨(dú)看。過去 Shortcuts 很強(qiáng),但門檻也高。現(xiàn)在用戶可以直接描述“我下班離開公司時,給某人發(fā)送預(yù)計到家時間”,系統(tǒng)會自動組裝定位、地圖、信息等動作。它相當(dāng)于把原本屬于高級用戶的自動化能力,下放給普通用戶。
如果說 2024 年的 Apple Intelligence 還像功能菜單,2026 年這次發(fā)布會里的 Apple Intelligence,終于開始像操作系統(tǒng)的一部分。
03 蘋果AI最容易被用戶感知的戰(zhàn)場
在所有 AI 功能里,照片可能是最容易讓普通用戶立刻感知差異的地方。
這次蘋果圍繞 Image Playground 和 Photos 給了很大篇幅。
Image Playground 支持更高質(zhì)量的圖像生成,覆蓋更多風(fēng)格,包括照片級真實(shí)感,用戶可以從照片圖庫里選人,用自然語言生成派對邀請圖,再通過圈選對象、移動、縮放、添加蠟燭等方式繼續(xù)調(diào)整。它還會進(jìn)入聯(lián)系人海報、鎖屏壁紙等系統(tǒng)場景,開發(fā)者也能通過 Image Playground API 使用這些能力。
這部分很像蘋果對外部生成式 AI 浪潮的回應(yīng)。別人已經(jīng)把文生圖、圖像編輯、風(fēng)格轉(zhuǎn)換做成了高頻能力,蘋果不能缺席。但蘋果真正有辨識度的地方,還是 Photos 里的三項(xiàng)編輯:升級后的 Clean Up、Extend,以及 Spatial Reframing。
Clean Up 是去除干擾物,并用更真實(shí)的方式補(bǔ)全復(fù)雜場景;Extend 可以擴(kuò)展畫面邊緣,讓主體有更多空間,或在校正水平線時不裁掉重要內(nèi)容;Spatial Reframing 則更有野心,它試圖讓用戶在拍完照片后,像重新移動過相機(jī)一樣調(diào)整透視和構(gòu)圖。
發(fā)布會演示里,用戶可以拖動畫面,實(shí)時預(yù)覽透視變化,邊緣區(qū)域會先以模糊顯示,最后由生成模型補(bǔ)全。蘋果特別強(qiáng)調(diào),這套能力結(jié)合了端側(cè)空間模型和 Private Cloud Compute 上的圖像生成模型,只在透視變化產(chǎn)生的空白區(qū)域生成新內(nèi)容,以保持照片與原始場景一致。
這句話其實(shí)很重要。
在 AI 修圖越來越強(qiáng)之后,照片編輯面臨一個新問題:它到底是在增強(qiáng)照片,還是在重寫現(xiàn)實(shí)?蘋果這次不斷強(qiáng)調(diào)“尊重原始瞬間”,就是想給自己的照片 AI 劃一條邊界。它要讓用戶獲得類似“當(dāng)時如果我再退一步、蹲低一點(diǎn)、向右移一點(diǎn)”的補(bǔ)救能力,而不是把照片變成完全不受約束的合成圖。
當(dāng)然,這條邊界不會永遠(yuǎn)清晰。只要生成模型介入照片,真實(shí)和修飾之間就會越來越難區(qū)分。但至少從發(fā)布會表達(dá)看,蘋果正在把照片 AI 包裝成攝影工作流的延伸,而不是內(nèi)容生成機(jī)器。
這很聰明。因?yàn)閷Υ蠖鄶?shù)用戶來說,他們未必每天需要一張憑空生成的圖片,但他們一定經(jīng)常遇到照片拍歪了、主體太擠、路人入鏡、比例不合適這些問題。
04 蘋果的優(yōu)勢,也是蘋果的約束
這場發(fā)布會最值得注意的,不是蘋果終于承認(rèn) Siri 要 AI 化,而是它依然堅持用蘋果式方法做 AI。
蘋果沒有把 AI 敘事完全交給一個萬能聊天框,也沒有把發(fā)布會變成模型參數(shù)競賽。它講的是端側(cè)模型、系統(tǒng)索引、隱私云、App 動作、攝像頭入口、照片編輯、快捷指令和開發(fā)者 API。這套表達(dá)沒有那么刺激,但很符合蘋果的產(chǎn)品邏輯。
優(yōu)勢很明顯。
蘋果擁有其他 AI 公司很難復(fù)制的入口:iPhone 的攝像頭、相冊、通知、電話、郵件、日歷、信息、Spotlight、快捷指令、Mac 文件系統(tǒng)、Vision Pro 的空間感知。只要 Siri AI 真能穩(wěn)定調(diào)動這些能力,它就不需要在“誰的聊天更聰明”這件事上和所有大模型正面肉搏。
但約束也同樣明顯。
第一,蘋果的 AI 必須跨設(shè)備、跨系統(tǒng)、跨語言、跨地區(qū)可用,這天然比做一個獨(dú)立網(wǎng)頁產(chǎn)品更慢。第二,蘋果的隱私承諾會限制它對用戶數(shù)據(jù)和云端模型的使用方式。第三,發(fā)布會已經(jīng)明確,Siri AI 面向開發(fā)者今天可試用,面向消費(fèi)者要到今年晚些時候 beta;歐盟的 iOS 和 iPadOS 初期不可用,中國區(qū) Siri AI 和新的 Apple Intelligence 功能也還要等待監(jiān)管要求。這意味著它依然帶著某種“期貨”氣質(zhì)。
所以,蘋果這次交出的不是最終答案,而是一張補(bǔ)考試卷。
過去兩年,外界對蘋果 AI 最大的不滿,是它看起來慢了半拍。現(xiàn)在蘋果試圖證明,慢并不等于缺席:當(dāng) AI 真正進(jìn)入操作系統(tǒng),它應(yīng)該更懂你的個人場景,更能調(diào)動本地 App,更少要求你離開當(dāng)前任務(wù)。
但反過來說,蘋果也必須證明,謹(jǐn)慎不是拖延,隱私不是借口,系統(tǒng)級不是發(fā)布會里的漂亮結(jié)構(gòu)圖。
Siri AI 如果能按這次演示落地,它會讓 Apple Intelligence 第一次擁有清晰的中心。如果不能,蘋果在 AI 時代的尷尬也會更加集中地落到 Siri 身上。
這場 WWDC 之后,蘋果的 AI 故事終于不再散。
真正的問題變成了:Siri 這一次,能不能真的把它講完。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.