![]()
文|羅鎮昊
編|劉俊宏
75分鐘的演講,70%都在聊AI。庫克在自己主持的最后一場WWDC上,表現得稍顯“倉促”。
WWDC是蘋果一年中最重要的活動之一,所有關于iOS、iPadOS、macOS等軟件系統的最新進展都會在這里揭曉。作為未來操作系統的核心構成,AI成為WWDC最近三年的主角。
兩年前,蘋果高調推出Apple Intelligence,試圖在AI浪潮中重新定義智能助手。但隨后,這套系統的進展卻不盡人意,全新的Siri也遲遲未能兌現。
今年的WWDC 2026,承擔著為蘋果在AI領域重新證明自己的重任。而在庫克的開場中,答案似乎已經浮現:那個多次跳票的Siri,這次真的來了。
Siri AI升級,蘋果要做豆包手機?
今年WWDC最值得關注的事,無疑是那個多次跳票的Siri終于落地了。
蘋果給升級后的Siri單獨起了個名字,叫做Siri AI。它不再是那個只能幫你放首歌、撥通電話、查天氣的“語音遙控器”,而是一個真正集成在系統里的Agent。
一句話總結,那就是新的Siri AI不拉胯了。如同去年驚艷整個消費電子圈的豆包手機一樣,蘋果的手機AI現在也具備了系統級能力,且這種能力無處不在。
新的Siri具備五項能力:個人情境理解、圖像理解、世界知識、屏幕感知以及APP調用。一般的日常任務幾乎都能通過Siri完成,比如回復郵件、安排日程、結合聊天記錄撰寫文章。
演示中,主持人隨手打開一張照片,Siri直接識別出屏幕上的圖片是哪里,并在地圖上導航到具體位置,然后從社交APP中找出朋友發過的地址,規劃中途去朋友家的路線——完成查看屏幕信息、提取信息、根據信息調用相應的APP。可以看出,新的Siri已經成為應用之上更高一級的入口。
![]()
另一個演示者用Siri查到了世界杯第一周的賽程,提出想辦一場巴西VS摩洛哥的觀賽派對,接著讓Siri推薦一些兩個國家的經典菜,Siri隨即檢索了全球知識,又翻出好友Maria在聊天里提到的椰子餅干,最終整合出一份兼顧兩國風味的菜單,并直接幫用戶起草了一條群發邀請,附上菜單,一鍵發送。全程不用手動操作。
![]()
結合蘋果官方演示看到,Siri AI已經不再是一個簡單的助手。具備Agent能力的AI結合多模態能力之后,現在能夠“看”到手機屏幕并“替”用戶執行操作。或許,這些具體操作的任務主要還是基于蘋果系統自帶APP,還沒有達到協同調用第三方APP的高度,甚至都還比不上國內AI手機“一句話”點咖啡的自由度。但平心而論,這對于“承認AI慢了”的蘋果而言,已經是一項重大升級了。
此外,蘋果還展示了一系列基于AI的“散裝”應用能力,主打一個AI“哪都能用”。
Siri還可以幫助整理相冊,只要對Siri說一句“把有某某的照片放進家庭共享相冊”,它就會自己完成識別、篩選和操作,完全不需要打開APP。
同時Siri也被結合進相機里,鏡頭對向目標就可以對Siri進行問答,比如問面前這盤菜有多少卡路里,這份賬單每人要A多少錢
![]()
喚醒方式與多設備體驗方面,Siri AI保留了“Hey Siri”和側邊按鈕兩種喚起方式,同時Siri還被嵌入靈動島,向下輕掃就能進行語音或文字多輪對話。除此之外,蘋果這次為Siri推出了專屬的App,所有對話記錄可通過iCloud私密同步,在iPhone上開始的對話,可以在iPad上接續,在Mac上收尾。
![]()
各平臺上,Siri的形態也有差異。Mac上,Siri被整合進了Spotlight,可以在任意界面呼出,并通過右鍵菜單針對選中內容提問;Apple Watch上,Siri AI則以極簡的交互直接在手腕上執行操作;Vision Pro上更進一步,只需注視Siri并開口說話,無需任何喚醒詞。
![]()
這些能力正依托Apple Intelligence的驅動。官方表示,這套系統的運行在端側和私有云上,簡單的任務在本地設備上跑,復雜的任務則送到Private Cloud Compute。
基于Apple Intelligence底座,Safari、信息、郵件、日歷等各類原生APP都得到了AI能力的加持。
Apple Intelligence?Gemini Intelligence!
Siri AI這次驚艷表現的背后,是蘋果對整個AI架構做了一次重建,“拖延”兩年的Apple Intelligence終于出來了。
還記得在2024年WWDC,蘋果高調發布的Apple Intelligence給了用戶不少期待。最“蘋果”的體驗、最好的AI大模型協同(ChatGPT)、最順暢的端云協同聯動,這是當時蘋果給所有消費者的承諾,也給了AI手機廠商不少AI智能體落地的參考。甚至,當時還有不少分析師和消費者認為蘋果仍有可能自研AI。
但在2026年WWDC上,一切塵埃落定。Apple Intelligence是基于谷歌Gemini做的。
![]()
雖然沒有披露太具體的細節,但我們仍可以從中審視蘋果為AI搭建的全新架構。整體邏輯上,蘋果AI還是當下智能硬件行業共識采用的端云協同架構。蘋果的基礎模型——AppleFoundation Models是跟谷歌基于Gemini共同打造的系列模型,并分別布局在手機端側和云端(Private Cloud Compute)。
![]()
云端這邊,就是蘋果專門搭建的AI基礎設施。這部分蘋果給的說法是,云端只是用于處理用戶的需求,處理完就“刪”,蘋果不掌握也看不到用戶的數據。
這種設計有點反常識,因為AI大模型廠商都非常重視自己與用戶的交互數據,這些數據能夠不斷迭代模型能力。但在蘋果這邊,更像是執行用戶復雜需求(圖像生成、復雜推理等)的“一錘子買賣”。這或許側面說明蘋果自己可能還沒有完善的數據閉環,甚至獨立訓練模型的能力。
端側這邊,蘋果今年把模型分成了高、低兩個能力檔位。首先,所有支持Apple Intelligence的設備都帶一個約3B大小的基礎模型。
在性能更好的設備上(例如最新款手機、PC),蘋果額外搭載一個更大的模型,這個模型能給出更高質量的輸出、更長的上下文。同時蘋果蘋果還配套了獨立的語音模型,用于新Siri的自然對話和個性化語音合成。
在端側基礎模型這邊,蘋果的解法還是比較有參考性的。蘋果做了一個叫System Orchestrator(系統編排器)的架構來調度整個Apple Intelligence。
在這里,先解釋一下Orchestrator的概念。在AI領域(尤其是智能體時代的AI),AI執行任務已經不再是一個大模型回答所有任務,而是多個不同能力的小模型、工具(搜索、APP調用等)、端云任務結合、上下文(多步任務)記憶等環節共同協作。Orchestrator的任務就是把整體任務拆解成合適的大小,分配到最適合執行的部分。
![]()
在蘋果這邊,System Orchestrator調度的是四大功能模塊,分別負責個人信息理解、世界知識、Actions和屏幕感知。
具體來說,上下文理解就是設備上的信息,文字、圖片、郵件,這些手機AI都了如指掌,能調用正確信息。
世界知識就是一定程度的常識,蘋果在線上做了一個世界知識服務,當本地模型知識不足或需要最新信息時,AI能找到合適的信息輸出。
Actions就是讓Siri AI 真正執行操作,而不是只聊天,相當于用戶的“手替”,負責操作手機。
屏幕感知則是當用戶的“眼替”,能閱讀屏幕上的信息,作為AI模型的輸入。
整體來看,四大調用模塊是兩兩組合的結構。分別承擔內部、外部獲取信息和執行輸出、信息輸入的角色。按照蘋果的說法,這就是以你為中心的AI。
結語
蘋果花了兩年時間,終于是給Apple Intelligence做出來了。但無論是從應用效果到AI布局,蘋果的AI始終還是有一股“擰巴”味。
一方面,Apple Intelligence還是有不少“老款”AI助手的部分。例如世界知識部分,是蘋果幾年前就在運營的知識圖譜,當時是希望解決Siri知識老舊、胡編亂造的問題。但在AI大模型都能聯網的今天,顯得有點多此一舉。另一方面,下定決心跟谷歌合作AI模型,這對于“困在自研執念”的蘋果也是一種跨越。
但無論如何,AI只要落地就一定是好事。尤其是在中國手機廠商不斷炫技的2026年,蘋果也終于明白了交付大于完成的道理。
最后是具體更新計劃。蘋果AI的更新最老到蘋果11,pc必須是蘋果芯片,中國和歐盟暫時用不了。
不過,相信中國用戶很快也能用上。此前,蘋果曾計劃和百度合作,將文心一言4.0作為國行iPhone生成式AI底層,適配國內數據合規要求。后又同步與阿里合作落地中國AI合規審核。
在無法直接使用谷歌服務的情況下,蘋果很可能要尋找一個新的本土大腦,而千問就是目前最有可能的對象。
這件事能不能做成,進展得快不快,直接決定了中國用戶能否用上全新的Siri。
拋開區域限制,這次WWDC真正值得被記住的,是蘋果完成了AI時代的重構,并將Agent植入到操作系統。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.