網易首頁 > 網易號 > 正文申請入駐

谷歌最新發布會：沒發最強模型，開卷Agent全家桶

2026-05-20 15:48:04　來源: AIX財經

北京舉報

分享至

不拼參數了，想要AI幫你干活。

AIX財經（AIXcaijing）原創

作者 | 雷晶

編輯 | 金玙璠

北京時間5月20日凌晨，2026 Google I/O開幕。從2008年首次舉辦至今，這場大會已成為谷歌每年“秀肌肉”的主要舞臺。

而它之所以值得行業關注，在于它作為科技巨頭的技術秀場，能一定程度上反映行業未來的走向。

回到本屆大會，近兩個小時走完全部議程，發布節奏極密，幾乎不留間隙。

谷歌CEO桑達爾·皮查伊在開場拋出一個數字：3200萬億Token。這是谷歌全平臺每月的AI處理量，兩年前這個數字是9.7萬億，去年是480萬億，一年翻了近七倍。這個數字說明，谷歌的AI產品在被大規模使用。

先來拉一張清單，看看這場發布會到底講了什么：

模型：Gemini 3.5輸出速度為同類產品的四倍、成本不到一半，成為Gemini App和搜索的默認引擎；Gemini Omni支持圖文音視頻混合輸入，生成可編輯視頻，支持指定鏡頭和拍攝角度，通過Gemini App和Google Flow使用。Gemini 3.5 Pro預計6月發布，目前處于內測階段。

搜索與購物：搜索框迎來25年來最大改版，支持多模態輸入，可輸入文本、圖片、視頻、文件；Universal Cart打通搜索、YouTube、Gmail的AI購物車，Nike、Walmart等首批接入。

智能體：Gemini Spark作為24小時個人Agent，云端運行；Antigravity 2.0升級為多Agent編排平臺，全面擺脫coding場景局限，和Claude Code以及Codex直接競爭。

硬件：Android XR音頻眼鏡今秋上市，由三星制造，兼容iOS，聯合眼鏡品牌Gentle Monster和Warby Parker共同設計；純音頻版本今年秋季率先推出，帶顯示屏的版本將于明年推出。

訂閱：新增100美元/月Ultra plan；原250美元/月的頂級Ultra plan降到200美元；Pro維持19.99美元/月。

谷歌沒有在參數競賽上繼續加碼，而是把最多的時間給了Agent。接下來，我們來詳細看看這場大會釋放了哪些信號。

01.谷歌模型在講什么故事

2026 Google I/O大會的第一個重要信號，從芯片層開始。

谷歌提出第八代TPU的“雙芯”戰略，將訓練與推理拆分為獨立芯片。TPU 8t專攻訓練、TPU 8i則聚焦推理。

TPU 8t單個Pod可塞下9600顆芯片，集群總算力121 ExaFLOPS，較Ironwood提升約3倍，性價比提升2.7倍。集群可擴展至百萬級芯片，將大模型訓練周期從數月壓縮至數周。TPU 8i則主打低延遲推理，它的推理性價比提升80%，大緩存設計顯著減少內存訪問延遲，可滿足Gemini 3.5 Flash等高并發推理需求。

谷歌大會上，介紹芯片性能

第八代TPU對應的是谷歌在AI Agent上的布局。訓練、推理分離、供應鏈多元化、全棧軟件優化，既強化了谷歌在算力的基礎設施，也標志著全球AI芯片競爭進入更專業的階段。

有了更強的基建，模型自然也不能掉隊。大會上谷歌推出了Gemini 3.5 Flash和Gemini Omni，雖然沒有萬眾期待的Gemini 4.0，但展示了谷歌的產品邏輯：不追求最強模型，更注重讓不同模型服務于不同商業場景。

Gemini Omni是谷歌今年推出的世界模型。它被定位為“能從任何輸入生成任何輸出”的多模態系統，以視頻生成和編輯為切入點，將文本、圖像、音頻和視頻統一在同一個創作流程中。

現場演示Gemini Omni創作的視頻

它的亮點在于對物理世界規律的理解，這意味著能夠準確預測場景中應該發生什么。用戶用自然語言編輯視頻時，角色一致性、物理邏輯、場景記憶都能保持連貫。

Omni Flash將率先接入Gemini App、Google Flow和YouTube Shorts，面向AI Plus及以上訂閱用戶開放。谷歌旗下的Nano Banana技術已生成超500億張圖像，Omni的加入將創作能力從靜態圖像延伸至動態視頻。

Gemini 3.5 Flash速度提升，還更省錢了。它在幾乎所有基準測試上都超越了三個月前的旗艦模型Gemini 3.1 Pro。一個定位中端的模型能夠全面碾壓上一代旗艦產品，這在行業中并不多見。在輸出速度上，Gemini 3.5 Flash是其他前沿速度模型的4倍。

介紹Gemini 3.5 Flash性能

價格上，Gemini 3.5 Flash的定價為每百萬輸入token 1.5美元、每百萬輸出token 9美元。橫向對比，Claude Sonnet 4.6的輸入價格是3美元、輸出是15美元，Gemini 3.5 Flash的整體定價低了40%到50%。性能追平甚至超越競品旗艦，價格只要一半。

目前，Gemini App月活已達9億，每日請求量增長超7倍。

值得一提的是，大會上宣布Gemini 3.5 Pro繼續走深度推理路線，預計6月發布。

在模型能力之外，谷歌還在推進SynthID。它是DeepMind三年前推出的數字水印技術，已應用于超1000億圖片和視頻。此次I/O大會上，谷歌宣布與OpenAI、ElevenLabs攜手推動水印透明化標準，并向搜索和Chrome拓展內容憑證驗證。這也回應了當下打擊AI生成內容泛濫，難以監管的行業難題。

總結來看，TPU 8的訓練推理分離，解決的是算力成本結構問題。Gemini 3.5 Flash的高性能低價格，解決的是智能體規模化部署的性價比問題。Omni切入創作者經濟，解決的是谷歌在內容生成市場的存在感問題。

這也解釋了為什么谷歌敢把3.5 Flash做得又快又便宜。它要的不是模型本身的利潤，而是以模型為入口，撬動整個智能體經濟的生態。

02.搜索里，長出智能體、購物車和操作系統

模型的迭代終究還是要落到產品。谷歌搜索是這次變化最大的產品，谷歌將其稱為“25年來的最大升級”。

過去搜索框的交互邏輯一直是輸入關鍵詞，輸出網頁鏈接。現在，輸入端可以容納更長、更口語化的查詢，也更能理解你的搜索意圖，輸入端也不再局限于文字，圖片、文件、視頻、Chrome標簽頁都可以直接“丟”進去。

谷歌大會上，演示AI搜索

AI Mode已升級到Gemini 3.5 Flash驅動，面向全球所有用戶上線，月活突破10億。兩者合并帶來的體驗是，問一個問題能得到AI概覽，還可以直接在原頁面上繼續追問，上下文不丟失。

但真正改變搜索性質的，是輸出端。

谷歌把Antigravity2.0背后的智能體編程能力注入搜索，推出了Generative UI。Gemini 3.5 Flash拿到你的問題后，會從零開始規劃回答方案，輸出交互式界面、圖表等形式，更能滿足個人化的需求。

這種能力還在往周期任務延伸。你用自然語言描述需求，搜索可以打造個性化的小型應用，接入實時天氣、讀取日歷、了解飲食偏好，自動生成帶鏈接的計劃，生成出來的應用還可以分享給家人。Generative UI今年夏天面向所有搜索用戶免費開放，mini app功能先對美國AI Pro和Ultra訂閱用戶開放。

大會透露，搜索AI概覽（AI Overviews）月活超25億，AI模式（AI Mode）超10億，自上線以來查詢量每季度翻倍。

到這里，搜索已經從回答問題變成了執行任務。谷歌把這個邏輯推向的第一個商業場景是購物。

谷歌大會上，介紹購物功能

Universal Cart是一個跨商家、跨平臺的AI購物車，橫跨搜索、Gemini App、YouTube和Gmail。它可以在后臺自動追蹤降價、分析歷史價格、提醒補貨。整個體系構建在Google Wallet之上，能識別你的支付方式權益和商家優惠。目前，Nike、Target、Walmart、Sephora等大型零售商已接入首批結算功能。

AI購物已接入結算功能的商家

購物車能跨平臺運作，靠的是底層協議。Universal Commerce Protocol是年初在NRF上發布的開放標準，讓AI智能體代替用戶完成跨平臺購物和結算，亞馬遜、Meta、微軟、Salesforce和Stripe均已采納。

配套的Agent Payments Protocol解決的是支付的安全問題。AP2讓用戶給智能體設定支付邊界，指定品牌、商品類別、預算上限，同時通過加密的數字授權憑證在用戶、商家、支付方三者之間建立可追溯的鏈條。

谷歌在購物領域的嘗試已持續十余年，從Google Shopping到Buy on Google，但沒能形成閉環的電商交易鏈路。Universal Cart的邏輯與此前不同，它不試圖成為一個獨立的電商平臺，而是把自己嵌入用戶購物決策的全鏈路中。

Workspace這邊的更新同樣密集，它的邏輯是讓語音成為新的交互入口。Gmail Live可以用語音查詢收件箱；Docs Live能把你的口述直接組織成結構化文檔，并在授權后從Gmail、Drive和Chat中抓取相關信息充實內容。

現場演示AI音樂創作成果

創作工具層面，Google Pics基于Nano Banana模型，可以選定畫面中的單個元素精確編輯，其余部分不受影響。Google Flow和Flow Music則是面向視頻和音樂創作的AI工具，前者已推出Android測試版。

把這些變化放在一起看，底層趨勢是一樣的。谷歌把旗下所有高頻產品改造成讓AI替用戶執行任務的智能體。

03.Agent全家桶，真能替人干活嗎？

2026 Google I/O真正想講的故事是智能體。

Gemini Spark被定義為“個人AI智能體”。它可以全天候代替你執行任務，讀郵件、查日程、寫匯報、追進度、發提醒，即便你關掉窗口也不會停止。

谷歌推出Gemini Spark，即個人A智能體

Spark運行在Google Cloud的專屬虛擬機上，由Gemini 3.5 Flash驅動，底層跑的是Antigravity的Agent調度框架。在首發階段，Spark接入Gmail、Docs、Sheets等應用，未來將擴展到超過30個合作伙伴。Spark的入口不止Gemini App一個。今年夏天它將入駐Chrome，在任何網頁上都能直接讓它替你做事。

演示Gemini Spark如何操作

Agent還需要一個可見的界面層。Android Halo嵌入Android 17狀態欄的視覺指示器，以微妙的光圈動畫顯示Agent的實時工作狀態。你不需要打開任何App就能知道Spark正在替你做什么。

配合Spark的發布，谷歌還調整了訂閱價格：新增100美元/月的Ultra檔位，給那些想用Agent服務又不需要頂配的用戶；原來250美元/月的頂級Ultra降到200美元/月，Pro則維持19.99美元/月。

但谷歌不止押注C端。Antigravity 2.0是面向開發者的Agent基礎設施，它從一個IDE內置的編碼輔助工具，變為獨立的應用。開發者可以同時部署多個并行子Agent處理不同任務，設置后臺定時任務，用語音指揮Agent，Agent可以拆解復雜工作流并分配子任務。

谷歌大會上，介紹Antigravity 2.0性能

谷歌聲稱其在約12小時內可搭建一個能運行的操作系統核心框架，期間啟動了93個子Agent，處理了數十億Token，總計算成本不到1000美元。

展示Antigravity 2.0制作的游戲

大會還有一個值得關注的重點是Android XR智能眼鏡，由三星和高通制造，外觀設計來自Gentle Monster和Warby Parker，可兼容Android和iPhone。

谷歌大會上，智能眼鏡也是一大亮點

谷歌想打造一整套Agent操作系統，開發層有多Agent編排框架，手機上有狀態感知界面，臉上有語音和視覺輸入端。

Agent的悖論在于，它的價值取決于用戶的信任，而信任取決于可靠性。所以谷歌選擇讓Spark在執行高風險操作前必須征求用戶確認，詳細的思考軌跡對用戶可見，隨時可以打斷。

回看整場I/O大會，谷歌這次沒有拿出一個讓行業驚嘆的新模型，但它做的事情更實際，也更有野心。Omni負責感知，Spark負責生成，Agent負責7×24執行。

谷歌有TPU集群、全球數據中心、安卓生態、搜索入口、廣告變現機器，它不需要單點第一，只要足夠好、足夠便宜、足夠無處不在，就是它最大的競爭力。

不管怎么說，谷歌已經在全速前進了。

*題圖來源于Google黑板報微博截圖。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.