![]()
不拼參數了,想要AI幫你干活。
AIX財經(AIXcaijing)原創
作者 | 雷晶
編輯 | 金玙璠
北京時間5月20日凌晨,2026 Google I/O開幕。從2008年首次舉辦至今,這場大會已成為谷歌每年“秀肌肉”的主要舞臺。
而它之所以值得行業關注,在于它作為科技巨頭的技術秀場,能一定程度上反映行業未來的走向。
回到本屆大會,近兩個小時走完全部議程,發布節奏極密,幾乎不留間隙。
谷歌CEO桑達爾·皮查伊在開場拋出一個數字:3200萬億Token。這是谷歌全平臺每月的AI處理量,兩年前這個數字是9.7萬億,去年是480萬億,一年翻了近七倍。這個數字說明,谷歌的AI產品在被大規模使用。
先來拉一張清單,看看這場發布會到底講了什么:
模型:Gemini 3.5輸出速度為同類產品的四倍、成本不到一半,成為Gemini App和搜索的默認引擎;Gemini Omni支持圖文音視頻混合輸入,生成可編輯視頻,支持指定鏡頭和拍攝角度,通過Gemini App和Google Flow使用。Gemini 3.5 Pro預計6月發布,目前處于內測階段。
搜索與購物:搜索框迎來25年來最大改版,支持多模態輸入,可輸入文本、圖片、視頻、文件;Universal Cart打通搜索、YouTube、Gmail的AI購物車,Nike、Walmart等首批接入。
智能體:Gemini Spark作為24小時個人Agent,云端運行;Antigravity 2.0升級為多Agent編排平臺,全面擺脫coding場景局限,和Claude Code以及Codex直接競爭。
硬件:Android XR音頻眼鏡今秋上市,由三星制造,兼容iOS,聯合眼鏡品牌Gentle Monster和Warby Parker共同設計;純音頻版本今年秋季率先推出,帶顯示屏的版本將于明年推出。
訂閱:新增100美元/月Ultra plan;原250美元/月的頂級Ultra plan降到200美元;Pro維持19.99美元/月。
谷歌沒有在參數競賽上繼續加碼,而是把最多的時間給了Agent。接下來,我們來詳細看看這場大會釋放了哪些信號。
01.谷歌模型在講什么故事
2026 Google I/O大會的第一個重要信號,從芯片層開始。
谷歌提出第八代TPU的“雙芯”戰略,將訓練與推理拆分為獨立芯片。TPU 8t專攻訓練、TPU 8i則聚焦推理。
TPU 8t單個Pod可塞下9600顆芯片,集群總算力121 ExaFLOPS,較Ironwood提升約3倍,性價比提升2.7倍。集群可擴展至百萬級芯片,將大模型訓練周期從數月壓縮至數周。TPU 8i則主打低延遲推理,它的推理性價比提升80%,大緩存設計顯著減少內存訪問延遲,可滿足Gemini 3.5 Flash等高并發推理需求。
![]()
谷歌大會上,介紹芯片性能
第八代TPU對應的是谷歌在AI Agent上的布局。訓練、推理分離、供應鏈多元化、全棧軟件優化,既強化了谷歌在算力的基礎設施,也標志著全球AI芯片競爭進入更專業的階段。
有了更強的基建,模型自然也不能掉隊。大會上谷歌推出了Gemini 3.5 Flash和Gemini Omni,雖然沒有萬眾期待的Gemini 4.0,但展示了谷歌的產品邏輯:不追求最強模型,更注重讓不同模型服務于不同商業場景。
Gemini Omni是谷歌今年推出的世界模型。它被定位為“能從任何輸入生成任何輸出”的多模態系統,以視頻生成和編輯為切入點,將文本、圖像、音頻和視頻統一在同一個創作流程中。
![]()
現場演示Gemini Omni創作的視頻
它的亮點在于對物理世界規律的理解,這意味著能夠準確預測場景中應該發生什么。用戶用自然語言編輯視頻時,角色一致性、物理邏輯、場景記憶都能保持連貫。
Omni Flash將率先接入Gemini App、Google Flow和YouTube Shorts,面向AI Plus及以上訂閱用戶開放。谷歌旗下的Nano Banana技術已生成超500億張圖像,Omni的加入將創作能力從靜態圖像延伸至動態視頻。
Gemini 3.5 Flash速度提升,還更省錢了。它在幾乎所有基準測試上都超越了三個月前的旗艦模型Gemini 3.1 Pro。一個定位中端的模型能夠全面碾壓上一代旗艦產品,這在行業中并不多見。在輸出速度上,Gemini 3.5 Flash是其他前沿速度模型的4倍。
![]()
介紹Gemini 3.5 Flash性能
價格上,Gemini 3.5 Flash的定價為每百萬輸入token 1.5美元、每百萬輸出token 9美元。橫向對比,Claude Sonnet 4.6的輸入價格是3美元、輸出是15美元,Gemini 3.5 Flash的整體定價低了40%到50%。性能追平甚至超越競品旗艦,價格只要一半。
目前,Gemini App月活已達9億,每日請求量增長超7倍。
值得一提的是,大會上宣布Gemini 3.5 Pro繼續走深度推理路線,預計6月發布。
在模型能力之外,谷歌還在推進SynthID。它是DeepMind三年前推出的數字水印技術,已應用于超1000億圖片和視頻。此次I/O大會上,谷歌宣布與OpenAI、ElevenLabs攜手推動水印透明化標準,并向搜索和Chrome拓展內容憑證驗證。這也回應了當下打擊AI生成內容泛濫,難以監管的行業難題。
總結來看,TPU 8的訓練推理分離,解決的是算力成本結構問題。Gemini 3.5 Flash的高性能低價格,解決的是智能體規模化部署的性價比問題。Omni切入創作者經濟,解決的是谷歌在內容生成市場的存在感問題。
這也解釋了為什么谷歌敢把3.5 Flash做得又快又便宜。它要的不是模型本身的利潤,而是以模型為入口,撬動整個智能體經濟的生態。
02.搜索里,長出智能體、購物車和操作系統
模型的迭代終究還是要落到產品。谷歌搜索是這次變化最大的產品,谷歌將其稱為“25年來的最大升級”。
過去搜索框的交互邏輯一直是輸入關鍵詞,輸出網頁鏈接。現在,輸入端可以容納更長、更口語化的查詢,也更能理解你的搜索意圖,輸入端也不再局限于文字,圖片、文件、視頻、Chrome標簽頁都可以直接“丟”進去。
![]()
谷歌大會上,演示AI搜索
AI Mode已升級到Gemini 3.5 Flash驅動,面向全球所有用戶上線,月活突破10億。兩者合并帶來的體驗是,問一個問題能得到AI概覽,還可以直接在原頁面上繼續追問,上下文不丟失。
但真正改變搜索性質的,是輸出端。
谷歌把Antigravity2.0背后的智能體編程能力注入搜索,推出了Generative UI。Gemini 3.5 Flash拿到你的問題后,會從零開始規劃回答方案,輸出交互式界面、圖表等形式,更能滿足個人化的需求。
這種能力還在往周期任務延伸。你用自然語言描述需求,搜索可以打造個性化的小型應用,接入實時天氣、讀取日歷、了解飲食偏好,自動生成帶鏈接的計劃,生成出來的應用還可以分享給家人。Generative UI今年夏天面向所有搜索用戶免費開放,mini app功能先對美國AI Pro和Ultra訂閱用戶開放。
大會透露,搜索AI概覽(AI Overviews)月活超25億,AI模式(AI Mode)超10億,自上線以來查詢量每季度翻倍。
到這里,搜索已經從回答問題變成了執行任務。谷歌把這個邏輯推向的第一個商業場景是購物。
![]()
谷歌大會上,介紹購物功能
Universal Cart是一個跨商家、跨平臺的AI購物車,橫跨搜索、Gemini App、YouTube和Gmail。它可以在后臺自動追蹤降價、分析歷史價格、提醒補貨。整個體系構建在Google Wallet之上,能識別你的支付方式權益和商家優惠。目前,Nike、Target、Walmart、Sephora等大型零售商已接入首批結算功能。
![]()
AI購物已接入結算功能的商家
購物車能跨平臺運作,靠的是底層協議。Universal Commerce Protocol是年初在NRF上發布的開放標準,讓AI智能體代替用戶完成跨平臺購物和結算,亞馬遜、Meta、微軟、Salesforce和Stripe均已采納。
配套的Agent Payments Protocol解決的是支付的安全問題。AP2讓用戶給智能體設定支付邊界,指定品牌、商品類別、預算上限,同時通過加密的數字授權憑證在用戶、商家、支付方三者之間建立可追溯的鏈條。
谷歌在購物領域的嘗試已持續十余年,從Google Shopping到Buy on Google,但沒能形成閉環的電商交易鏈路。Universal Cart的邏輯與此前不同,它不試圖成為一個獨立的電商平臺,而是把自己嵌入用戶購物決策的全鏈路中。
Workspace這邊的更新同樣密集,它的邏輯是讓語音成為新的交互入口。Gmail Live可以用語音查詢收件箱;Docs Live能把你的口述直接組織成結構化文檔,并在授權后從Gmail、Drive和Chat中抓取相關信息充實內容。
![]()
現場演示AI音樂創作成果
創作工具層面,Google Pics基于Nano Banana模型,可以選定畫面中的單個元素精確編輯,其余部分不受影響。Google Flow和Flow Music則是面向視頻和音樂創作的AI工具,前者已推出Android測試版。
把這些變化放在一起看,底層趨勢是一樣的。谷歌把旗下所有高頻產品改造成讓AI替用戶執行任務的智能體。
03.Agent全家桶,真能替人干活嗎?
2026 Google I/O真正想講的故事是智能體。
Gemini Spark被定義為“個人AI智能體”。它可以全天候代替你執行任務,讀郵件、查日程、寫匯報、追進度、發提醒,即便你關掉窗口也不會停止。
![]()
谷歌推出Gemini Spark,即個人A智能體
Spark運行在Google Cloud的專屬虛擬機上,由Gemini 3.5 Flash驅動,底層跑的是Antigravity的Agent調度框架。在首發階段,Spark接入Gmail、Docs、Sheets等應用,未來將擴展到超過30個合作伙伴。Spark的入口不止Gemini App一個。今年夏天它將入駐Chrome,在任何網頁上都能直接讓它替你做事。
![]()
演示Gemini Spark如何操作
Agent還需要一個可見的界面層。Android Halo嵌入Android 17狀態欄的視覺指示器,以微妙的光圈動畫顯示Agent的實時工作狀態。你不需要打開任何App就能知道Spark正在替你做什么。
配合Spark的發布,谷歌還調整了訂閱價格:新增100美元/月的Ultra檔位,給那些想用Agent服務又不需要頂配的用戶;原來250美元/月的頂級Ultra降到200美元/月,Pro則維持19.99美元/月。
但谷歌不止押注C端。Antigravity 2.0是面向開發者的Agent基礎設施,它從一個IDE內置的編碼輔助工具,變為獨立的應用。開發者可以同時部署多個并行子Agent處理不同任務,設置后臺定時任務,用語音指揮Agent,Agent可以拆解復雜工作流并分配子任務。
![]()
谷歌大會上,介紹Antigravity 2.0性能
谷歌聲稱其在約12小時內可搭建一個能運行的操作系統核心框架,期間啟動了93個子Agent,處理了數十億Token,總計算成本不到1000美元。
![]()
展示Antigravity 2.0制作的游戲
大會還有一個值得關注的重點是Android XR智能眼鏡,由三星和高通制造,外觀設計來自Gentle Monster和Warby Parker,可兼容Android和iPhone。
![]()
谷歌大會上,智能眼鏡也是一大亮點
谷歌想打造一整套Agent操作系統,開發層有多Agent編排框架,手機上有狀態感知界面,臉上有語音和視覺輸入端。
Agent的悖論在于,它的價值取決于用戶的信任,而信任取決于可靠性。所以谷歌選擇讓Spark在執行高風險操作前必須征求用戶確認,詳細的思考軌跡對用戶可見,隨時可以打斷。
回看整場I/O大會,谷歌這次沒有拿出一個讓行業驚嘆的新模型,但它做的事情更實際,也更有野心。Omni負責感知,Spark負責生成,Agent負責7×24執行。
谷歌有TPU集群、全球數據中心、安卓生態、搜索入口、廣告變現機器,它不需要單點第一,只要足夠好、足夠便宜、足夠無處不在,就是它最大的競爭力。
不管怎么說,谷歌已經在全速前進了。
*題圖來源于Google黑板報微博截圖。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.