![]()
文:王智遠 | ID:Z201440
Google I/O 2026 就這么開完了。
兩個小時,幾十個產品更新,一股腦全砸出來。今天打開任意一家科技媒體都能看到產品清單,我就別跟著念了。
我想說的是另一件事:
Pichai 在 keynote 上放了張圖,Google 內部各產品每月處理的 token 量,2024 年 5 月 9.7 萬億,去年 I/O 的時候 480 萬億,今年到了 3.2 千萬億。一年,翻了 7 倍。
你別以為是用戶變多,Google 核心產品的用戶量級一年下來根本沒變,同一批人,開始用 AI 做以前壓根不會做的事,這是看懂整場 I/O 最關鍵的一把鑰匙。
Google 這次發的所有東西,模型、Agent、搜索升級、定價調整、基礎設施,都在追一個目標:
把 Agent 跑起來的成本壓到一條線以下,然后,用自己最大的本錢,把它塞進十幾億人每天都在用的產品里。
這場游戲規則,跟過去兩年的模型競賽,不一個路子。
01
Pichai 這次把一個模型推到了 keynote 最中間。最便宜的那個。
Gemini 3.5 Flash,名字里就帶 Flash;按 Google 自己的產品線邏輯,這是輕量款,不是旗艦。旗艦是 3.5 Pro,還沒發,Pichai 說夏天見,原話是「內部已經在用,還在打磨」。
先上的卻是 Flash,而且給了最中間的位置,排序本身就是態度。
我翻了翻它的基準測試:
3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%,3.1 Pro 是 70.3%。
在 GDPval-AA 這個專門衡量「真實經濟價值任務」的基準上,3.5 Flash 拿了 1656 Elo,3.1 Pro 是 1314。MCP Atlas 工具調用基準,83.6%。
![]()
翻譯成人話就是:
一個輕量款模型,在編碼和 Agent 任務上,把自家上一代旗艦全干翻了。
這種事以前幾乎不會發生,Flash 和 Pro 之間一直有明確的能力代差,你選 Flash 就是要拿能力換速度和價格。3.5 Flash 把這個默認假設砸碎了。
速度這邊更夸張,Pichai 在臺上報了個數:
每秒輸出 289 個 token,是其他前沿模型的 4 倍;在 Antigravity 2.0 里跑優化版本,能到 12 倍,定價每百萬 token 輸入 1.5 美元,輸出 9 美元。
我算了一下,比 3.1 Pro 的輸入價格低 40%,輸出也低 40%。如果再用上緩存,長上下文場景下的實際成本還能再降一個臺階。
這些數字單看都是參數,放一起看,就講了一件事:Agent 的邊際運行成本,到了一個新的量級。
Pichai 自己把賬算給了在場的人聽,大意是,一家頭部企業每天處理一萬億 token,把 80% 的負載從其他前沿模型遷到 3.5 Flash,一年能省超過 10 億美元。
這是給 CIO 看的財務測算。
Google 自己已經是最大的受益者,今年 3 月,Google 內部每天處理 5000 億 token。現在這個數超過 3 萬億,每隔幾周翻一倍。
增長的來源就一條:
工程團隊全面切到 Antigravity 加 3.5 Flash 的開發流程之后,原來跑不起的任務,突然跑得起了。
這就回到了開頭說的數據,token 消耗一年翻 7 倍,是成本降到某條線以下之后,用法自己長出來的。
3.5 Flash 的意義,不在于「又一個更強的模型」,它真正做的事,是把 Agent 從「技術上可行」推到了「經濟上可行」。
過去兩年大家聊 Agent,聊能不能做得到;這個模型一出來,問題變了,變成誰能把它鋪出去。
02
誰能把 Agent 鋪出去,Google 的第一個回答叫 Gemini Spark,一個 24 小時掛在云端的個人智能體。
你筆記本合上,手機鎖屏,它還在后臺干活,底層跑的是 3.5 Flash,框架是 Google 內部的 Antigravity Harness,部署在 Google Cloud 的專用虛擬機上。
入口就在 Gemini 應用里,9 億月活用戶,打開就能摸到,Google Labs 的副總裁 Josh Woodward 在臺上演示了幾個場景:
給老板發周報,Spark 自己去你的郵箱、文檔、表格、演示文稿里把事實拉出來,用你的語氣寫好草稿。
辦鄰居聚會,Spark 追蹤誰回復了誰沒回,自動在在線表格里建一個實時更新的 RSVP 表,給沒回的人起草催促郵件。
聽起來都是小事,這些小事值得講,因為全程不需要你盯著。
第一批接入的第三方工具是 Canva、OpenTable、Instacart,走的是 MCP 協議。
意思是 Spark 不只幫你在 Google 自家產品里跑腿,它還能幫你訂餐廳、下單買菜;接下來幾周會開放更多第三方接入,夏天還會加 Chrome 瀏覽器集成和 macOS 本地文件訪問。
開放節奏值得注意,Spark 現在只給受信任測試者用,下周以測試版推給美國的 AI Ultra 訂閱用戶,是一層一層放。
![]()
這個節奏背后藏著一個問題:用戶憑什么把郵箱、日歷、購物車交給一個 AI。
Google 這次專門花了時間講這件事,Spark 在做什么,每一步都展示思考軌跡,用戶隨時可以打斷;執行敏感操作之前會停下來征求許可,比如要發一封郵件、訂一個日歷會議,它會先問你一聲。
Woodward 的原話里還有一句:
你不需要一直開著電腦確認它在跑,這句話既是產品特性,也在回應用戶心里那個不安。
Spark 是對消費者的回答。對企業的回答是 Antigravity 2.0;Antigravity 1.0 去年 11 月發的,定位是智能編程環境,對標的是 Cursor,用了半年,Google 說已經有數百萬開發者。
2.0 這次換方向了,它從編程工具變成了多智能體編排平臺;具體分三層:
第一層,一款獨立桌面應用,Google 管它叫「與智能體交互的中樞」。
你可以同時起多個智能體,一個寫代碼,一個生成品牌素材,一個做產品架構,并行跑,互不干擾;還能設定計劃任務,讓智能體按時間表自動在后臺執行。
第二層,Antigravity 命令行工具,給習慣待在終端里的開發者用;這個工具直接取代了之前的 Gemini 命令行,6 月 18 日舊版停服,所有用戶必須遷移。
第三層,Antigravity SDK。
這一層是關鍵。Google 給的說明是,SDK 讓外部開發者可以用編程方式調用驅動 Google 自家產品的同一套智能體框架,跟 Gemini 模型協同優化,部署在自己的基礎設施上。
翻譯一下:
Google 試著把自己內部正在用的智能體基礎設施,以 SDK 的形式交到開發者手里,這是對 Claude Code 和 Codex 的正面對位。
Antigravity 這條線下面還有一個單獨發布,叫 CodeMender;一個安全智能體,用 Gemini 的推理能力自動發現并修復關鍵代碼漏洞,直接下筆改代碼,不只是報告問題。
Google 的邏輯很直白:智能體寫的代碼越來越多,安全就得跟上,安全本身也得由智能體來做。
把 Spark 和 Antigravity 2.0 放在一起看,Google 做的事情就很清楚了。
消費者這邊,一個 24 小時在線的個人智能體,接著 9 億月活的 Gemini 應用落地;企業這邊,一個從編程工具進化成編排平臺的開發者工具,附帶 SDK 和命令行,直接競爭 Claude Code。
兩條路同時鋪,中間跑的都是同一個引擎,3.5 Flash。
所以,谷歌的解法是:準備兩條腿一起跑,消費者和開發者一個都不放。
03
鋪出去之后,智能體往哪跑?說出來肯定驚到下巴,答案藏在 Google 最老的那個產品里:搜索。
Google 自己給這次搜索框改造下的定義是「標志性搜索框 25 年來最大的一次升級」;智遠認為,這話有營銷成分,但看完具體改動之后,確實不是小修小補。
先說一個數據:
AI Mode 去年 I/O 才發布,一年時間月活過了 10 億。上線以來每個季度查詢量翻一倍,上季度 Google 搜索的總查詢量創了歷史新高。
這個數字反直覺,過去幾年行業里一直有個敘事:
AI 聊天機器人會蠶食搜索,實際發生的正好反過來;人們發現搜索能做更多事之后,搜索量不降反升,而且漲得很猛。
新搜索框的變化從交互層就開始了,它會隨著你輸入的內容自動擴展,容納更長更口語化的問題。
原來的自動補全換成了一套 AI 驅動的查詢建議系統,是幫你想清楚你到底想問什么,同時支持多模態輸入,文字、圖片、視頻、Chrome 標簽頁都能往里丟。
AI Overviews 和 AI Mode 這次合到一起了,你問一個問題,看到 AI 概覽,直接在原頁面追問就滑入 AI Mode,上下文不斷,越聊越深,推薦的鏈接和來源也越來越精準。5 月 19 日全球同步上線。
這些都是產品層面的更新,真正值得注意的是搜索框里長出來的智能體。
Google 管它叫信息智能體,你可以在搜索里創建一個或者多個后臺智能體,24 小時幫你盯著某件事。
比如:
你讓它跟蹤某個領域的市場變動,智能體會自己制定監控計劃,決定該用哪些數據源,包括 Google 的實時金融數據、新聞、博客、社交帖子,條件觸發的時候合成一份帶鏈接的更新推給你,今夏上線,先給 AI Pro 和 Ultra 訂閱用戶。
![]()
再往前一步,搜索里還接入了 Antigravity 的編程能力。
Google 管它叫生成式界面,你搜一個問題,搜索不只給你答案,還能現場給你生成一個可交互的迷你應用。
臺上演示的例子是一個個性化健身應用,能接入實時天氣、讀你的日歷、知道你的飲食偏好,自動生成飲食計劃并附帶食譜鏈接。
這是搜索在幫你造東西。搜索之外,智能體也在進 Google 的其他產品。
Daily Brief 是 Gemini 應用里的第一個開箱即用的智能體。每天早上幫你整理收件箱、日歷和待辦,排好優先級,給出下一步建議。
它的前身是去年 12 月在 Google Labs 上線的一個實驗項目 Cici,很快成了最受歡迎的實驗之一,這次直接收編進了正式產品線。
統一購物車是購物場景的智能體,一個跨 Google 搜索、Gemini 應用、YouTube、郵箱工作的統一購物車,能追蹤降價、監控庫存、查看價格歷史,甚至能發現你買的電腦配件之間的兼容性問題。
Ask YouTube 重新定義了視頻搜索,你問一個問題,它不給你一排視頻列表讓你自己翻,而是直接跳到最相關的那個視頻里最相關的那個片段。
把這些更新攤開看,一個結論就浮出來了。
模型競賽時,比誰的基準分數高,純 AI 公司和平臺公司站在同一起跑線上。
智能體競賽的邏輯完全不同,智能體要連接真實的郵箱、日歷、文檔、購物車、搜索歷史、視頻庫,誰手里有這些東西,誰就有先天優勢。
Google 有 13 個產品超過 10 億用戶,5 個超過 30 億。這不是技術能補的差距。
Anthropic 和 OpenAI 可以做出很好的模型,可以做出很好的智能體框架;它們做不出郵箱,做不出搜索,做不出 YouTube。
這是 Google 在智能體時代最大的本錢,也是這場 I/O 真正在講的故事,模型再強也拼不過管道有多粗。
04
管道粗,得有東西在底下撐著。
Pichai 在 keynote 后半段把話題轉到了基礎設施,開頭就甩了一個數字:2022 年 Google 的資本開支是 310 億美元,今年預計 1800 到 1900 億。6 倍。四年時間。
這筆錢的一大塊砸在了自研芯片上,Google 發布了第八代 TPU,第一次做了雙芯片分工。
TPU 8t 專做訓練,原始算力接近上一代的 3 倍;TPU 8i 專做推理,速度拉滿,兩顆芯片的性能功耗比都提升了約 2 倍。
訓練這邊還有一個值得單獨講的變化。
Google 自己搞了一套訓練調度框架,訓練任務能跨好幾個數據中心跑,全球調度超過 100 萬顆 TPU。Pichai 管這叫「世界上最大的訓練集群」。
這意味著訓練不再被一個機房的物理上限卡住,模型越來越大,訓練周期從幾個月壓到幾周。
推理這邊,TPU 8i 的設計方向就一個字,快。Pichai 原話提到,Google 做了 27 年搜索,學到的最深的一課就是延遲很重要。
3.5 Flash 每秒 289 個 token 的輸出速度,底下撐著的就是這套推理芯片。
把上面幾段的邏輯串起來:3.5 Flash 的速度和價格不是憑空來的,是 1800 億美元的資本開支、自研芯片、全球分布式訓練集群共同托出來的。
純 AI 公司可以在模型層追上來,基礎設施層想追上,難度高了一大截。這是另一層「管道」。
05
最后一塊拼圖是 Gemini Omni,這趴是 DeepMind 的 CEO Demis Hassabis 親自上臺講的,分量夠重。
Omni 能干啥?你給它什么,它給你什么,先從視頻開始,以后圖片和文字也會跟上來。
第一款上線的叫 Gemini Omni Flash,5 月 19 日開始在 Gemini 應用、Google Flow 和 YouTube Shorts 里能用,所有生成的內容自帶水印。
3.5 Flash 解決的是「讓智能體跑起來」,Omni 指向的是更遠的事:讓 AI 不光會寫字,還會造東西。
Omni 不是一個獨立的新東西,以前 Google 的 Veo 管視頻生成,Nano Banana 管圖片編輯,各管各的,互不搭嘎;Omni 把這些全塞進 Gemini 一個框里了。
你上傳一段自己拍的視頻,說一句話讓它改,它就能改里面正在發生的事,加個人進去,換個風格,時間線還給你接得上。
或者你純用文字描述一個想法,Omni 直接給你生成一段帶畫面帶聲音的視頻。
這個能力單看是個很強的演示,放回整場 I/O 的邏輯里看,它在講一件更大的事。
我翻了一下時間線:
今年 4 月 29 日,OpenAI 把面向消費者的 Sora 2 應用關了,只留了付費 API;理由是基礎設施成本和分發策略要調整。11 天之后,Google 的 Gemini 應用里開始出現 Omni 的影子。
同一個方向,一家因為扛不住成本退了一步,另一家選擇往前走。
兩家面對的技術難題差不多。差別在哪?Google 有自研的 TPU 推理芯片壓成本,有 Gemini 應用 9 億月活分攤算力,有 YouTube Shorts 這種現成的臺子來消化視頻生成的產能。
OpenAI 沒有;這不只誰的模型更好的問題,是誰的結構撐得住。
把整場 I/O 從頭到尾串一遍,Google 講的就一件事:
模型層,3.5 Flash 用速度和價格把智能體的成本壓到誰都接得住的位置。
產品層,Spark 給普通人,Antigravity 2.0 給程序員,搜索里長出來的智能體和生成式界面把搜索變成了入口,統一購物車把智能體塞進了真實交易。
基礎設施層,1800 億美元的資本開支、第八代 TPU、百萬顆芯片的訓練集群在底下兜著;每一層都不是孤立存在,屬于一個系統里的不同齒輪。
Pichai 在 I/O 前的小范圍交流里說過一句話:
我們為什么這么執著于做出既強又快又便宜的前沿模型,因為我們要把它帶給盡可能多的人。這是我們真正會發光的地方。
這句話的潛臺詞不難讀,Google 認為智能體時代的終局,是誰能把好的模型、大的管道、深的地基綁在一起,讓智能體真的跑進普通人的生活。
過去兩年,純 AI 公司掌握著行業敘事的主場,這場 I/O 之后,一個老問題值得重新想想:
當競爭從「做出最好的模型」變成「讓智能體跑進真實生活」,窗口在給誰打開,又在給誰關上。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.