網易首頁 > 網易號 > 正文申請入駐

Google I/O 2026 不打模型仗了

2026-05-20 06:01:58　來源: 智遠同學

浙江舉報

分享至

文：王智遠 | ID:Z201440

Google I/O 2026 就這么開完了。

兩個小時，幾十個產品更新，一股腦全砸出來。今天打開任意一家科技媒體都能看到產品清單，我就別跟著念了。

我想說的是另一件事：

Pichai 在 keynote 上放了張圖，Google 內部各產品每月處理的 token 量，2024 年 5 月 9.7 萬億，去年 I/O 的時候 480 萬億，今年到了 3.2 千萬億。一年，翻了 7 倍。

你別以為是用戶變多，Google 核心產品的用戶量級一年下來根本沒變，同一批人，開始用 AI 做以前壓根不會做的事，這是看懂整場 I/O 最關鍵的一把鑰匙。

Google 這次發的所有東西，模型、Agent、搜索升級、定價調整、基礎設施，都在追一個目標：

把 Agent 跑起來的成本壓到一條線以下，然后，用自己最大的本錢，把它塞進十幾億人每天都在用的產品里。

這場游戲規則，跟過去兩年的模型競賽，不一個路子。

01

Pichai 這次把一個模型推到了 keynote 最中間。最便宜的那個。

Gemini 3.5 Flash，名字里就帶 Flash；按 Google 自己的產品線邏輯，這是輕量款，不是旗艦。旗艦是 3.5 Pro，還沒發，Pichai 說夏天見，原話是「內部已經在用，還在打磨」。

先上的卻是 Flash，而且給了最中間的位置，排序本身就是態度。

我翻了翻它的基準測試：

3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%，3.1 Pro 是 70.3%。

在 GDPval-AA 這個專門衡量「真實經濟價值任務」的基準上，3.5 Flash 拿了 1656 Elo，3.1 Pro 是 1314。MCP Atlas 工具調用基準，83.6%。

翻譯成人話就是：

一個輕量款模型，在編碼和 Agent 任務上，把自家上一代旗艦全干翻了。

這種事以前幾乎不會發生，Flash 和 Pro 之間一直有明確的能力代差，你選 Flash 就是要拿能力換速度和價格。3.5 Flash 把這個默認假設砸碎了。

速度這邊更夸張，Pichai 在臺上報了個數：

每秒輸出 289 個 token，是其他前沿模型的 4 倍；在 Antigravity 2.0 里跑優化版本，能到 12 倍，定價每百萬 token 輸入 1.5 美元，輸出 9 美元。

我算了一下，比 3.1 Pro 的輸入價格低 40%，輸出也低 40%。如果再用上緩存，長上下文場景下的實際成本還能再降一個臺階。

這些數字單看都是參數，放一起看，就講了一件事：Agent 的邊際運行成本，到了一個新的量級。

Pichai 自己把賬算給了在場的人聽，大意是，一家頭部企業每天處理一萬億 token，把 80% 的負載從其他前沿模型遷到 3.5 Flash，一年能省超過 10 億美元。

這是給 CIO 看的財務測算。

Google 自己已經是最大的受益者，今年 3 月，Google 內部每天處理 5000 億 token。現在這個數超過 3 萬億，每隔幾周翻一倍。

增長的來源就一條：

工程團隊全面切到 Antigravity 加 3.5 Flash 的開發流程之后，原來跑不起的任務，突然跑得起了。

這就回到了開頭說的數據，token 消耗一年翻 7 倍，是成本降到某條線以下之后，用法自己長出來的。

3.5 Flash 的意義，不在于「又一個更強的模型」，它真正做的事，是把 Agent 從「技術上可行」推到了「經濟上可行」。

過去兩年大家聊 Agent，聊能不能做得到；這個模型一出來，問題變了，變成誰能把它鋪出去。

02

誰能把 Agent 鋪出去，Google 的第一個回答叫 Gemini Spark，一個 24 小時掛在云端的個人智能體。

你筆記本合上，手機鎖屏，它還在后臺干活，底層跑的是 3.5 Flash，框架是 Google 內部的 Antigravity Harness，部署在 Google Cloud 的專用虛擬機上。

入口就在 Gemini 應用里，9 億月活用戶，打開就能摸到，Google Labs 的副總裁 Josh Woodward 在臺上演示了幾個場景：

給老板發周報，Spark 自己去你的郵箱、文檔、表格、演示文稿里把事實拉出來，用你的語氣寫好草稿。

辦鄰居聚會，Spark 追蹤誰回復了誰沒回，自動在在線表格里建一個實時更新的 RSVP 表，給沒回的人起草催促郵件。

聽起來都是小事，這些小事值得講，因為全程不需要你盯著。

第一批接入的第三方工具是 Canva、OpenTable、Instacart，走的是 MCP 協議。

意思是 Spark 不只幫你在 Google 自家產品里跑腿，它還能幫你訂餐廳、下單買菜；接下來幾周會開放更多第三方接入，夏天還會加 Chrome 瀏覽器集成和 macOS 本地文件訪問。

開放節奏值得注意，Spark 現在只給受信任測試者用，下周以測試版推給美國的 AI Ultra 訂閱用戶，是一層一層放。

這個節奏背后藏著一個問題：用戶憑什么把郵箱、日歷、購物車交給一個 AI。

Google 這次專門花了時間講這件事，Spark 在做什么，每一步都展示思考軌跡，用戶隨時可以打斷；執行敏感操作之前會停下來征求許可，比如要發一封郵件、訂一個日歷會議，它會先問你一聲。

Woodward 的原話里還有一句：

你不需要一直開著電腦確認它在跑，這句話既是產品特性，也在回應用戶心里那個不安。

Spark 是對消費者的回答。對企業的回答是 Antigravity 2.0；Antigravity 1.0 去年 11 月發的，定位是智能編程環境，對標的是 Cursor，用了半年，Google 說已經有數百萬開發者。

2.0 這次換方向了，它從編程工具變成了多智能體編排平臺；具體分三層：

第一層，一款獨立桌面應用，Google 管它叫「與智能體交互的中樞」。

你可以同時起多個智能體，一個寫代碼，一個生成品牌素材，一個做產品架構，并行跑，互不干擾；還能設定計劃任務，讓智能體按時間表自動在后臺執行。

第二層，Antigravity 命令行工具，給習慣待在終端里的開發者用；這個工具直接取代了之前的 Gemini 命令行，6 月 18 日舊版停服，所有用戶必須遷移。

第三層，Antigravity SDK。

這一層是關鍵。Google 給的說明是，SDK 讓外部開發者可以用編程方式調用驅動 Google 自家產品的同一套智能體框架，跟 Gemini 模型協同優化，部署在自己的基礎設施上。

翻譯一下：

Google 試著把自己內部正在用的智能體基礎設施，以 SDK 的形式交到開發者手里，這是對 Claude Code 和 Codex 的正面對位。

Antigravity 這條線下面還有一個單獨發布，叫 CodeMender；一個安全智能體，用 Gemini 的推理能力自動發現并修復關鍵代碼漏洞，直接下筆改代碼，不只是報告問題。

Google 的邏輯很直白：智能體寫的代碼越來越多，安全就得跟上，安全本身也得由智能體來做。

把 Spark 和 Antigravity 2.0 放在一起看，Google 做的事情就很清楚了。

消費者這邊，一個 24 小時在線的個人智能體，接著 9 億月活的 Gemini 應用落地；企業這邊，一個從編程工具進化成編排平臺的開發者工具，附帶 SDK 和命令行，直接競爭 Claude Code。

兩條路同時鋪，中間跑的都是同一個引擎，3.5 Flash。

所以，谷歌的解法是：準備兩條腿一起跑，消費者和開發者一個都不放。

03

鋪出去之后，智能體往哪跑？說出來肯定驚到下巴，答案藏在 Google 最老的那個產品里：搜索。

Google 自己給這次搜索框改造下的定義是「標志性搜索框 25 年來最大的一次升級」；智遠認為，這話有營銷成分，但看完具體改動之后，確實不是小修小補。

先說一個數據：

AI Mode 去年 I/O 才發布，一年時間月活過了 10 億。上線以來每個季度查詢量翻一倍，上季度 Google 搜索的總查詢量創了歷史新高。

這個數字反直覺，過去幾年行業里一直有個敘事：

AI 聊天機器人會蠶食搜索，實際發生的正好反過來；人們發現搜索能做更多事之后，搜索量不降反升，而且漲得很猛。

新搜索框的變化從交互層就開始了，它會隨著你輸入的內容自動擴展，容納更長更口語化的問題。

原來的自動補全換成了一套 AI 驅動的查詢建議系統，是幫你想清楚你到底想問什么，同時支持多模態輸入，文字、圖片、視頻、Chrome 標簽頁都能往里丟。

AI Overviews 和 AI Mode 這次合到一起了，你問一個問題，看到 AI 概覽，直接在原頁面追問就滑入 AI Mode，上下文不斷，越聊越深，推薦的鏈接和來源也越來越精準。5 月 19 日全球同步上線。

這些都是產品層面的更新，真正值得注意的是搜索框里長出來的智能體。

Google 管它叫信息智能體，你可以在搜索里創建一個或者多個后臺智能體，24 小時幫你盯著某件事。

比如：

你讓它跟蹤某個領域的市場變動，智能體會自己制定監控計劃，決定該用哪些數據源，包括 Google 的實時金融數據、新聞、博客、社交帖子，條件觸發的時候合成一份帶鏈接的更新推給你，今夏上線，先給 AI Pro 和 Ultra 訂閱用戶。

再往前一步，搜索里還接入了 Antigravity 的編程能力。

Google 管它叫生成式界面，你搜一個問題，搜索不只給你答案，還能現場給你生成一個可交互的迷你應用。

臺上演示的例子是一個個性化健身應用，能接入實時天氣、讀你的日歷、知道你的飲食偏好，自動生成飲食計劃并附帶食譜鏈接。

這是搜索在幫你造東西。搜索之外，智能體也在進 Google 的其他產品。

Daily Brief 是 Gemini 應用里的第一個開箱即用的智能體。每天早上幫你整理收件箱、日歷和待辦，排好優先級，給出下一步建議。

它的前身是去年 12 月在 Google Labs 上線的一個實驗項目 Cici，很快成了最受歡迎的實驗之一，這次直接收編進了正式產品線。

統一購物車是購物場景的智能體，一個跨 Google 搜索、Gemini 應用、YouTube、郵箱工作的統一購物車，能追蹤降價、監控庫存、查看價格歷史，甚至能發現你買的電腦配件之間的兼容性問題。

Ask YouTube 重新定義了視頻搜索，你問一個問題，它不給你一排視頻列表讓你自己翻，而是直接跳到最相關的那個視頻里最相關的那個片段。

把這些更新攤開看，一個結論就浮出來了。

模型競賽時，比誰的基準分數高，純 AI 公司和平臺公司站在同一起跑線上。

智能體競賽的邏輯完全不同，智能體要連接真實的郵箱、日歷、文檔、購物車、搜索歷史、視頻庫，誰手里有這些東西，誰就有先天優勢。

Google 有 13 個產品超過 10 億用戶，5 個超過 30 億。這不是技術能補的差距。

Anthropic 和 OpenAI 可以做出很好的模型，可以做出很好的智能體框架；它們做不出郵箱，做不出搜索，做不出 YouTube。

這是 Google 在智能體時代最大的本錢，也是這場 I/O 真正在講的故事，模型再強也拼不過管道有多粗。

04

管道粗，得有東西在底下撐著。

Pichai 在 keynote 后半段把話題轉到了基礎設施，開頭就甩了一個數字：2022 年 Google 的資本開支是 310 億美元，今年預計 1800 到 1900 億。6 倍。四年時間。

這筆錢的一大塊砸在了自研芯片上，Google 發布了第八代 TPU，第一次做了雙芯片分工。

TPU 8t 專做訓練，原始算力接近上一代的 3 倍；TPU 8i 專做推理，速度拉滿，兩顆芯片的性能功耗比都提升了約 2 倍。

訓練這邊還有一個值得單獨講的變化。

Google 自己搞了一套訓練調度框架，訓練任務能跨好幾個數據中心跑，全球調度超過 100 萬顆 TPU。Pichai 管這叫「世界上最大的訓練集群」。

這意味著訓練不再被一個機房的物理上限卡住，模型越來越大，訓練周期從幾個月壓到幾周。

推理這邊，TPU 8i 的設計方向就一個字，快。Pichai 原話提到，Google 做了 27 年搜索，學到的最深的一課就是延遲很重要。

3.5 Flash 每秒 289 個 token 的輸出速度，底下撐著的就是這套推理芯片。

把上面幾段的邏輯串起來：3.5 Flash 的速度和價格不是憑空來的，是 1800 億美元的資本開支、自研芯片、全球分布式訓練集群共同托出來的。

純 AI 公司可以在模型層追上來，基礎設施層想追上，難度高了一大截。這是另一層「管道」。

05

最后一塊拼圖是 Gemini Omni，這趴是 DeepMind 的 CEO Demis Hassabis 親自上臺講的，分量夠重。

Omni 能干啥？你給它什么，它給你什么，先從視頻開始，以后圖片和文字也會跟上來。

第一款上線的叫 Gemini Omni Flash，5 月 19 日開始在 Gemini 應用、Google Flow 和 YouTube Shorts 里能用，所有生成的內容自帶水印。

3.5 Flash 解決的是「讓智能體跑起來」，Omni 指向的是更遠的事：讓 AI 不光會寫字，還會造東西。

Omni 不是一個獨立的新東西，以前 Google 的 Veo 管視頻生成，Nano Banana 管圖片編輯，各管各的，互不搭嘎；Omni 把這些全塞進 Gemini 一個框里了。

你上傳一段自己拍的視頻，說一句話讓它改，它就能改里面正在發生的事，加個人進去，換個風格，時間線還給你接得上。

或者你純用文字描述一個想法，Omni 直接給你生成一段帶畫面帶聲音的視頻。

這個能力單看是個很強的演示，放回整場 I/O 的邏輯里看，它在講一件更大的事。

我翻了一下時間線：

今年 4 月 29 日，OpenAI 把面向消費者的 Sora 2 應用關了，只留了付費 API；理由是基礎設施成本和分發策略要調整。11 天之后，Google 的 Gemini 應用里開始出現 Omni 的影子。

同一個方向，一家因為扛不住成本退了一步，另一家選擇往前走。

兩家面對的技術難題差不多。差別在哪？Google 有自研的 TPU 推理芯片壓成本，有 Gemini 應用 9 億月活分攤算力，有 YouTube Shorts 這種現成的臺子來消化視頻生成的產能。

OpenAI 沒有；這不只誰的模型更好的問題，是誰的結構撐得住。

把整場 I/O 從頭到尾串一遍，Google 講的就一件事：

模型層，3.5 Flash 用速度和價格把智能體的成本壓到誰都接得住的位置。

產品層，Spark 給普通人，Antigravity 2.0 給程序員，搜索里長出來的智能體和生成式界面把搜索變成了入口，統一購物車把智能體塞進了真實交易。

基礎設施層，1800 億美元的資本開支、第八代 TPU、百萬顆芯片的訓練集群在底下兜著;每一層都不是孤立存在，屬于一個系統里的不同齒輪。

Pichai 在 I/O 前的小范圍交流里說過一句話：

我們為什么這么執著于做出既強又快又便宜的前沿模型，因為我們要把它帶給盡可能多的人。這是我們真正會發光的地方。

這句話的潛臺詞不難讀，Google 認為智能體時代的終局，是誰能把好的模型、大的管道、深的地基綁在一起，讓智能體真的跑進普通人的生活。

過去兩年，純 AI 公司掌握著行業敘事的主場，這場 I/O 之后，一個老問題值得重新想想：

當競爭從「做出最好的模型」變成「讓智能體跑進真實生活」，窗口在給誰打開，又在給誰關上。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

智遠同學

暢銷書《復利思維》作者；精神生活與商業探索，關注科技人文、消費電商、品牌營銷、商業認知思維等方面。

762文章數 210關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

親子

家居

公開課

軍事航空

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Google I/O 2026 不打模型仗了

01

02

03

04

05

淘寶、京東、拼多多、抖音、小紅書被約談

特朗普突然取消對伊朗"猛烈打擊"：美伊達成重大協議

特朗普突然取消對伊朗"猛烈打擊"：美伊達成重大協議

比起總冠軍，更大的懸念成了FMVP？

《花少8》陣容大揭秘！秒殺前一季

干細胞生意：17萬一針的希望

將搭云輦-M智能磁流變懸架 方程豹方程S系列信息曝光

態度原創

華國鋒的“華氏顏體”為何被公認為書法珍品？

歷經兩年治療，無精子癥患者家庭在滬迎健康寶寶

空間微調 移形換境

伊朗媒體：已故最高領袖葬禮推遲舉行

將搭云輦-M智能磁流變懸架方程豹方程S系列信息曝光

空間微調移形換境