網易首頁 > 網易號 > 正文申請入駐

Google I/O 2026：模型不再是主角，智能體撐起 AI 商業化

2026-05-20 07:45:42　來源: 極客公園

北京舉報

分享至

拼參數的模型時代已過去，接下來是拼生意的智能體時代。

作者｜徐珊

5 月 20 日，美國加州山景城，Google CEO Sundar Pichai 又一次走上 Google I/O 的舞臺，掌聲熱烈。

今年他卻沒有像往年那樣，一上來就亮出新模型。他先亮里一組數據展示 Google 過去一年的成果。Gemini App 達到 9 億月活、AI Mode 達到 10 億月活的、 Workspace 的用戶突破 40 億用戶、每月 token 的處理量達到 3.2 千萬億。

但講到產品，首先出場的居然是地圖、YouTube、Docs 三個基礎應用的 AI 升級，Ask for Maps、Ask YouTube 和 Docs Live。

這個開場順序很反常。

了解谷歌 I/O 節奏的人都知道，過去三年 Google 總是從模型能力開場。它得向世界證明，它沒被 ChatGPT 甩下。2023 年 Bard 急匆匆登場，2024 年 Gemini 反復改名重啟，2025 年它終于追平節奏。那三年，Google 越發力越像 OpenAI，越用力越不像自己。很明顯，這一次，Google 的敘事姿態變了，Sundar 不再焦慮，開始回到用規模說話，講述 AI 進入自家產業細微處所帶來的變化。

如果你按「發布了什么」看這場 I/O 大會，會看到一堆新東西：Gemini 3.5 Flash、世界模型 Gemini Omni、個人智能體 Gemini Spark、智能購物車 Universal Cart……

但如果換一個視角，你會發現另一件事，Google 正在系統性地把 AI 的每一處可能性都改造成商業入口。

Google 3.5 Flash 在打模型價格戰，Gemini Spark 是新的訂閱增長動力，智能購物車 Universal Cart 可以收電商傭金，UCP 在協議層抽水，Workspace 智能體服務企業，Chrome agent 則是重做搜索廣告這門老生意。

這背后當然有資金的壓力，Google 宣布今年要花 1900 億美元繼續投入 AI 基建，是 2022 年的 6 倍。但更值得關注的是，Google 用一條全新的產品線在回答一個問題，當模型本身越來越不值錢了，AI 真正的商業化，要從哪兒開始？

Gemini 4 缺席

Google 這次沒把模型當重點

這次 Google 在 I/O 大會上一共帶來了三款新模型：Gemini 3.5 Flash、Gemini Omni 、Gemini 3.5 Pro。

其中，Gemini 3.5 Flash的輸出速度比其他模型快 4 倍，在 Antigravity 開發者平臺里跑甚至能快 12 倍。谷歌技術人員還在臺上演示了一個 demo，讓 Gemini 3.5 Flash 實時生成一段 Chrome Dino 游戲代碼，屏幕右上角的 token 輸出速度跳到了每秒 1500 個 token。

性能上，Gemini 3.5 Flash 在幾乎所有 benchmark 上都拿到了曾經高端模型 Pro 級別的成績，代表智能體執行能力的 Terminal-Bench 2.1 拿到 76.2%、代表工具調用的 MCP Atlas 拿到 83.6%、代表多模態推理能力的 CharXiv Reasoning 拿到 84.2% 。

價格上，Gemini 3.5 Flash 定價每百萬 input token 1.5 美元、每百萬 output token 9 美元。這這個價格放在中端模型里，性價比相當高。對標的 Claude Sonnet 4.6 是每百萬 input 3 美元、output 15 美元，Gemini 3.5 Flash 整體便宜了 40-50%。目前 Gemini 3.5 Flash 可以在 Gemini App 和 AI Mode 中直接體驗。

「一家公司每天處理 1 萬億 token，如果把 80% 工作流換成 Flash，一年能省 10 億美元。」Sundar 說道。很顯然，在 Gemini 3.5 Flash 上，Google 已經調整了自己的模型產品邏輯，當大家都在卷模型上限，卷誰的模型 benchmark 更高的時候，Google 覺得夠強、夠快、夠便宜的 Gemini 3.5 Flash 更有市場競爭優勢。

這其實很好理解，模型的利潤空間已經越來越薄，模型本身正在變成一個「夠用就行」的東西，也因此性價比甚至開始比性能更重要。同時，當模型本身越來越便宜，真正能定價的，是模型之上的東西，比如說智能體、訂閱、企業服務等等，更具有價值，因此模型開始回歸到底層基礎建設，為智能體服務。

其次，Google 終于拿出多模態模型的最后一塊拼圖，世界模型 Gemini Omni。Google 把音頻、圖片、視頻生成能力都放進了 Gemini Omni，據悉下個月能夠先體驗 Gemini Omni Flash。

介紹 Gemini Omni 的時候，Google DeepMind 聯合創始人 Demis Hassabis主要就用了一句話：「模型從預測文本，到模擬現實（from predicting text to simulating reality）。」

這也意味著Google 之前拼起來的多模態，比如說做視頻的Veo，做圖像的Nano Banana，做音樂的Lyria，Gemini 負責理解和推理方向全在該模型上融合了， Google Gemini Omni 第一次有了模型同時具有理解世界和生成世界的能力。

這也給 Google 打開了一個商業化的新方向。過去 Google 在創作者市場一直是缺席的，Adobe 占著專業創作，CapCut 占著輕量創作，內容創作賽道一直競爭激烈。Google將Gemini Omni 的模型能力深度集成進了 Google Flow、YouTube Shorts 和 Workspace 里的 Pics 工具。這意味著 Google 終于有了能切進內容創作市場的有效抓手。

奇怪的是，Google 這次沒發 Gemini 4，甚至 Gemini 3.5 Pro 的介紹也就是寥寥幾句帶過。按行業節奏，Gemini 3 系列推了一年多，Gemini 4 應該是這次谷歌 I/O 最該發的旗艦模型。

對于產品的缺席，產業內一種猜測是前沿模型的發布節奏已經不是 Google 現在最在意的事了。比如說，這次發的所有產品，都不需要「Gemini 4 那種級別的模型」才能跑，Gemini 3.5 Flash 已經夠便宜、夠快，Gemini Omni 還補上了多模態的理解短板，因此此時端出 Gemini 4，除了參數的變化，意義并不大。

更可能的原因是，Google 現在最想做的事,不是再發一個讓人驚嘆的新模型，而是讓現有模型跑出更多產品來掙錢。讓前沿模型留在內部繼續訓，今年這個舞臺，Google 留給的不是技術，是商業生態。

智能體成為商業化鑰匙？

谷歌首推個人助理Gemini Spark

如果按「模型不再是主角」，那Google 這次把主角讓給了誰？答案顯然是智能體。

但智能體這個詞，過去一年被各家用得太濫了，OpenAI 在講、Anthropic 在講、Microsoft 也在講。每家說的都不太一樣，有的是瀏覽器里跑代碼的工具，有的是 API 里調用的函數，有的就是個「會自己點幾下鼠標的 Chat」，似乎沾一點執行都能叫做智能體。

關于智能體定義，其實Google 也并沒有給出比較明確的信息，只是推出了個人智能體助理Gemini Spark，把它放在場景里講清楚了一些。

「Gemini Spark 是你個人的一個 AI 代理體，幫助你游刃有余地度過你的數字化生活，每天代表你采取一些行動，當然一切聽你指揮。」這是谷歌給Gemini Spark的定義。

技術上，Gemini Spark 是基于 Gemini 3.5 + Antigravity 框架做底層技術支持。Antigravity 是 Google 在去年 11 月發的智能體開發平臺（IDE），內部團隊已經用它寫過代碼。這次 Antigravity 升級到 2.0，變成「agent first」，所有交互都圍繞智能體重新設計。

此外，Gemini Spark 還可以通過 MCP 協議接外部工具。本次谷歌宣布首批接的是 Canva、OpenTable、Instacart。這也就意味著，Gemini Spark 不只能在 Google 自己的產品里干活，它能調用第三方應用。

Josh Woodward 在臺上演示了幾個場景，讓 Spark 幫他給團隊寫一封關于產品發布的總結郵件、幫他規劃街區聚會、追蹤鄰居 RSVP、提醒孩子學校截止日期。這些場景看起來都不「驚艷」，但都有一個共同點，Spark 真的可以幫你做你本來就要做的事。本周 Gemini Spark 開始小范圍測試，下周向美國 Google AI Ultra 訂閱者開 Beta 測試版。

值得注意的是，把 Google 這次發布的所有公告串起來看，會發現 Spark 不是一個產品，Spark 是一個層。它出現在了 Google 幾乎所有重要的入口里。

具體說，Gemini Spark 這次明確落地的場景就有八個，發布會上用了大量演示直觀展現了它的能力：

首先是 Gemini App，本周向 Ultra 訂閱者開放；然后是 Chrome 瀏覽器，今年夏天升級成所謂的「agentic browser」，到時候 Gemini Spark 直接在你瀏覽的網頁上替你做事；

比如說，你想換一份新的家庭保險，你可以打開 Chrome 讓 Gemini Spark替你跑。它會自己打開幾家保險公司的官網，填好你的信息，把每家的報價、保障范圍、免賠額都匯總成一張表給你看,你只需要在最后一步確認要不要下單。整個過程你不用切換標簽頁,不用一家家比，甚至不用打開網頁。

接著是 Android Halo中的Gemini Spark，年底前推出，可以在手機狀態欄直接顯示 Gemini Spark 正在干什么；還有 macOS 桌面 App，今夏集成 Spark，可以操作你本地的文件；在 Google Workspace 這一檔，Gmail、Docs、Slides 等產品里都會嵌入 Gemini Spark，服務各種各樣的產品，不過會先在企業客戶里預覽。

此外，在 Google Search 里，Spark 以「信息智能體」的形式 24 小時在后臺替你監控信息；Universal Cart 智能購物車里，Gemini Spark結合 AP2 協議替你下單付款；最后是 Android XR 智能眼鏡，今年秋季首款音頻眼鏡上市，通過 Gemini Intelligence 還可以調用 Gemini Spark處理多步任務。

結合這八個首批落地的場景，你會發現 Gemini Spark不是一個「賣給用戶的產品」，Gemini Spark 更像一個「嵌進 Google 所有商業通路的能力」。每一個Gemini Spark 出現的地方，都對應著 Google 一條現有的或新的賺錢通路。這就是為什么 Google 這次沒有像 OpenAI 那樣，把智能體做成一個「超級 App」。

OpenAI 的智能體是入口型的，你打開 ChatGPT 才能用。Google 的智能體是渠道型的，它出現在你已經在用的所有 Google 產品里。搶場景、搶入口、搶用戶心智，可以看出這些都是商業化階段的典型動作。

打造AI智能體「支付一條龍」體系？

谷歌用三大協議完成閉環

如果說，Spark 是 Google 在搶「商業入口」，那此次發布會上重點新推出的 UCP、AP2 和 SynthID 等諸多新協議，則是 Google 在搶「商業規則」。畢竟，入口可以被競爭，規則一旦定型就是十年的事。

先說UCP。UCP 的全稱是 Universal Commerce Protocol，通用商務協議。這是 Google 今年早些時候推出的開源標準，目標是給 AI 智能體提供一個統一的電商語言，讓智能體在不同的電商平臺之間，可以用同一套協議研究商品、加購物車、下單結賬。

在智能體時代，人不再是電商的主要操作者，智能體才是。當 Gemini Spark 替你比價、替你下單，它需要一個能跟所有電商平臺對話的協議。這件事如果沒有標準，每家電商都會做自己的接口，智能體就會被鎖在某個平臺里。Google 做 UCP 的邏輯，跟當年做 Android 一樣，自己定標準，讓所有人跟著用。

UCP 的殺手锏不在技術，在于誰加入。這次 I/O 上，Vidhya Srinivasan 在臺上公布了 UCP 委員會的首批成員：Amazon、Meta、Microsoft、Salesforce、Stripe。UCP 的下一步，Google 已經畫好了，今年內拓展到加拿大、澳大利亞、英國，然后拓展到酒店預訂、本地外賣等新垂直，然后進 YouTube。這是典型的「先卡位、再擴面」打法，谷歌顯然已經做好準備。

再說AP2。AP2 的全稱是 Agent Payments Protocol，智能體支付協議。如果 UCP 是 AI 電商時代的 HTTP，那 AP2 就是 AI 電商時代的 Visa。

但 AP2 解決的是一個具體問題，當智能體替你花錢，怎么保證它花的是你想花的錢。具體說，AP2 讓你能給智能體設定支付邊界，比如「在 Sephora 買東西不超過 200 美元」，同時通過加密的「數字授權書」建立一條可追溯的鏈條，把你、商家、支付處理方三者之間的關系綁定起來，所有交易都有可驗證的電子憑證。

聽起來很技術，但商業視角很直接。Google 想做智能體時代的支付層。這跟 Google Pay 是不一樣的，Google Pay 是面向人的錢包，AP2 是面向 AI 的錢包。這兩層接下來會同時存在，而且 AP2 的體量大概率會比 Google Pay 大，因為在谷歌的設想里，未來每一筆由智能體發起的交易，理論上都要走 AP2 的協議。也因此，谷歌開始提前準備好工具。

目前，AP2 這次 I/O 大會還沒正式發布，但 Google 明確說了，接下來幾個月里會先在 Gemini Spark 里集成，意思是，到時候，Gemini Spark 替你買東西的時，后臺就是 AP2 發揮作用。

再說MCP。MCP 這件事最有意思，因為 MCP 不是 Google 提出來的，是 Anthropic 在 2024 年 11 月開源的。MCP 全稱 Model Context Protocol，是一個讓大模型能調用外部工具的標準化接口。Google 這次明確說，Gemini Spark 通過 MCP 接外部工具，首批合作伙伴是 Canva、OpenTable、Instacart。

MCP 解決的是「AI 怎么用工具」，UCP 解決的是「AI 怎么買東西」，AP2 解決的是「AI 怎么付錢」。三層加起來，才是完整的智能體商業基礎設施。

最后說SynthID。SynthID 是 Google DeepMind 三年前推出的內容水印技術，可以在 AI 生成的圖像、視頻、音頻里嵌入肉眼看不見的數字水印。截至這次 I/O，SynthID 已經給超過 1000 億張圖片和視頻、6 萬年的音頻做過水印。

這次 Google I/O 大會上，Sundar 宣布了幾個新合作伙伴：OpenAI、Kakao、ElevenLabs 都加入 SynthID。當 AI 生成的內容越來越多，如果沒有統一的水印標準，深度偽造、版權糾紛、監管合規都會變成所有 AI 公司共同的麻煩。

SynthID 看起來是技術合作，但它的商業含義不小。一旦 SynthID 成為 AI 內容水印的事實標準，Google 就拿到了 AI 時代「內容可信度基礎設施」的話語權。監管要管 AI 生成內容；媒體要驗證 AI 內容，企業要做內容合規，Google 都是第一接口。這種話語權，會通過 Google Cloud 的 AI Content Detection API 直接變成企業付費業務。

把這四個協議放在一起看，可以是看到 Google 這次在協議層做的事情非常清楚，UCP 卡電商協議，AP2 卡支付協議，MCP 跟著行業共識走但通過自己的應用層滲透，SynthID 卡內容溯源。如果這四個協議都成事實標準，Google 在 AI 電商時代的地位，大約等于 Visa + Shopify + Google Pay 的合體，再加上一個內容檢測中樞。如果生態一旦形成，則是谷歌的 AI 商業化生態里重要的一步拼圖。

比起拼參數，智能體時代拼的是場景理解

把這場 Google I/O 從頭到尾看下來，我們發現 Google 這次幾乎所有的產品演示，都不是在演示「能力」，而是在演示不同場景下該如何使用智能體。

比如說，我有兩只狗叫 Hank 和 Luisa，周四要送狗舍，需要帶疫苗記錄，AI智能體能夠如何幫我；我在組裝第一臺定制 PC，主板和 CPU 插槽不匹配；我要規劃周末家庭活動，要兼顧兩個孩子的愛好；我是個高中生，要做一場職業日演講；我有一筆 1099 收入，要報稅；我要給街區辦一場聚會，要追蹤每家的 RSVP，AI智能體能夠如何幫我……這種密度的「具體場景演示」在科技發布會里比較罕見。

這背后是 Google 想清楚的一件事。演示模型能力的時代，卷的是 benchmark；演示智能體場景的時代，卷的是滲透密度。前者比的是模型多強，后者比的是這個產品在你日常生活的多少角落里能派上用場。

Google 這次的選擇本身就是個信號，它認為 AI 行業的競爭維度，已經從「誰能做到這件事」切換到了「誰能讓用戶真的用起來」。所有這些，本質都在回答一個問題：怎么讓 AI 真正長進 10 億用戶的日常。

而這個時候，留給創業者猶豫的時間則不多了，模型層的窗口正在快速關閉。Google 都把 Gemini 3.5 Flash 把前沿能力下放到中端價格，這意味著「做一個比別人更強的模型」已經不是模型創業的主方向了，前沿模型這條賽道，留給創業者的空間會越來越小。

在智能體領域，一些通用場景入口也被巨頭看上了，通用智能體在常見通用的賽道留給創業者的空間，可能比想象更少。同時，協議層的窗口可能已經接近關閉。如果谷歌的協議推進順利，UCP、AP2、SynthID 加上 MCP，一旦定型，就是未來十年的事。創業者很難再在通用協議上分到一杯羹。

巨頭的優勢從來不是「做得更好」，是「做得更全、做得更廣、做得更便宜」組合拳。跑不過它的不是因為做得不夠好，而是因為創企沒趕在它出手前卡好位，找好商業化的價值和壁壘。

畢竟，創新探索新大陸的可能是小公司，但能把大部分人擺渡到新大陸的，大概率還是巨頭。

*頭圖來源：視覺中國

本文為極客公園原創文章，轉載請聯系極客君微信 geekparkGO

極客一問

你如何看待谷歌此次I/O大會？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.