網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌AI全家桶深夜爆更：Gemini 3.5新王登場(chǎng)，數(shù)十億人搜索變天，AI眼鏡終于來(lái)了

2026-05-20 07:44:31　來(lái)源: 智東西

北京舉報(bào)

分享至

智東西
作者程茜陳佳
編輯云鵬

智東西5月20日?qǐng)?bào)道，今日凌晨，在一年一度的谷歌I/O開(kāi)發(fā)者大會(huì)上，谷歌接連甩出2款新模型、谷歌搜索25年最大升級(jí)、Claude Code谷歌版開(kāi)發(fā)平臺(tái)Antigravity 2.0、AI眼鏡等多個(gè)大招！

谷歌CEO桑達(dá)爾·皮查伊（Sundar Pichai）稱(chēng)，這次谷歌I/O大會(huì)的新發(fā)布，意味著其已正式邁入智能體驅(qū)動(dòng)的Gemini時(shí)代。皮查伊一開(kāi)場(chǎng)就放出了自己形象生成的AI視頻，暗戳戳秀了一波自家AI能力。

1、新發(fā)2款大模型：可基于任意輸入形式、生成各類(lèi)模態(tài)輸出內(nèi)容的全能模型Gemini Omini，其首款模型Gemini Omni Flash將率先支持視頻輸出；谷歌最新、最強(qiáng)旗艦?zāi)Ｐ?strong>Gemini 3.5 Flash亮相，每秒輸出token數(shù)是OpenAI、Anthropic模型的4倍。

2、開(kāi)發(fā)平臺(tái)Google Antigravity升級(jí)：谷歌基于Gemini 3.5 Flash升級(jí)了Google Antigravity、Gemini App上的全天候個(gè)人智能體Gemini Spark、谷歌搜索，其宣布此次是谷歌搜索25年來(lái)最大更新。

3、谷歌官宣AI眼鏡新進(jìn)展：聯(lián)合三星展示了由眼鏡品牌Gentle Monster和Warby Parker共同設(shè)計(jì)的兩款新眼鏡。谷歌純音頻AI眼鏡將在今年晚些時(shí)候率先推出，帶顯示屏的版本將在明年推出。

4、其他大招：Gemini App中的日?qǐng)?bào)智能體Daily Brief、購(gòu)物中心智能體Universal Cart、 AI圖像創(chuàng)建和編輯工具Google Pics、Google Flow智能體等。

發(fā)布會(huì)開(kāi)場(chǎng)，皮查伊官宣了幾組數(shù)據(jù)：一年時(shí)間，谷歌旗下各類(lèi)業(yè)務(wù)平臺(tái)每月處理token暴漲7倍，突破3200萬(wàn)億token。目前每月有超過(guò)850萬(wàn)開(kāi)發(fā)者利用谷歌的模型開(kāi)發(fā)新應(yīng)用和新體驗(yàn)，模型API目前每分鐘處理大約190億token，過(guò)去12個(gè)月有超過(guò)375名谷歌云客戶(hù)各自處理了超過(guò)一萬(wàn)億token。

產(chǎn)品的用戶(hù)量方面，如今谷歌有13款產(chǎn)品的用戶(hù)超過(guò)10億，其中5款用戶(hù)超過(guò)30億；AI Overviews現(xiàn)在擁有超過(guò)25億月活躍用戶(hù)，僅一年時(shí)間，谷歌搜索AI Mode的月活躍用戶(hù)就已突破10億；Gemini應(yīng)用的月活躍用戶(hù)已突破9億，每日請(qǐng)求增長(zhǎng)了七倍以上；Nano Banana圖像生成模型已生成超過(guò)500億張圖像。

在資本支出上，谷歌今年的資本支出將達(dá)到2022年的約6倍，約為1800億至1900億美元（約合人民幣1.2萬(wàn)億至1.3萬(wàn)億元），這項(xiàng)投資的關(guān)鍵部分就是谷歌TPU。谷歌還特地為T(mén)PU制作了動(dòng)畫(huà)短片。

本屆谷歌I/O大會(huì)依舊信息量爆棚，智東西帶你一文看盡。

一、全能模型Omni亮相，自然語(yǔ)言對(duì)話(huà)就能改視頻

谷歌推出全新模型系列Gemini Omni，可依托任意輸入內(nèi)容生成各類(lèi)內(nèi)容，目前其率先支持視頻輸出，未來(lái)會(huì)支持圖像、文本輸出。

谷歌Omni家族的首款模型是Gemini Omni Flash，用戶(hù)可以在Gemini應(yīng)用、Google Flow和YouTube Shorts上試用。谷歌將在未來(lái)幾周通過(guò)API向開(kāi)發(fā)者和企業(yè)客戶(hù)推廣。

首先用戶(hù)可以通過(guò)對(duì)話(huà)進(jìn)行視頻剪輯，例如重塑視頻中的環(huán)境，通過(guò)微調(diào)細(xì)節(jié)或者以現(xiàn)有視頻為藍(lán)本，打造出用氣泡做雕塑等現(xiàn)實(shí)情況無(wú)法實(shí)現(xiàn)的視頻內(nèi)容。

Omini還能對(duì)視頻中的動(dòng)作、物品進(jìn)行修改。谷歌DeepMind CEO戴密斯·哈薩比斯（Demis Hassabis）在現(xiàn)場(chǎng)演示了Omini的效果，其修改提示詞為：全程保留原視頻所有畫(huà)面與敘事，僅在4.3秒男子手指觸碰鏡面的瞬間觸發(fā)特效：鏡面以指尖為圓心，泛起液態(tài)水波紋般的漣漪；房間整體環(huán)境瞬間暗化；海量可自主變形、具備照片級(jí)真實(shí)質(zhì)感的多幾何造型3D棱鏡，同時(shí)布滿(mǎn)整個(gè)房間空間。

其次，Omni還能結(jié)合世界知識(shí)推演視頻的后續(xù)情節(jié)走向，例如其能理解重力、流體力學(xué)等物理概念，創(chuàng)造出彈珠快速滾動(dòng)的流暢鏡頭。

此外，其還能通過(guò)簡(jiǎn)短的提示，生成更為復(fù)雜的內(nèi)容，例如用黏土動(dòng)畫(huà)解說(shuō)蛋白質(zhì)折疊的概念。

最后，其能將用戶(hù)輸入的圖像、文本、視頻、音頻等任意參考內(nèi)容，生成一個(gè)統(tǒng)一的視頻。不過(guò)目前其只支持語(yǔ)音類(lèi)參考素材，后續(xù)很快會(huì)上線(xiàn)其他類(lèi)型音頻輸入能力。例如當(dāng)用戶(hù)上傳角色、場(chǎng)景、音頻素材，Omini就會(huì)生成對(duì)應(yīng)的視頻效果。

二、Gemini 3.5系列來(lái)了，F(xiàn)lash版性能拉滿(mǎn)，Pro下月發(fā)

谷歌還推出了Gemini 3.5系列首款模型Gemini 3.5 Flash，擅長(zhǎng)復(fù)雜且具備實(shí)際實(shí)用價(jià)值的長(zhǎng)期任務(wù)。皮查伊透露，他們內(nèi)部顯示Gemini 3.5 Pro的體驗(yàn)效果很好，下個(gè)月會(huì)發(fā)布。

Arena AI的評(píng)測(cè)結(jié)果顯示，Gemini 3.5 Flash在性能、速度、成本等方面已經(jīng)全面超越Gemini 3 Flash和Gemini 3.1 Pro。

目前，Gemini 3.5 Flash已經(jīng)在Gemini App、谷歌搜索的AI Mode中集成。

從基準(zhǔn)測(cè)試來(lái)看，Gemini 3.5 Flash在多個(gè)維度上可提供媲美旗艦?zāi)Ｐ偷男阅埽赥erminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和 MCP Atlas（83.6%）等具有挑戰(zhàn)性的編碼和代理基準(zhǔn)測(cè)試上，表現(xiàn)優(yōu)于Gemini 3.1 Pro，并在多模態(tài)理解方面領(lǐng)先。在每秒輸出token數(shù)方面，是其他前沿模型的4倍。

谷歌一直在使用Gemini 3.5 Flash，配合開(kāi)發(fā)平臺(tái)Antigravity的模型，皮查伊將這一新模型稱(chēng)作谷歌內(nèi)部游戲規(guī)則的改變，這大大加快了我們的構(gòu)建速度。

▲Gemini 3.5 Flash結(jié)合Antigravity可以根據(jù)動(dòng)態(tài)標(biāo)準(zhǔn)自動(dòng)重命名文件和分類(lèi)

他舉例稱(chēng)，如果公司能混合使用Gemini 3.5 Flash和其他前沿模型，可以節(jié)省大量資金，公司每天處理約1萬(wàn)億token，如果他們將80%的工作負(fù)載從其他前沿模型轉(zhuǎn)移到3.5 Flash上，每年將節(jié)省超過(guò)10億美元。

具體功能上，Gemini 3.5 Flash能快速規(guī)劃、構(gòu)建和迭代，幫用戶(hù)完成開(kāi)發(fā)新應(yīng)用、維護(hù)代碼庫(kù)、協(xié)助準(zhǔn)備財(cái)務(wù)文件等任務(wù)。

三、2款A(yù)I眼鏡上新，不掏手機(jī)就能發(fā)短信、聽(tīng)導(dǎo)航、拍照

谷歌AI眼鏡全新升級(jí)，其發(fā)布了聯(lián)合眼鏡品牌Gentle Monster和Warby Parker的2款新AI眼鏡，還增加了獲取導(dǎo)航、發(fā)送短信、拍照等功能，且全程無(wú)需用戶(hù)掏出手機(jī)。

AI眼鏡軟件方面的更新包括：

詢(xún)問(wèn)看到的內(nèi)容：用戶(hù)佩戴谷歌AI眼鏡時(shí)，可以詢(xún)問(wèn)Gemini眼前看到的景象，如查找路過(guò)餐廳的評(píng)價(jià)、快速解讀交通標(biāo)識(shí)等。

導(dǎo)航：AI眼鏡會(huì)知道用戶(hù)站在哪里、面向哪個(gè)方向，然后給出自然的、更符合當(dāng)下情況的導(dǎo)航路線(xiàn)。Gemini還能根據(jù)用戶(hù)的喜好添加停靠點(diǎn)或附近餐廳。

免提通話(huà)：用戶(hù)無(wú)需觸碰手機(jī)，就能接聽(tīng)管理通話(huà)、發(fā)送消息，還可讓Gemini匯總未讀信息，也能點(diǎn)播貼合當(dāng)下氛圍的音樂(lè)。

拍照修圖：用戶(hù)只需一句語(yǔ)音指令，即可完成拍攝，還能借助Nano Banana模型剔除畫(huà)面多余雜物，或是進(jìn)行快速修圖。

翻譯：AI眼鏡支持實(shí)時(shí)語(yǔ)音翻譯，并且發(fā)音語(yǔ)氣、音調(diào)都貼合說(shuō)話(huà)人原聲，也可直接識(shí)別菜單、標(biāo)牌上的文字，一鍵收聽(tīng)譯文讀音。

智能代辦：Gemini可在后臺(tái)自動(dòng)處理多步驟任務(wù)，無(wú)需掏出手機(jī)，它就能幫你在外賣(mài)平臺(tái)下單咖啡，用戶(hù)只需最后確認(rèn)訂單即可。

與手機(jī)應(yīng)用靈動(dòng)：用戶(hù)可以?xún)H憑語(yǔ)音操作手機(jī)軟件，例如呼叫Uber、學(xué)習(xí)外語(yǔ)等，并且這款A(yù)I眼鏡同時(shí)適配安卓與蘋(píng)果手機(jī)。

四、全新AI搜索框上線(xiàn)，自動(dòng)幫你梳理提問(wèn)思路

谷歌搜索迎來(lái)了25年來(lái)最大升級(jí)，其推出了全新的智能AI搜索框。今日，其宣布將Gemini 3.5 Flash作為谷歌搜索AI Mode的默認(rèn)模型。

谷歌搜索更新重點(diǎn)在于搜索框，據(jù)谷歌介紹，其能依托AI智能提示幫用戶(hù)梳理提問(wèn)思路，功能遠(yuǎn)超普通自動(dòng)補(bǔ)全，還支持多模態(tài)搜索，用戶(hù)可將文字、圖片、文件、視頻乃至瀏覽器標(biāo)簽頁(yè)作為檢索輸入。

此外，用戶(hù)還能在谷歌搜索中創(chuàng)建和管理多個(gè)AI智能體來(lái)完成任務(wù)。信息智能體會(huì)隨時(shí)瀏覽網(wǎng)絡(luò)上的一切，如博客、新聞網(wǎng)站和帖子以及實(shí)時(shí)的金融、購(gòu)物和體育信息，以監(jiān)控與用戶(hù)具體問(wèn)題相關(guān)的變化。

例如用戶(hù)在找公寓，智能體會(huì)根據(jù)用戶(hù)的所有具體需求持續(xù)掃描，并在房源符合用戶(hù)需求時(shí)通知用戶(hù)；或者如果用戶(hù)想知道喜歡的職業(yè)運(yùn)動(dòng)員什么時(shí)候宣布推出球鞋合作，智能體會(huì)實(shí)時(shí)瀏覽互聯(lián)網(wǎng)的消息并即使通知。信息智能體將于今年夏天率先為Google AI Pro和Ultra訂閱用戶(hù)上線(xiàn)。

此外，谷歌還在擴(kuò)展谷歌搜索的智能體預(yù)定功能，如用戶(hù)給出周五晚上找到一個(gè)六人私人卡拉OK房間，且晚點(diǎn)供應(yīng)食物的具體需求，智能體就會(huì)匯總最新價(jià)格和可用性，并附帶鏈接，讓用戶(hù)進(jìn)行選擇。

谷歌搜索還能基于Antigravity定制化應(yīng)用。其可以根據(jù)用戶(hù)的具體問(wèn)題實(shí)時(shí)構(gòu)建定制的可視化工具和模擬，在底層理解用戶(hù)查詢(xún)內(nèi)容設(shè)計(jì)布局，決定構(gòu)建哪些自定義組件，然后部署代碼生成交互式視覺(jué)效果。

可以看出，從搜索智能體到編程，谷歌正在通過(guò)智能體徹底改變用戶(hù)使用搜索的習(xí)慣。

五、Gemini里有了全天在線(xiàn)的個(gè)人智能體，訂閱計(jì)劃新增100美元月費(fèi)

智能體驅(qū)動(dòng)的開(kāi)發(fā)平臺(tái)Antigravity升級(jí)，以管理和部署能夠跨關(guān)鍵開(kāi)發(fā)界面集成的智能體。

其推出了獨(dú)立桌面應(yīng)用Antigravity 2.0，該應(yīng)用能作為智能體交互的中心平臺(tái)，允許開(kāi)發(fā)者協(xié)調(diào)多個(gè)智能體并行執(zhí)行任務(wù)，它還具備動(dòng)態(tài)子智能體支持并行工作流程、后臺(tái)自動(dòng)化的定時(shí)任務(wù)以及跨 Google AI Studio、Android和Firebase的生態(tài)系統(tǒng)集成。

與此同時(shí)，Antigravity能幫助開(kāi)發(fā)者從0開(kāi)始構(gòu)建一個(gè)可用的操作系統(tǒng)，其谷歌IO大會(huì)提到，花了12小時(shí)，93名智能體并行工作，處理了15000多次模型請(qǐng)求，處理了2.6btokens，API credits消耗不到1000美元。從內(nèi)核到進(jìn)程和內(nèi)存管理系統(tǒng)，antigravity編寫(xiě)了每一行代碼。

與此同時(shí)，谷歌還更新了訂閱計(jì)劃，其推出100美元/月的AI Ultra計(jì)劃，Google Antigravity的使用限額是Google AI Pro計(jì)劃的5倍。限時(shí)內(nèi)，其為新舊Google AI Ultra訂閱者提供100美元的 Antigravity獎(jiǎng)勵(lì)積分，若達(dá)到計(jì)劃配額上限即可生效。用戶(hù)只需在Antigravity應(yīng)用中領(lǐng)取優(yōu)惠，該優(yōu)惠將于2026年5月25日到期。

谷歌還為其Gemini App推出新個(gè)人AI智能體Gemini Spark。該智能體基于Gemini 3.5 Flash，采用Antigravity調(diào)度架構(gòu)，即使用戶(hù)關(guān)閉筆記本電腦也能在后臺(tái)持續(xù)運(yùn)行。谷歌今天開(kāi)始向可信賴(lài)的測(cè)試用戶(hù)推廣Gemini Spark，計(jì)劃下周將Beta版推送到美國(guó)的Google AI Ultra訂閱用戶(hù)中。

基于Gemini Spark，用戶(hù)可以設(shè)置定期任務(wù)，如自動(dòng)解析每月信用卡賬單；引導(dǎo)該智能體查看收件箱獲取孩子學(xué)校的最新動(dòng)態(tài)，并將綜合每日摘要發(fā)送給用戶(hù)等；還能綜合郵件和聊天的原始會(huì)議記錄，制作文檔、起草郵件。

此外，在安卓設(shè)備上，用戶(hù)可以通過(guò)一個(gè)名為Android Halo的新界面空間，查看像Spark這樣的智能體的實(shí)時(shí)更新和任務(wù)進(jìn)度，該界面將于今年晚些時(shí)候推出。

此外，谷歌正在更新macOS的Gemini App。今年夏天，其計(jì)劃將Gemini Spark帶到Gemini桌面App中，以幫助用戶(hù)處理涉及本地文件的任務(wù)并自動(dòng)化桌面上的工作流程。

其還將為macOS的應(yīng)用增加語(yǔ)音功能，根據(jù)用戶(hù)屏幕上的上下文，Gemini可以將用戶(hù)語(yǔ)音轉(zhuǎn)化為草稿，或捕捉光標(biāo)所在位置。

六、多個(gè)全新智能體亮相，還支持語(yǔ)音直出文檔

谷歌還推出了多個(gè)AI升級(jí)。

Gemini App中上線(xiàn)了開(kāi)箱即用的智能體Daily Brief，為用戶(hù)提供個(gè)性化摘要，并綜合收件箱、日歷和任務(wù)中的信息找出重要事項(xiàng)，其還可以幫用戶(hù)進(jìn)行優(yōu)先排序、組織并建議下一步。

Google Flow面向全體用戶(hù)推出全新智能體，新智能體可結(jié)合用戶(hù)指令規(guī)劃并邏輯拆解各類(lèi)復(fù)雜任務(wù)。用戶(hù)能直接在Flow里編寫(xiě)創(chuàng)意工具代碼，比如視頻特效設(shè)計(jì)、手繪動(dòng)畫(huà)制作、文字分層排版等實(shí)用工具。

谷歌依托最新Nano Banana模型打造了全新AI圖像創(chuàng)作編輯工具谷歌Pics。無(wú)論從零空白創(chuàng)作設(shè)計(jì)，還是編輯現(xiàn)成照片，Pics都會(huì)將畫(huà)面里每一處元素視作獨(dú)立對(duì)象，而非扁平化靜態(tài)圖片。用戶(hù)可以進(jìn)行創(chuàng)作、替換、精修局部細(xì)節(jié)。目前該工具已面向內(nèi)測(cè)用戶(hù)開(kāi)放，今年夏季晚些時(shí)候，將逐步面向谷歌辦公套件內(nèi)的AI專(zhuān)業(yè)版及旗艦版訂閱用戶(hù)上線(xiàn)。

谷歌推出全新的購(gòu)物中心Universe Cart，當(dāng)用戶(hù)將商品添加進(jìn)去，購(gòu)物車(chē)就會(huì)自動(dòng)開(kāi)始工作，自動(dòng)幫你比價(jià)、找優(yōu)惠，還會(huì)提醒到貨。

還有一項(xiàng)功能是Docs Live，其可以幫助用戶(hù)用聲音直接創(chuàng)建并編輯新文檔，全部用你的語(yǔ)音。Docs Live將于今年夏天向訂閱者推出，語(yǔ)音功能也將加入Gmail和Keep版本。

谷歌深度偽造識(shí)別工具SynthID水印增加了跨產(chǎn)品內(nèi)容憑證驗(yàn)證功能，這將顯示內(nèi)容的來(lái)源是AI還是攝像頭，以及是否經(jīng)過(guò)生成式AI工具編輯，其已經(jīng)將內(nèi)容憑證和SynthID驗(yàn)證擴(kuò)展到谷歌搜索和瀏覽器中。英偉達(dá)、OpenAI、Eleven Labs將采用SynthID功能。

在科學(xué)研究方面，Gemini for Science匯集了Gemini、Deep Think和Deep Research多種AI工具，助力加速科學(xué)研究，將像Google Antigravity這樣的平臺(tái)與30多個(gè)主要生命科學(xué)數(shù)據(jù)庫(kù)和工具進(jìn)行了連接。

結(jié)語(yǔ)：算力、模型到終端通吃，谷歌AI生態(tài)全面爆發(fā)

過(guò)去一年，谷歌母公司Alphabet的股價(jià)上漲了140%，云業(yè)務(wù)增長(zhǎng)速度甚至超過(guò)亞馬遜和微軟，華爾街也將Alphabet視為少數(shù)能夠從生成式AI繁榮的每一層利潤(rùn)中都獲利的公司之一。

Plexo Capital創(chuàng)始管理合伙人、Anthropic早期投資者Lo Toney曾在接受外媒采訪(fǎng)時(shí)提到，“谷歌可能是最適合大規(guī)模變現(xiàn)AI的公司，因?yàn)樗鼛缀跽瓶亓苏麄€(gè)技術(shù)棧的每一層。”

此番谷歌I/O大會(huì)從Gemini 3.5、Gemini Omni系列全新模型迭代升級(jí)，到Gemini Spark智能體、AI智能搜索，再到AI眼鏡等端側(cè)硬件的密集新品發(fā)布證明，谷歌完成了從底層TPU算力基建、前沿大模型到搜索服務(wù)、移動(dòng)終端全場(chǎng)景應(yīng)用的全線(xiàn)貫通，將其自上而下的垂直整合優(yōu)勢(shì)展現(xiàn)得淋漓盡致。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.