![]()
在品嘗過「會(huì)前甜點(diǎn)」Android Show 之后,真正的重頭戲谷歌開發(fā)者大會(huì) Google I/O 2026 正式揭開了帷幕。
不出所料,在時(shí)長接近兩個(gè)小時(shí)的活動(dòng)中,Gemini 占據(jù)了絕對的 C 位。
![]()
圖|Google
除了更新基礎(chǔ)模型和周邊能力之外,Gemini 也更加深入的集成到了谷歌 app 全家桶里面,甚至還給 iOS 和 macOS 帶來了一些更新。
比較可惜的是,上周亮相的 Googlebook 和 Android 17,在本次 I/O 開場活動(dòng)上都沒有被提及。
我們唯一看到的硬件產(chǎn)品,是與三星聯(lián)合開發(fā)的智能眼鏡:
![]()
圖|Google
總之,谷歌借助本次 I/O 大會(huì)傳達(dá)的信息已經(jīng)很明確了:
Gemini 的能力將會(huì)越來越強(qiáng)、存在感將會(huì)越來越高,與全球十幾億谷歌產(chǎn)品用戶的「物理生活」的集成也會(huì)越來越緊密。
從夸張的角度想—— Gemini 距離接管大部分人的日常工作,似乎就只差一個(gè)人形機(jī)器人了。
底層模型更新
整場活動(dòng)里最重磅的,就是圍繞著 Gemini 的幾款底層模型的更新了。
首先是正式的 Gemini 3.5 版本發(fā)布,用戶最先可以體驗(yàn)到的版本則是 Gemini 3.5 Flash。
它在多個(gè)維度上展現(xiàn)出媲美之前 2.5 Pro 的能力,并且保持了 Flash 系列的速度:
圖|Google
得益于速度和性能的平衡,Gemini 3.5 Flash 最擅長的場景之一就是處理長期、大規(guī)模的智能任務(wù),同時(shí)還能省下大量 token 開銷。
同時(shí),最新的 Antigravity 集成也讓 Gemini 3.5 Flash 擁有了更豐富的輸出形式——
執(zhí)行分類代碼、根據(jù)論文編寫游戲、轉(zhuǎn)換上古代碼庫、構(gòu)建 3D 場景、交互式 Web 界面等等。
![]()
將遺留代碼庫轉(zhuǎn)換成 Next.js|Google
此外還有規(guī)模最大的「世界模型」Gemini Omni,用谷歌的宏愿來描述 Gemini Omni 則是:
它可以根據(jù)任何輸入內(nèi)容,輸出任何你想要的東西(Generate any output with any input)。
Omni 的首款模型產(chǎn)品則是 Gemini Omni Flash,除了 Gemini app,它也集成到了 Google Flow 和 YouTube Shorts 里面,支持用戶使用自然語言生成「最像真的」的視頻。
![]()
圖|Google
相對應(yīng)的,谷歌也調(diào)整了自己的 Google One 訂閱模式,在原本最高等級的 AI Ultra 方案里新增了一個(gè) 100 美元/月的分類。
這個(gè)新的訂閱同屬于 AI Ultra 級別,包含 Gemini 3.5 Flash、Antigravity 2.0 和其他新功能的優(yōu)先訪問權(quán)等等。
當(dāng)然,傳統(tǒng)的 20TB 云空間和 YouTube Premium 權(quán)限也同樣包含,主要面向開發(fā)者和高級創(chuàng)作者之類的群體。
![]()
圖|Google
同時(shí),原本 250 美元的最高等級 AI Ultra 訂閱則迎來了降價(jià),現(xiàn)在只需要 200 美元/月就能享受到包括最高 20 倍于 AI Pro 的使用額等等特權(quán)。
另一個(gè)重大的收費(fèi)模式變革則是 Gemini app 本身。
![]()
圖|Google I/O
在新聞稿里,谷歌宣布將 Gemini 的每日限額從「提示詞額度」改成了「使用量計(jì)算」。
這樣算下來,圖片、視頻和代碼的消耗變多、文本任務(wù)消耗量則變少,整體是一種更靈活的算力計(jì)費(fèi)模式。
實(shí)際業(yè)務(wù)落地
與 OpenAI、Anthropic 之類的公司不同,谷歌最大的特點(diǎn)在于,它真的有一套能夠直達(dá)全球十幾億用戶的產(chǎn)品生態(tài)。
在上述基礎(chǔ)模型之外,谷歌本次展示的策略,重點(diǎn)是將這些「抽象」的 AI 模型能力,整合進(jìn)普羅大眾每天都在使用的 app 里面。
![]()
圖|SlashGear
而這種整合大體上分成三步:傳統(tǒng)搜索業(yè)務(wù)變革、手機(jī)系統(tǒng)智能化、視覺智能融合。
「搜索引擎」作為谷歌的起家業(yè)務(wù),在今年的 I/O 上迎來了一次徹頭徹尾的 AI 改造,谷歌稱之為「AI 搜索的新時(shí)代」。
這種業(yè)務(wù)轉(zhuǎn)變背后的邏輯很簡單:相比 20 年前,人們只在搜索框里輸入單詞或短語,現(xiàn)在的人更習(xí)慣在里面輸入復(fù)雜的復(fù)合指令。
![]()
圖|Google
換言之:谷歌把傳統(tǒng)的搜索框(search box)變成了一個(gè)通用對話框(chatbox)。
除了搜索,用戶可以在里面要求任何形式的內(nèi)容。
這剛好也是本次 I/O 活動(dòng)的重點(diǎn)更新內(nèi)容——具有智能體能力的搜索。
首先,AI Mode 的基礎(chǔ)模型會(huì)升級到 Gemini 3.5,你的搜索框會(huì)自動(dòng)推薦和補(bǔ)全輸入的內(nèi)容,讓你的關(guān)鍵詞變得更詳細(xì)或者更廣泛。
![]()
圖|Google
此外還有全新的生成式 UI(Generative UI)回答,谷歌會(huì)根據(jù)你詢問的東西智能生成最合適的回答形式。
比如搜索股票走勢,回答里不僅有文本,還會(huì)生成折線圖;問裝修靈感,回答里就生成圖片……
甚至你搜索物理問題,它還能調(diào)用 Antigravity 快速編寫一個(gè)互動(dòng)式的 Web 演示:
![]()
圖|Google
使用了這么多年的「多模態(tài)搜索」之后,我們終于進(jìn)入了「多模態(tài)回答」的時(shí)代。
谷歌搜索結(jié)合 Antigravity 的能力不止于此,它還可以更進(jìn)一步,根據(jù)你在搜索框里輸入的內(nèi)容實(shí)時(shí)生成 Web 形式的儀表盤或追蹤器。
用人話來說,就是谷歌搜索框?yàn)槟愕男枨笾苯泳帉懥艘粋€(gè)專門的 app。
這種多模態(tài)能力是非常恐怖的,甚至有可能徹底改變?nèi)藗儥z索信息的方式——
畢竟我們搜東西,大多是為了將搜索結(jié)果用在別的任務(wù)里面,而新的谷歌搜索可以直接幫你做完下一步操作。
![]()
圖|Google
至于這種「代辦」的具體方式,則是 Gemini Spark。
簡單來說,Gemini Spark 本質(zhì)上是類似 OpenClaw 的「語義理解-自動(dòng)執(zhí)行」功能,一個(gè)谷歌 Claw。
其中 Gemini Spark 基于最新的 Gemini 3.5 模型,支持 7 天 24 小時(shí)不間斷運(yùn)行。
并且由于運(yùn)行載體是 Google Cloud,還可以執(zhí)行跨端代理操作——在手機(jī)上布置任務(wù),在電腦上查收結(jié)果。
![]()
圖|Google
Gemini Spark 目前支持所有谷歌套件 app,后續(xù)則會(huì)拓展 MCP 平臺以兼容第三方 app 的內(nèi)部功能,同時(shí)支持用戶自己上傳 Skill。
谷歌還宣布 Gemini Spark 后續(xù)會(huì)集成到 Chrome 和 Android Halo 中,為瀏覽器和手機(jī)帶來智能體自動(dòng)操作的功能。
![]()
Android Halo|Google
最后一步棋,則是 Gemini 與視覺智能的融合。
在本次 I/O 活動(dòng)上,谷歌發(fā)布了首個(gè)與三星聯(lián)合開發(fā)的「純音頻智能眼鏡」產(chǎn)品,分別使用 Gentle Monster 和 Warby Parker 鏡架:
![]()
圖|Google
單純從功能上講,這個(gè)純音頻眼鏡與市面上已經(jīng)有的智能眼鏡相差不大,主要優(yōu)勢是可以直接調(diào)用 Gemini 的多模態(tài)功能,用來調(diào)用前面提到的其他復(fù)雜能力。
另一方面,XREAL 與谷歌合作的那款帶屏幕的智能眼鏡 Project Aura 在本次活動(dòng)上又有了更新。
根據(jù)介紹,Project Aura 搭載了 XREAL 自研的 X1S 空間計(jì)算芯片,并為了佩戴舒適采用了分體式的設(shè)計(jì)。
也就是說,Project Aura 的眼鏡部分只負(fù)責(zé)顯示,真正的處理芯片、電池包和觸控板需要通過數(shù)據(jù)線連接到一個(gè)外置的隨身單元上:
![]()
圖|TheVerge
至于實(shí)際的生活功能方面,Project Aura 將會(huì)支持 Google Maps 沉浸式導(dǎo)航、巨幕/窗口化視頻播放、YouTube VR 視頻、WebXR 三維繪畫、DP 拓展筆記本屏幕等等用法。
![]()
圖|TECHEBLOG
總體來說,Android XR 是一套完全基于空間計(jì)算的視覺化的操作系統(tǒng),與 Gemini 的能力搭配起來,為我們畫出了一套未來智能眼鏡的線路圖。
更重要的是,雖然現(xiàn)在 Android XR 和 Android 17 是兩個(gè)完全獨(dú)立的系統(tǒng),但就像 Android 和 ChromeOS 融合那樣,它們未來大概率也會(huì)合二為一、變成一個(gè)「視覺智能系統(tǒng)」類似物。
Gemini 能接管一切嗎
熬夜看完整場 Google I/O 之后,除了 Gemini 3.5 和它的小伙伴們帶來的驚訝之外,我們難免也詫異于 AI 對于人類基礎(chǔ)行為的革命。
無論是 Gemini 3.5 Flash、Antigravity、Gemini Spark,它們都隱藏在了一個(gè)簡潔的「搜索對話框」背后,將搜索這一行為從「獲取信息」進(jìn)化成了「完成任務(wù)」。
![]()
圖|Google Search
我們很難說這種進(jìn)化在長期來看會(huì)對我們使用網(wǎng)絡(luò)和人工智能產(chǎn)生什么影響,但我們至少可以從里面看到谷歌的野心——
為一套強(qiáng)悍的 AI 模型賦予前所未有豐富的功能,并且將這些功能集成進(jìn)自己覆蓋全球幾十億用戶的網(wǎng)絡(luò)產(chǎn)品里,共同提升這幾十億人的效率。
![]()
Gemini 同時(shí)切進(jìn)所有這些網(wǎng)絡(luò)產(chǎn)品,副作用是「應(yīng)用」這個(gè)概念正在變薄——
Agent 越能辦事,應(yīng)用內(nèi)部和搜索結(jié)果頁的存在價(jià)值就越被稀釋。
至于這層智能會(huì)把多少舊規(guī)則一起重寫,現(xiàn)在沒人能答,谷歌自己也答不上來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.