網易首頁 > 網易號 > 正文 申請入駐

Google發力了,硬剛 Claude Code

0
分享至

  Claude 靠Opus4.7搶占風頭,Google 也有大招,而且是三連發,咱逐個拆解

  
Google Gemini 三連發全景速覽

  從桌面端到開發者工具,再到語音合成,三條線同時發力

  Google 這波屬于憋了一股勁,要把 Gemini 生態從頭鋪到尾

  一、Gemini Mac 桌面版

  Google 首次把 Gemini 帶上了 Mac 桌面

  原生 Swift 開發,與 Antigravity 團隊合作,據說從 idea 到原型只用了幾天

  

  直接說體驗重點:

  ① 全局快捷鍵,隨叫隨到

  Option + Space任何界面一鍵呼出 Gemini 迷你對話框,就像 Mac 的 Spotlight 一樣

  還有Option + Shift + Space可以打開完整聊天界面,兩個快捷鍵都可以自定義

  這個體驗真的很順滑

  你在寫代碼突然卡殼了,Option + Space 問一句,答完繼續寫,全程不用切窗口、不用開瀏覽器

  

  ② 窗口共享,看到你在干什么

  這是我覺得最有意思的功能

  點擊「Add files and tools → Share window」,Gemini 就能看到你當前窗口的內容——文檔、代碼、數據表格都行

  它會根據你屏幕上的內容直接給出上下文相關的回答。

  舉個例子:你打開一個 Python 腳本,共享窗口后直接問「這段代碼有什么 bug?」,它能直接看到代碼給你分析,不用再復制粘貼了。

  
③ 創作能力集成

  圖片生成(Nano Banana)、視頻生成(Veo)都內置了

  桌面端直接就是一個創作工作站

  ④ 多設備同步

  同一個 Google 賬號,聊天記錄和記憶跨設備同步——手機上聊到一半,Mac 上接著聊

  系統要求:

  項目

  要求

  系統版本

  macOS Sequoia(15.0)或更高

  芯片

  僅 Apple Silicon(M 系列)

  內存

  8 GB 以上

  磁盤空間

  200 MB 以上

  網絡

  需要穩定連接

  費用

? 下載地址:gemini.google/mac

  說實話,這個桌面 App 的定位很清晰——不開瀏覽器就能用 AI

  對比 ChatGPT 桌面版,Gemini 的窗口共享是差異化亮點,它能直接"看到"你在干什么,上下文理解比純文字對話強多了

  不過目前只支持 Apple Silicon,Intel Mac 用戶暫時無緣

  而且本質上是聯網應用,離線場景下幫不了你

  二、Gemini CLI 支持 Subagents,重頭戲來了

  如果說 Mac App 是給普通用戶的禮物,那 Subagents 就是給開發者的大殺器

  之前用 Gemini CLI 處理復雜任務,最大的痛點是什么?上下文窗口越用越臃腫

  查個代碼架構,跑幾輪測試,上下文就爆炸了,后面的對話質量直線下降

  這個問題在 Claude Code 里也存在,它的解決方案是 Task 工具

  現在 Gemini CLI 的答案是Subagents——一句話概括:主 Agent 終于有了自己的專家團隊。

  
Subagents 架構一覽 什么是 Subagents?

  Subagents 就是跟主 Agent 并肩作戰的「專家」

  
Gemini CLI - Parallel Subagents

  每個 Subagent 都有:

  獨立的上下文窗口—— 不污染主對話

  專屬的系統指令—— 可以定制行為和人設

  獨立的工具集和 MCP 服務器—— 精確控制能做什么

  執行完匯總返回—— 內部可能跑了幾十輪工具調用,但返回給主 Agent 的只是一份精煉總結

  這就意味著,你的主上下文永遠干凈利落,不會因為中間過程膨脹變慢。

  三個內置 Subagent,開箱即用

  名稱

  定位

  什么時候用

  generalist

  通用型,繼承所有工具

  批量重構、跑大量命令、高輸出量任務

  codebase_investigator

  代碼庫探索專家

  架構分析、依賴追蹤、Bug 根因定位

  cli_help

  Gemini CLI 使用專家

  問配置、問命令、問功能怎么用

  還有一個實驗性的browser_agent,可以自動化瀏覽器操作——填表單、點按鈕、提取頁面信息。需要 Chrome 144+ 并在settings.json里手動啟用。=

  自定義 Subagent,一個 Markdown 文件搞定

  重點來了:一個.md文件 = 一個專家 Agent

  舉個例子,定義一個前端專家:

  ---
name: frontend-specialist
description: Frontend specialist in building high-performance,
accessible, and scalable web applications.
tools:
-read_file
-grep_search
-glob
-list_directory
-web_fetch
-google_web_search
model: inherit
---

You are a Senior Frontend Specialist and UI/UX Architect.
Your goal is to design and implement exceptional,
production-grade user interfaces.

### Core Principles:
-Architecture & Scalability
-Performance & Optimization
-Accessibility (A11y)

  文件放到.gemini/agents/目錄,Gemini CLI 自動識別。項目級的放.gemini/agents/(團隊共享),個人全局的放~/.gemini/agents/

  配置項也很靈活:

  字段

  name

  唯一標識,也是 @語法 調用時的名字

  description

  描述,主 Agent 靠這個決定何時派活

  tools

  可用工具列表,支持通配符(*全部、mcp_*所有 MCP 工具)

  model

  指定模型,默認inherit繼承主 Agent

  temperature

  溫度,0-2

  max_turns

  最大對話輪數,默認 30

  timeout_mins

  超時時間,默認 10 分鐘

  
并行執行,效率起飛

  Subagents支持并行運行。比如你要同時調研 5 個模塊的架構,可以一口氣派出 5 個 Subagent 同步執行,總耗時約等于最慢那一個。

  你甚至可以直接說:

? "Run the frontend-specialist on each package in parallel."

  不過要注意:并行執行代碼編輯任務可能會沖突,多個 Agent 同時改文件容易互相覆蓋。并行更適合只讀型任務——分析、調研、測試。

  @ 語法直接點名

  用@符號可以精準派活,跳過主 Agent 的自動判斷:

  @codebase_investigator 幫我梳理認證模塊的調用鏈路
@generalist 把項目里所有文件的 License 頭更新一遍
@security-auditor 審計 src/api/ 目錄的安全性
安全機制

  工具隔離:每個 Subagent 只能用你明確授權的工具,不會越權

  遞歸保護:Subagent不能調用其他 Subagent,防止無限套娃、Token 爆炸。

  還可以配合 Policy Engine(策略引擎)做更細粒度的權限控制,比如只允許某個 Subagent 執行git push

  用/agents命令可以隨時查看當前所有可用的 Subagent:

  
Gemini CLI /agents 命令

  我的判斷:Subagents 是 Gemini CLI 迄今最重要的一次更新。之前我給 Gemini CLI 打了 99 分,現在加上 Subagents,可以認真跟 Claude Code 的 Task 工具掰手腕了。核心解決的問題是:讓 AI 編程從「單打獨斗」進化到「團隊協作」

? Subagents 文檔:https://geminicli.com/docs/core/subagents/ GitHub:https://github.com/google-gemini/gemini-cli
三、Gemini 3.1 Flash TTS:用自然語言「導演」AI 說話

  最后一個更新在語音領域

  Gemini 3.1 Flash TTS 是 Google 最新的文字轉語音模型,核心賣點三個字:能控制

  音質:Elo 1211,性價比最優象限

  在 Artificial Analysis TTS 排行榜上(基于數千次人類盲測偏好),3.1 Flash TTS 拿到了Elo 1211 分。更關鍵的是,它被定位在「最具吸引力象限」——質量高、價格低

  在 TTS 領域,這個定位很有競爭力。ElevenLabs 質量確實好,但貴;開源方案便宜,但效果參差不齊

  
Artificial Analysis TTS 排行榜 Audio Tags:最大的創新

  這是這次 TTS 更新最讓我眼前一亮的功能。你可以在文本里嵌入Audio Tags(音頻標簽),用自然語言直接指導 AI 怎么說話:

  場景導演(Scene Direction)設定環境和對話指令。比如告訴它「這是一個深夜廣播節目,語氣低沉溫暖」,角色就會保持這個狀態。

  角色級控制(Speaker-level Specificity)為每個角色設置獨立的 Audio Profile——語速、語調、口音都可以分別調。甚至可以用 inline tags 在句子中間切換表達方式。

  一鍵導出(Seamless Export)在 Google AI Studio 里調好所有參數后,可以直接導出為 Gemini API 代碼。調試一次,到處復用。

  這個思路很聰明——與其讓用戶在后臺調一堆參數滑塊,不如讓用戶用自然語言直接「導演」。降低了創作門檻,又給專業用戶足夠的精細度。

  其他亮點

  70+ 語言支持,中文在列

  原生多角色對話,做播客、有聲書的朋友有福了

  SynthID 水印,所有生成音頻都帶不可感知水印,標識 AI 生成內容

? 模型卡片:deepmind.google/models/model-cards/gemini-3-1-flash-audio/
總結

  Google 這波三連發,覆蓋面很廣:

  更新

  面向誰

  一句話總結

  Gemini Mac App

  普通用戶

  Option + Space

  隨時呼出,窗口共享是亮點

  Gemini CLI Subagents

  開發者

  主 Agent + 專家團隊,上下文不再爆炸

  Gemini 3.1 Flash TTS

  內容創作者 / 開發者

  Audio Tags 用自然語言控 AI 語音,70+ 語言

  三個更新里,我個人最看好Gemini CLI Subagents。它解決了 AI 編程助手最核心的架構問題——單 Agent 上下文有限,復雜任務需要多 Agent 協作。Google 的實現方式(Markdown 定義 + 工具隔離 + 并行執行)簡潔優雅,上手成本很低。

  桌面 App 方便,TTS 有創新,但真正改變開發者日常工作流的,是 Subagents。

  制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為啥末代皇帝往往是昏君 看網友分析 思想境界都上了一個大臺階

為啥末代皇帝往往是昏君 看網友分析 思想境界都上了一個大臺階

侃神評故事
2026-04-23 15:40:03
剛剛宣布:加息25個基點

剛剛宣布:加息25個基點

中國基金報
2026-04-23 18:34:59
伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

墨印齋
2026-04-23 15:42:00
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

夢想總會變成真
2026-04-23 01:11:47
5月1日起全面嚴查!在職退休無一例外,這5類人好日子到頭了

5月1日起全面嚴查!在職退休無一例外,這5類人好日子到頭了

細說職場
2026-04-23 10:38:58
李小冉的顏值被嚴重低估了!董潔、湯唯和她合影,都黯然失色了

李小冉的顏值被嚴重低估了!董潔、湯唯和她合影,都黯然失色了

八斗小先生
2026-04-23 16:31:41
霍汶希力挺張敬軒僅6天后續:英皇全藝人遭集體抵制 態度一邊倒

霍汶希力挺張敬軒僅6天后續:英皇全藝人遭集體抵制 態度一邊倒

觀察鑒娛
2026-04-23 12:01:07
上海地鐵站內,這個“高素質”習慣爆發沖突!上海已叫停多年!很多人改不過來……

上海地鐵站內,這個“高素質”習慣爆發沖突!上海已叫停多年!很多人改不過來……

環球網資訊
2026-04-23 11:11:44
拜合拉木談安東尼奧:沒有他選我進國青,可能我還在內蒙踢

拜合拉木談安東尼奧:沒有他選我進國青,可能我還在內蒙踢

懂球帝
2026-04-23 23:24:51
個人微信建了600多個工作群,離職時賬號歸誰

個人微信建了600多個工作群,離職時賬號歸誰

現代快報
2026-04-23 13:49:11
意大利體育部長:意大利遞補參加世界杯既不可能,也不合適

意大利體育部長:意大利遞補參加世界杯既不可能,也不合適

懂球帝
2026-04-23 22:18:05
泰國潑水節一名15歲少女遭軍人尾隨進公廁性侵,監控曝光,嫌疑人已投案自首,將被移送軍事法庭

泰國潑水節一名15歲少女遭軍人尾隨進公廁性侵,監控曝光,嫌疑人已投案自首,將被移送軍事法庭

揚子晚報
2026-04-21 22:25:47
大衣哥再登熱搜!高鐵站席地而坐刷手機,衣著樸素、毫無明星架子

大衣哥再登熱搜!高鐵站席地而坐刷手機,衣著樸素、毫無明星架子

火山詩話
2026-04-23 16:00:38
99年我在守水庫,遇到一個道士借宿,他走時叮囑我,最近先別下山

99年我在守水庫,遇到一個道士借宿,他走時叮囑我,最近先別下山

千秋文化
2026-04-20 19:50:05
“特朗普說什么都沒用” 德黑蘭掛起巨幅海報宣告“永久控制”霍爾木茲海峽

“特朗普說什么都沒用” 德黑蘭掛起巨幅海報宣告“永久控制”霍爾木茲海峽

新華社
2026-04-23 21:27:51
整整26年的太子,僅僅6個月的皇帝,換來5個月的太上皇

整整26年的太子,僅僅6個月的皇帝,換來5個月的太上皇

鶴羽說個事
2026-04-23 22:29:23
扮豬吃虎?忍耐四個月,委代總統撕破偽裝,率幾十萬大軍硬剛美國

扮豬吃虎?忍耐四個月,委代總統撕破偽裝,率幾十萬大軍硬剛美國

健身狂人
2026-04-23 17:45:54
比亞迪在馬來西亞的東盟首個整車基地已全面停工,項目陷入僵局

比亞迪在馬來西亞的東盟首個整車基地已全面停工,項目陷入僵局

流蘇晚晴
2026-04-22 19:05:45
伊朗戰事未停,五角大樓先“斬”海軍部長:“沒認清誰是老大”的代價

伊朗戰事未停,五角大樓先“斬”海軍部長:“沒認清誰是老大”的代價

上觀新聞
2026-04-23 16:28:28
伊朗斷網50多天,創下一個世界紀錄,是怕美國還是怕老百姓?

伊朗斷網50多天,創下一個世界紀錄,是怕美國還是怕老百姓?

云舟史策
2026-04-24 07:30:43
2026-04-24 09:27:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3348文章數 11139關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

女子網購1450單又退貨1450單 老板娘盤點后稱損失12萬

頭條要聞

女子網購1450單又退貨1450單 老板娘盤點后稱損失12萬

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

本地
健康
親子
藝術
手機

本地新聞

SAGA GIRLS 2026女團選秀

干細胞如何讓燒燙傷皮膚"再生"?

親子要聞

法國寶媽在網上偷偷賣自己的奶!暗訪“母乳黑市”:細菌、乙肝……這能放心喝?

藝術要聞

江青對聯驚艷眾人,書法與寫字的界限究竟在哪?

手機要聞

vivo X500 Pro Max被曝光:2nm工藝+5GHz,2K直屏九月發!

無障礙瀏覽 進入關懷版