網易首頁 > 網易號 > 正文申請入駐

謝爾蓋·布林現身"開放麥":談Gemini、AGI的邊界及其他"大問題"

2026-06-09 21:29:35　來源: 科技行者

北京舉報

分享至

作者｜Yara

在硅谷的一場小型聚會AGI House上，Google聯合創始人Sergey Brin（謝爾蓋·布林）罕見地走出辦公室，面對一群華人創業者和工程師，進行了一場近30分鐘的非預設的Q&A，觀眾直接提問，Brin現場作答。

這是Brin時隔近兩年再次出現在AGI House。上一次是2024年初，那時的Gemini還處在風口浪尖之外，Google在AI競賽中顯得有些被動。兩年后，Brin以一種幾乎不加修飾的姿態回到現場，沒有PPT，沒有預設議題，把麥克風直接交給了觀眾。Brin自己說，這兩年他一直在Google內部埋頭做AI，"基本上沒有時間做社交拜訪"。

AGI House是硅谷AI創業社區最有辨識度的據點之一，2023年由Rocky Yu在加州Hillsborough一棟價值6800萬美元的豪宅中創立，前身是Andrej Karpathy發起的科技社群NeoGenesis。這里每周舉辦演講、黑客馬拉松和社交活動，來過的人包括Eric Schmidt、OpenAI和Anthropic的創始人。

01/"我們大部分時間都在用AI改進AI"

開場：歡迎Brin回來，先聊聊你的近況吧。距離上次來這里差不多兩年了，這期間感覺怎么樣？

Sergey Brin：我得先說明一下，外界把我個人對Gemini勢頭的作用說得有點夸張了。Gemini背后是一整個團隊，一旦達到某個臨界點，勢頭起來之后就一發不可收拾，整個過程真的非常震撼。說實話，誰會不想去推動智能的邊界呢？這是歷史上、也是科學史上獨一無二的時刻。

這兩年我大部分時間都待在辦公室埋頭苦干，AI領域節奏太快了，基本沒什么時間出來做社交活動。

02/AI for Science 的下一步

問：Google在"AI for Science"方面一直雄心勃勃，下一步的大動作是什么？

Sergey Brin：我們歷史上做過的事情五花八門，從管核聚變反應堆，到用AlphaFold做蛋白質折疊等等。

讓我興奮的是，這些原本五花八門的方向，現在正在「收斂」到同一類通用模型上。過去我們必須為每個任務做專門的模型，蛋白質折疊現在確實還是用專門模型，但越來越多地，我們主流的Gemini大模型，已經能在數學等科學問題上達到頂尖水平。

這種「收斂」，說實話是我一開始沒料到的，但看著它發生真的很神奇。背后其實是「遷移」這個概念在起作用：你訓練模型寫代碼，居然能幫它提升數學推理；反過來也成立。多模態也是同樣的道理，訓練模型處理圖像，能讓它在思考幾何題這類問題上變得更強。

03/AGI 之后的世界

問：智能問題被攻克之后，下一波基礎設施會是什么樣的？Sergey Brin：哇，這是個好問題。AGI之后是什么？現在大家都在拼命加速AI本身的發展。

回頭看，我們最早有了網頁和互聯網搜索，后來經歷了移動互聯網這一波大爆發，現在AI是新的產業浪潮。再之后是什么？說實話，如果你能回答這個問題，你就能辦一家了不起的公司了。

04/怎么定義超級智能

問：你是理論計算機科學出身，怎么看P=NP這類問題？是不是能解決NP完全問題，就算超級智能了？Sergey Brin：我覺得這是個挺特別的觀點。大多數計算機科學家其實傾向于認為P不等于NP。

如果這件事在數學上就是不可能的，不管AI再聰明，它也辦不到。有人嘗試用量子計算機來對付這類難題，但即使量子計算機能分解大整數，也不代表它就能搞定NP完全問題。

我覺得業界對超級智能的共識就是"比人類更聰明"，而不是"能解決NP完全問題"。

05/傳統工業怎么用上前沿AI

問：我來自重工業，比如汽車和航空航天。這些還在用老舊流程的行業，怎么才能用上今天的前沿AI能力？

Sergey Brin：我越來越多地看到大公司在向AI前沿靠攏，但通常不是動用核心主力團隊，而是在邊緣做嘗試，比如"我們能不能試試用大模型來設計一輛車、一架飛機？"

這些實驗我不確定有沒有完全開花結果，但他們肯定會繼續嘗試下去。另外，很多公司也會把日常那些枯燥的行政流程自動化掉，這非常常見。

但對于真正的核心產品，比如需要機械工程的東西，這些目前還停留在實驗階段。不過他們百分之百都在試。

06/人怎么跟上 AI 的速度

問：模型的能力漲得太快，我自己都覺得跟不上。人和模型之間的「帶寬」怎么提升？Sergey Brin：這問題問得非常好。我自己也常常困惑：到底該用什么層次去給模型下指令？

你可以非常具體，比如"幫我調試這段代碼"；也可以更抽象，比如"幫我寫一個更好的神經網絡訓練算法"；甚至可以更高層次，"我今天該做什么？"或者干脆"你做點有用的事吧"。

模型越來越聰明，理論上能處理越來越寬泛的任務，但很難跟上它實際能干什么。即便是我們自己做Gemini的人，也不完全清楚它的能力邊界在哪。經常會有人提出一個看起來特別直白的需求，結果它居然真的做出來了。

「思維鏈」就是個典型例子。幾年前有人發現，只要在問題前面加一句"讓我們一步一步地思考"，模型表現就大幅提升。這聽起來傻得不行，這種話怎么可能有用？但它真的有用，還推動了AI能力的一次大躍遷。

所以我想說的是，連最基本的文本交互方式都在快速演變，跟上節奏確實難，我也沒有什么神奇的解藥。當然，市面上有專門研究和優化提示詞的人。

至于人和模型之間的帶寬，顯然語音和視頻已經是高帶寬的方式了。有些公司，比如Neuralink，在嘗試做腦機接口。就我個人而言，憑今天這些模型的水平，我還不會為了它去改造我的生物身體，我會等技術成熟很多以后再說。

不過我覺得，今天的模型在幫你做通用、有用的事情上已經越來越聰明了。你不一定要用更高的帶寬去跟它溝通，而它輸出的帶寬自然就高了，它能直接給你生成視頻、圖片之類的東西。

07/實體圖譜有戲嗎

問：我們在做一個開源的實體圖譜，把世界信息按實體（公司、人、地點等）來組織和連接，而不是按URL和文檔。你怎么看這個方向？

Sergey Brin：這讓我想起Xanadu，我說這個詞是不是暴露年齡了？（場下三個人認出來）

說實話，我的第一反應是，你在逆流而上。但逆流而上沒什么不好。

如果我們20年前坐在這里聊，那時候人人都在搞知識圖譜，反倒是搞神經網絡的人才是怪人，大家會說"你不知道嗎？那玩意兒五十年代就試過，根本不行"。結果神經網絡后來一路走到今天，所有人都在搞神經網絡，反而沒人搞圖譜了，除了你。

所以你押的是冷門賠率，但冷門有時候真的能贏。祝你好運。

08/超級智能時代，人還能做什么

問：超級智能之后，哪些事情還只有人能做？另外，Google未來20年的角色是什么？

Sergey Brin：問題不大嘛，全人類的角色 + Google未來20年......

智能的定義一直都在變。機器能做什么、人能做什么，這條線一直在挪。很長一段時間里，國際象棋就是"智能"的代名詞。然后90年代深藍擊敗了卡斯帕羅夫。

但有意思的是，人們并沒有因此就不下棋了。

Sergey Brin：在場有多少人知道現在世界排名第一的人類棋手是誰？我猜是馬格努斯·卡爾森（Magnus Carlsen）吧。

Sergey Brin：那有多少人知道排名第一的AI象棋程序是哪個？（場下有人說Stockfish）

Sergey Brin：你不覺得AlphaZero能贏Stockfish嗎？（場下："Stockfish吸收了AlphaZero的很多東西"）

Sergey Brin：哦，被吸收了，行吧。

我想說的是：電腦能把這些事做好，并沒有阻止人類在這些事上做得越來越好、獲得越來越多的認可，也越來越享受這些事情本身。

我們的看法也在調整。一開始覺得"國際象棋是智能"，后來變成"圍棋是智能"，再后來是詩歌、繪畫……我覺得AI能做出很多讓人驚訝的事，但它也會反過來幫助人類做得更好。

順便說，AlphaGo之后，圍棋這門技藝本身水平大幅提升了，跟AlphaGo下過棋的李世石、柯潔，他們的棋力都明顯漲了，整個圍棋水平的天花板被推高了。所以即使有AI協助，人們仍然能享受、并做好很多事情。

至于Google未來20年，這問題太大了，我們還是讓別人接著問吧。

09/Transformer 能走到 AGI 嗎

問：你覺得Transformer架構足夠通往AGI嗎？

Sergey Brin：我自己問過這個問題很多次。Transformer的靈活性非常出人意料，我們現在用它處理圖像、視頻、文本，它已經遠遠超出了最初設計的能力范圍。

公平地說，它一路也在變。比如稀疏專家混合（MoE）這類Transformer，很多細節都已經不是原始論文里那個樣子了。

如果讓我猜，"接近Transformer"的某種東西能不能成為AGI？我會說能。這只是我的猜測，因為它已經證明自己能演化出這么多東西了。但它確實在持續變化，不是論文里那個原始版本了。

10/三年后的Google

問：很多人覺得AGI一兩年內就會到來，三年后的Google怎么設想？

Sergey Brin：行啊，把目標降低了。

說實話，我們現在在Gemini其實相當"向內看"，重點是用工具來打造工具本身。

我覺得這跟很多走在前沿的人是相似的，哪怕他們不是技術背景。我有個朋友，六個月前開始用OpenClaw，用它把自己生活的方方面面都自動化了，那種程度讓我都印象深刻。

組織內部也一樣：能不能讓AI幫我們監控訓練運行？能不能讓AI自己生成訓練數據？你開始用工具去造工具，這就是我們這段時間精力大量轉移過去的方向，也是我們日常花最多時間在做的事。

11/你和 Demis、Koray 怎么分工

問：你回到Google兩年了，你和Demis、Koray這些人是怎么分工的？

Sergey Brin：老實說，我有點像個"攪局者"。Demis和Koray在Gemini上負責，由于我也在Gemini投入大量精力，跟Koray相處時間很多。但真正負責交付成果的是他。

我的角色更多是去戳一戳他和團隊："這件事你真的在做嗎？真的嗎？"不撒謊，有時候確實有點擾亂節奏。Koray才是那個組織各個小組、推動東西落地的人。我把自己的角色更多看成是提醒他們：哪些優先級被忽視了，哪些點子沒受到足夠重視，等等。

12/世界模型與AGI

問：你怎么看世界模型對AGI的作用？

Sergey Brin：（先打了個岔）等等，你叫Boris，怎么有法國口音？……你妹妹叫Natasha？哈哈好的，你的問題是什么來著？

哦，世界模型，基本上就是視頻類的模型。

關于AGI，人們的定義其實挺寬泛。我自己傾向于把AGI理解為"AI能自我改進"。但另一種說法是，AGI意味著AI能做任何人能做的事，可能這種說法更對。這是兩件不同的事。

要做"人能做的任何事"，你絕對需要能理解并跟物理世界互動。所以你得能"想象"，如果我做了某件事，這個世界會怎么變化？你得能理解這種因果。

所以是的，如果目標是把所有事都包圓，包括延伸到機器人這類應用，那世界模型就是關鍵。

你們玩我們Gemini Omni模型的時間可能比我還多，因為我現在深陷在自我改進那一攤事里。但Omni方向我們已經做了很久，它是最新版本。Omni還有個酷的地方：它的訓練方式跟Gemini完全一樣，文本和其他所有東西一起喂進去訓練。這些不同模態最后能收斂到一起，真的挺神奇的。但是的，要讓AI能跟物理世界互動，這種能力是必須的。

13/現在還有當年那種信心嗎

問：三年前你說過"Google是家大公司，做這件事已經很久了"，讓我感覺到你那時就有信心帶它回來。今天編程智能體這么火，其他前沿實驗室在自我改進上也有進展，你現在還有同樣的信心嗎？

Sergey Brin：好問題。整體來說，我感覺非常好。

如果我每個月都去測一次"溫度"，每次有別家發布新模型就說"完了完了"，那我可能很快就崩潰了。但其實你看長一點，局勢是來回反復的。我對Gemini目前的位置感覺相當不錯。

我知道現在大家都聚焦在編程上，我們在這個方向上深入得稍微晚了一點。大約六個月前發布的Gemini 3.0和3.1，當時是全方位領先的。但之后其他實驗室確實進步明顯，特別是在編程方面。

你天天觀察會發現：前幾個月大家都對Opus特別興奮，但要論"深度編程"，我現在會把這一項的優勢給到GPT 5.5。

不過我也得給你們安利一下Gemini 3.5 Flash，速度快得多。速度這件事在很多場景下也很重要。我要肯定一下競爭對手，如果你想丟一個任務讓它跑一整夜，GPT 5.5看起來表現非常出色。但如果是要交互式快速迭代，我們就上Gemini 3.5 Flash。后面也會有更多很棒的模型出來。

事后看，我們大概應該早一點專注在代碼上。但我得說清楚，我們現在非常專注于代碼。

（全場鼓掌結束）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.