作者|Yara
在硅谷的一場小型聚會AGI House上,Google聯合創始人Sergey Brin(謝爾蓋·布林)罕見地走出辦公室,面對一群華人創業者和工程師,進行了一場近30分鐘的非預設的Q&A,觀眾直接提問,Brin現場作答。
這是Brin時隔近兩年再次出現在AGI House。上一次是2024年初,那時的Gemini還處在風口浪尖之外,Google在AI競賽中顯得有些被動。兩年后,Brin以一種幾乎不加修飾的姿態回到現場,沒有PPT,沒有預設議題,把麥克風直接交給了觀眾。Brin自己說,這兩年他一直在Google內部埋頭做AI,"基本上沒有時間做社交拜訪"。
AGI House是硅谷AI創業社區最有辨識度的據點之一,2023年由Rocky Yu在加州Hillsborough一棟價值6800萬美元的豪宅中創立,前身是Andrej Karpathy發起的科技社群NeoGenesis。這里每周舉辦演講、黑客馬拉松和社交活動,來過的人包括Eric Schmidt、OpenAI和Anthropic的創始人。
![]()
01/"我們大部分時間都在用AI改進AI"
開場:歡迎Brin回來,先聊聊你的近況吧。距離上次來這里差不多兩年了,這期間感覺怎么樣?
Sergey Brin:我得先說明一下,外界把我個人對Gemini勢頭的作用說得有點夸張了。Gemini背后是一整個團隊,一旦達到某個臨界點,勢頭起來之后就一發不可收拾,整個過程真的非常震撼。說實話,誰會不想去推動智能的邊界呢?這是歷史上、也是科學史上獨一無二的時刻。
這兩年我大部分時間都待在辦公室埋頭苦干,AI領域節奏太快了,基本沒什么時間出來做社交活動。
02/AI for Science 的下一步
問:Google在"AI for Science"方面一直雄心勃勃,下一步的大動作是什么?
Sergey Brin:我們歷史上做過的事情五花八門,從管核聚變反應堆,到用AlphaFold做蛋白質折疊等等。
讓我興奮的是,這些原本五花八門的方向,現在正在「收斂」到同一類通用模型上。過去我們必須為每個任務做專門的模型,蛋白質折疊現在確實還是用專門模型,但越來越多地,我們主流的Gemini大模型,已經能在數學等科學問題上達到頂尖水平。
這種「收斂」,說實話是我一開始沒料到的,但看著它發生真的很神奇。背后其實是「遷移」這個概念在起作用:你訓練模型寫代碼,居然能幫它提升數學推理;反過來也成立。多模態也是同樣的道理,訓練模型處理圖像,能讓它在思考幾何題這類問題上變得更強。
03/AGI 之后的世界
問:智能問題被攻克之后,下一波基礎設施會是什么樣的?Sergey Brin:哇,這是個好問題。AGI之后是什么?現在大家都在拼命加速AI本身的發展。
回頭看,我們最早有了網頁和互聯網搜索,后來經歷了移動互聯網這一波大爆發,現在AI是新的產業浪潮。再之后是什么?說實話,如果你能回答這個問題,你就能辦一家了不起的公司了。
04/怎么定義超級智能
問:你是理論計算機科學出身,怎么看P=NP這類問題?是不是能解決NP完全問題,就算超級智能了?Sergey Brin:我覺得這是個挺特別的觀點。大多數計算機科學家其實傾向于認為P不等于NP。
如果這件事在數學上就是不可能的,不管AI再聰明,它也辦不到。有人嘗試用量子計算機來對付這類難題,但即使量子計算機能分解大整數,也不代表它就能搞定NP完全問題。
我覺得業界對超級智能的共識就是"比人類更聰明",而不是"能解決NP完全問題"。
05/傳統工業怎么用上前沿AI
問:我來自重工業,比如汽車和航空航天。這些還在用老舊流程的行業,怎么才能用上今天的前沿AI能力?
Sergey Brin:我越來越多地看到大公司在向AI前沿靠攏,但通常不是動用核心主力團隊,而是在邊緣做嘗試,比如"我們能不能試試用大模型來設計一輛車、一架飛機?"
這些實驗我不確定有沒有完全開花結果,但他們肯定會繼續嘗試下去。另外,很多公司也會把日常那些枯燥的行政流程自動化掉,這非常常見。
但對于真正的核心產品,比如需要機械工程的東西,這些目前還停留在實驗階段。不過他們百分之百都在試。
06/人怎么跟上 AI 的速度
問:模型的能力漲得太快,我自己都覺得跟不上。人和模型之間的「帶寬」怎么提升?Sergey Brin:這問題問得非常好。我自己也常常困惑:到底該用什么層次去給模型下指令?
你可以非常具體,比如"幫我調試這段代碼";也可以更抽象,比如"幫我寫一個更好的神經網絡訓練算法";甚至可以更高層次,"我今天該做什么?"或者干脆"你做點有用的事吧"。
模型越來越聰明,理論上能處理越來越寬泛的任務,但很難跟上它實際能干什么。即便是我們自己做Gemini的人,也不完全清楚它的能力邊界在哪。經常會有人提出一個看起來特別直白的需求,結果它居然真的做出來了。
「思維鏈」就是個典型例子。幾年前有人發現,只要在問題前面加一句"讓我們一步一步地思考",模型表現就大幅提升。這聽起來傻得不行,這種話怎么可能有用?但它真的有用,還推動了AI能力的一次大躍遷。
所以我想說的是,連最基本的文本交互方式都在快速演變,跟上節奏確實難,我也沒有什么神奇的解藥。當然,市面上有專門研究和優化提示詞的人。
至于人和模型之間的帶寬,顯然語音和視頻已經是高帶寬的方式了。有些公司,比如Neuralink,在嘗試做腦機接口。就我個人而言,憑今天這些模型的水平,我還不會為了它去改造我的生物身體,我會等技術成熟很多以后再說。
不過我覺得,今天的模型在幫你做通用、有用的事情上已經越來越聰明了。你不一定要用更高的帶寬去跟它溝通,而它輸出的帶寬自然就高了,它能直接給你生成視頻、圖片之類的東西。
07/實體圖譜有戲嗎
問:我們在做一個開源的實體圖譜,把世界信息按實體(公司、人、地點等)來組織和連接,而不是按URL和文檔。你怎么看這個方向?
Sergey Brin:這讓我想起Xanadu,我說這個詞是不是暴露年齡了?(場下三個人認出來)
說實話,我的第一反應是,你在逆流而上。但逆流而上沒什么不好。
如果我們20年前坐在這里聊,那時候人人都在搞知識圖譜,反倒是搞神經網絡的人才是怪人,大家會說"你不知道嗎?那玩意兒五十年代就試過,根本不行"。結果神經網絡后來一路走到今天,所有人都在搞神經網絡,反而沒人搞圖譜了,除了你。
所以你押的是冷門賠率,但冷門有時候真的能贏。祝你好運。
08/超級智能時代,人還能做什么
問:超級智能之后,哪些事情還只有人能做?另外,Google未來20年的角色是什么?
Sergey Brin:問題不大嘛,全人類的角色 + Google未來20年......
智能的定義一直都在變。機器能做什么、人能做什么,這條線一直在挪。很長一段時間里,國際象棋就是"智能"的代名詞。然后90年代深藍擊敗了卡斯帕羅夫。
但有意思的是,人們并沒有因此就不下棋了。
Sergey Brin:在場有多少人知道現在世界排名第一的人類棋手是誰?我猜是馬格努斯·卡爾森(Magnus Carlsen)吧。
Sergey Brin:那有多少人知道排名第一的AI象棋程序是哪個?(場下有人說Stockfish)
Sergey Brin:你不覺得AlphaZero能贏Stockfish嗎?(場下:"Stockfish吸收了AlphaZero的很多東西")
Sergey Brin:哦,被吸收了,行吧。
我想說的是:電腦能把這些事做好,并沒有阻止人類在這些事上做得越來越好、獲得越來越多的認可,也越來越享受這些事情本身。
我們的看法也在調整。一開始覺得"國際象棋是智能",后來變成"圍棋是智能",再后來是詩歌、繪畫……我覺得AI能做出很多讓人驚訝的事,但它也會反過來幫助人類做得更好。
順便說,AlphaGo之后,圍棋這門技藝本身水平大幅提升了,跟AlphaGo下過棋的李世石、柯潔,他們的棋力都明顯漲了,整個圍棋水平的天花板被推高了。所以即使有AI協助,人們仍然能享受、并做好很多事情。
至于Google未來20年,這問題太大了,我們還是讓別人接著問吧。
09/Transformer 能走到 AGI 嗎
問:你覺得Transformer架構足夠通往AGI嗎?
Sergey Brin:我自己問過這個問題很多次。Transformer的靈活性非常出人意料,我們現在用它處理圖像、視頻、文本,它已經遠遠超出了最初設計的能力范圍。
公平地說,它一路也在變。比如稀疏專家混合(MoE)這類Transformer,很多細節都已經不是原始論文里那個樣子了。
如果讓我猜,"接近Transformer"的某種東西能不能成為AGI?我會說能。這只是我的猜測,因為它已經證明自己能演化出這么多東西了。但它確實在持續變化,不是論文里那個原始版本了。
10/三年后的Google
問:很多人覺得AGI一兩年內就會到來,三年后的Google怎么設想?
Sergey Brin:行啊,把目標降低了。
說實話,我們現在在Gemini其實相當"向內看",重點是用工具來打造工具本身。
我覺得這跟很多走在前沿的人是相似的,哪怕他們不是技術背景。我有個朋友,六個月前開始用OpenClaw,用它把自己生活的方方面面都自動化了,那種程度讓我都印象深刻。
組織內部也一樣:能不能讓AI幫我們監控訓練運行?能不能讓AI自己生成訓練數據?你開始用工具去造工具,這就是我們這段時間精力大量轉移過去的方向,也是我們日常花最多時間在做的事。
11/你和 Demis、Koray 怎么分工
問:你回到Google兩年了,你和Demis、Koray這些人是怎么分工的?
Sergey Brin:老實說,我有點像個"攪局者"。Demis和Koray在Gemini上負責,由于我也在Gemini投入大量精力,跟Koray相處時間很多。但真正負責交付成果的是他。
我的角色更多是去戳一戳他和團隊:"這件事你真的在做嗎?真的嗎?"不撒謊,有時候確實有點擾亂節奏。Koray才是那個組織各個小組、推動東西落地的人。我把自己的角色更多看成是提醒他們:哪些優先級被忽視了,哪些點子沒受到足夠重視,等等。
12/世界模型與AGI
問:你怎么看世界模型對AGI的作用?
Sergey Brin:(先打了個岔)等等,你叫Boris,怎么有法國口音?……你妹妹叫Natasha?哈哈好的,你的問題是什么來著?
哦,世界模型,基本上就是視頻類的模型。
關于AGI,人們的定義其實挺寬泛。我自己傾向于把AGI理解為"AI能自我改進"。但另一種說法是,AGI意味著AI能做任何人能做的事,可能這種說法更對。這是兩件不同的事。
要做"人能做的任何事",你絕對需要能理解并跟物理世界互動。所以你得能"想象",如果我做了某件事,這個世界會怎么變化?你得能理解這種因果。
所以是的,如果目標是把所有事都包圓,包括延伸到機器人這類應用,那世界模型就是關鍵。
你們玩我們Gemini Omni模型的時間可能比我還多,因為我現在深陷在自我改進那一攤事里。但Omni方向我們已經做了很久,它是最新版本。Omni還有個酷的地方:它的訓練方式跟Gemini完全一樣,文本和其他所有東西一起喂進去訓練。這些不同模態最后能收斂到一起,真的挺神奇的。但是的,要讓AI能跟物理世界互動,這種能力是必須的。
13/現在還有當年那種信心嗎
問:三年前你說過"Google是家大公司,做這件事已經很久了",讓我感覺到你那時就有信心帶它回來。今天編程智能體這么火,其他前沿實驗室在自我改進上也有進展,你現在還有同樣的信心嗎?
Sergey Brin:好問題。整體來說,我感覺非常好。
如果我每個月都去測一次"溫度",每次有別家發布新模型就說"完了完了",那我可能很快就崩潰了。但其實你看長一點,局勢是來回反復的。我對Gemini目前的位置感覺相當不錯。
我知道現在大家都聚焦在編程上,我們在這個方向上深入得稍微晚了一點。大約六個月前發布的Gemini 3.0和3.1,當時是全方位領先的。但之后其他實驗室確實進步明顯,特別是在編程方面。
你天天觀察會發現:前幾個月大家都對Opus特別興奮,但要論"深度編程",我現在會把這一項的優勢給到GPT 5.5。
不過我也得給你們安利一下Gemini 3.5 Flash,速度快得多。速度這件事在很多場景下也很重要。我要肯定一下競爭對手,如果你想丟一個任務讓它跑一整夜,GPT 5.5看起來表現非常出色。但如果是要交互式快速迭代,我們就上Gemini 3.5 Flash。后面也會有更多很棒的模型出來。
事后看,我們大概應該早一點專注在代碼上。但我得說清楚,我們現在非常專注于代碼。
(全場鼓掌結束)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.