網易首頁 > 網易號 > 正文申請入駐

谷歌最貴叛徒演講曝光：《下一階段AI的預測》

2025-09-22 23:18:06　來源: 互聯網思想

廣東舉報

分享至

27億美元天價回歸！

谷歌最貴「叛徒」、

Transformer作者揭秘AGI下一步

來源：新智元

【導讀】在AI熱潮中，大模型最「渴求」的究竟是什么？是算力、是存儲，還是復雜的網絡互聯？在Hot Chips 2025 上，Transformer發明者之一、谷歌Gemini聯合負責人Noam Shazeer給出了答案。

大模型需要什么？

在硅谷舉行的科技盛會Hot Chips 2025首日的主題演講上，谷歌DeepMind的Noam Shazeer回答了這一問題，發表了題為《下一階段AI的預測》的主題演講。

除了是Transformer論文《Attention Is All You Need》的作者之一，他還推動了許多技術創新，例如顯著提升谷歌搜索中的拼寫校正功能。

早在2017年，他就發明了Transformer模型，至今已深耕LLM領域十年。

后來，他開發了一款聊天機器人，但谷歌拒絕發布這項成果，這也促使他選擇離職，創辦了Character.AI。

不久之后，谷歌意識到自身短板，最終以27億美元的高價與Character.AI達成合作。

如今，Noam已回歸谷歌，擔任Gemini項目的聯合負責人。

正如他所展示的，大語言模型可以借助硬件等各方面資源的提升，不斷改善性能與準確性。

AI下一階段

算力，算力，還是算力

Noam Shazeer主要分享了LLM的需求、個人的LLM研究之路以及硬件與LLM的關系。

他強調幾點關鍵內容。

首先，Noam認為語言建模是當前最重要的研究領域。

他在演講中用一張幻燈片專門闡釋了這一點，可見他對該話題熱情之高。

然后他談到了「LLM到底需要什么」(What LLMs want)。

他更關注的是：更多的FLOPS意味著更好的性能。

這非常重要，因為隨著參數的增加、深度的增加、非線性以及信息流的增加，LLM的規模也隨之增加。

這可能需要更多的計算資源。更多的優質訓練數據也有助于創建更好的LLM。

他還談到了2015年時，在32個GPU上訓練是一件大事；但十年后，可能需要數十萬個GPU。

另一個有趣的小細節是，他說在2018年，谷歌為AI構建了計算節點。

這是一件大事，因為在此之前，谷歌工程師通常在一千個CPU上運行工作負載。但隨后它們會變慢，另作他用，比如爬取網絡。

擁有專門用于深度學習/ AI工作負載的大型機器，使得性能有了巨大的提升。

接著是芯片會議上的一大亮點，即LLM對硬件的需求。

從這張幻燈片中，可以看到一個有趣的觀點

更多的計算能力、內存容量、內存帶寬和更多的網絡帶寬，對于推動未來AI模型的進步都至關重要。

在「所有層級」上，這不僅僅是DDR5的容量和帶寬，還包括HBM和芯片上的SRAM。

降低精度以幫助更好地利用這四個方面，在很多情況下也被視為好事。

確定性有助于更好地編程。

演講的信息歸結為：在集群中擁有更大、更快的設備將導致LLM的增益。

這對谷歌和其他一些公司來說可能是個好消息。

大模型要什么硬件？

Noam是典型的「反向跨界者」：作為AI研究者，他對硬件充滿好奇，總想知道這些機器如何運作。

在Mesh-TensorFlow項目中，他對TPU的底層網絡結構產生了極大興趣。

論文鏈接：https://arxiv.org/abs/1811.02084

他提出了很多讓人耳目一新的問題：

你們的芯片居然是環形網絡結構？

那數據包在里面怎么跑？

怎么映射到神經網絡的張量計算里？

這種好奇心最終促成了谷歌在軟硬件協同設計上的諸多突破。

在這次演講中，Noam Shazeer深入剖析了LLM到底需要什么硬件。

AI需要的硬件支持：不止GPU

毫無疑問，算力是LLM最需要的因素。

當大家說「LLM想要什么」時，實際上也是在問：

為了讓AI更聰明，我們的硬件系統需要如何變化？

Noam的答案清晰直接：越多越好，越大越好。

1.更多算力（More FLOPs）

算力越多越好，最好是數以千萬億次的浮點運算能力（petaflops）。它直接決定你能訓練多大的模型，用多大的batch，覆蓋多少訓練數據。

2.更大內存容量&更高內存帶寬

Noam指出，內存帶寬如果不足，會限制模型結構的靈活性，比如不能輕易加非線性層。而更高的帶寬=更細粒度的控制。

內存包括：片上存儲（on-chip SRAM）、高帶寬內存（HBM）、顯存或DRAM等其他中高速緩存

內存容量方面，直接決定了：

能塞下多大的模型；

在推理時，能保留多少中間狀態（比如長上下文、緩存、注意力頭等）。

3.網絡帶寬（Network Bandwidth）

這個是很多人忽視但至關重要的一項。

因為無論是訓練還是推理，LLM幾乎一定會：模型被分到多個芯片，數據在它們之間來回傳遞。

舉個例子，大家現在都在追求「長思維鏈」（long chain of thought），也就是說模型要花更長的時間「思考」才能得出更強的答案。

可這也意味著每一步推理要更快完成，否則響應就變慢了。

這時候，瓶頸往往就在于你是否能迅速訪問完所有模型參數——

不只是芯片上的那一份，而是分布在一整塊計算網格中的所有部分。

因此，Noam總結說：

想推理得快，核心問題就是——你這一群芯片，總共能提供多少內存帶寬？

AI加速發展，人類路在何方？

他補充了一些其他對硬件設計的「愿望清單」。

1.低精度（Low Precision）

在傳統科學計算中，精度至關重要。

但在LLM中，模型本身就具有一定「模糊性」，低位數往往影響不大。

因此，低精度換算力完全合理，能用8-bit、甚至4-bit來換更多FLOPs，值得如此做。

行業確實在嘗試越來越低的精度格式（FP8、INT4、二進制等）——只要能保持收斂，越低越好。

當然，不能犧牲可重復性。

核心挑戰是「訓練時精度夠用」「推理時誤差夠小」。

2.可復現性（Determinism）

Noam認為這是關鍵，因為機器學習實驗的失敗率本就很高。

很多時候你都不知道，某個結果失敗，是因為模型結構不對，數據有問題，還是你代碼里有bug。

如果每次訓練都跑出不同結果，那連「調試」都無從下手。

他回憶早期在Google Brain做異步訓練的時候，經常出現「這次跑通了，下次又崩了」的情況，工程體驗極差。

所以，他給硬件設計者的建議是：

除非你能給我10倍性能，否則請不要犧牲可重復性。

3.運算溢出與精度損失問題

有現場觀眾提問：低精度運算經常會溢出或出現不穩定，怎么處理？

Noam回答：

確保accumulator（累加器）使用更高精度；

或者進行裁剪（clipping），不要讓數值爆掉；

最差的方案是「數值回繞」（wrap around）。

主持人Cliff補充了一句俏皮話：

我們要的是，加載checkpoint后，機器要按原樣崩掉 ——

這才算真正的可重復性。

Waymo工程師提出的一個刁鉆問題：如果今天起硬件就不再進步，我們還能搞出通用人工智能（AGI）嗎？

Noam給出意外但堅定的回答：可以。

他指出，AI會加速自身發展，推動軟件、系統設計持續進化，即使硬件原地不動，我們也能靠軟件層面的革新繼續進步。

當然——他話鋒一轉：不過如果你能繼續搞出更好的硬件，自然更好。

如果AGI真的到來，人類又該何去何從？

AI是拯救還是終結人類？

在算力和數據的驅動下，AI不斷向更復雜的領域進發。

「只要投喂足夠的數據和算力，就有可能學習并揭示宇宙的內在結構?！?/strong>

在最近的訪談中，微軟AI的CEO Mustafa Suleyman如此說。

他指出，當前的LLM（大語言模型）還只是「單步預測引擎」，尚處于AI發展的早期階段。

但隨著持久記憶和長期預測能力的加入，LLM將有望發展為具備完整規劃能力的「行動型AI」：

不僅能像人類一樣制定復雜計劃，還能持續執行任務。

這一飛躍可能在2026年底前實現。

Suleyman用「breathtaking」（驚艷）來形容這一未來，并強調，我們還只是剛剛起步，一切都將很快發生深刻變化。

25歲豪賭未來AI，如今預測AI失業潮

時間回到2010年，智能手機才剛剛普及、應用商店尚在萌芽，AI更像是科幻小說的陳詞濫調，而非嚴肅的科學課題，即使是頂尖學者也對此不屑一顧。

當時年僅25歲的Mustafa Suleyman與兩位「勇敢而有遠見的」聯合創始人Demis Hassabis和Shane Legg，卻篤信一個革命性的理念：

如果能創造出真正理解人類的智能，那將是改善人類狀況的最佳機會。

Suleyman尖銳地指出，歷史上充滿了帶來「凈傷害」的發明。

因此，在AI這項「有史以來最強大的通用技術」面前，從價值觀出發，將人類福祉置于首位，不是一句空洞的口號，而是一個必須時刻堅守的起點。

但Suleyman直言，在未來20年內，將面臨大規模的失業潮。

今天許多白領從事的「認知上的體力勞動」，如數據錄入、郵件處理等，將被AI高效替代。

他直言，這些恐懼「非常真實」，并強調政府必須強力介入，通過稅收等再分配機制來緩沖這一社會巨變。

在此基礎上，他提出了自己著作《即將到來的浪潮》中的核心概念——「遏制困境」（The Containment Problem）。

他指出，技術的趨勢是讓權力被小型化、集中化，并以極低的成本普及給每個人。

當AI成為一個可以代表你打電話、寫代碼、執行計劃的智能體時，每個人執行自己想法的成本和時間都將趨近于零。

這將帶來巨大的創造力爆發，但同時也埋下了沖突的種子。

「如果我能點擊一個按鈕執行我瘋狂的想法，你也能，那將引起大量的沖突?！?/p>

「摩擦對于維持和平與穩定很重要，」Suleyman一針見血地指出。當執行一件事情的阻力（摩擦）消失時，混亂就可能接踵而至。

如何「遏制」這種以零邊際成本擴散的力量，是我們時代最嚴峻的考驗。

何時應該「拔掉電源」

在所有對AI的擔憂中，最令人恐懼的莫過于「失控」。

對此，Suleyman明確劃出了四條不可逾越的紅線。

一旦一個AI同時具備以下能力，它將成為一個需要「軍事級別干預」才能阻止的系統：

遞歸式自我改進（能修改自己的核心代碼）
自主設定目標
獲取自身資源
在世界上自主行動

這引出了一個關鍵問題：我們能「拔掉電源」嗎？

答案是肯定的，因為AI存在于物理的數據中心里。

但真正的挑戰在于，我們如何識別那個時刻的到來，以及如何集體做出關停的決定。

重新定義「你的飯碗」

對于AI引發的失業恐慌，Suleyman提供了一個更為烏托邦的視角。

他引用瑞典的理念——「我們不關心工作崗位，我們關心工人」，并將其推向極致。

他認為，社會的任務不應是為人們創造「飯碗」，而是創造一個和平、支持性的環境，讓人們找到自己的激情，過上充實的生活。

「我夢想一個人們可以自己選擇做什么并擁有真正自由的世界。」

他相信，如果技術應用得當，產生的巨大價值足以讓社會資助人們去追求這些真正有意義的事情。

這將釋放巨大的創造力，但也會帶來深刻的存在主義問題：「我是誰？我為什么在這里？」

參考資料：

https://youtu.be/v0beJQZQIGA

https://youtu.be/tQ5wO1lznCQ

https://www.servethehome.com/thank-you-for-the-supercomputers-google-predictions-for-the-next-phase-of-ai-at-hot-chips-2025/

為偉大思想而生！

AI+時代，互聯網思想（wanging0123)，

第一必讀自媒體

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網易首頁下載網易新聞客戶端

相關推薦

熱點推薦

辭任杭州市市長后，姚高員已任浙江省政府黨組成員

澎湃新聞 2026-04-28 14:24:00
159 跟貼 159

網傳深圳東部華僑城結業、閉園？最新回應：不實

魯中晨報 2026-04-28 17:08:10
296 跟貼 296

南都報道后，區長現場督辦！廣州天河這條路“驚心”變順心

南方都市報 2026-04-28 15:12:23
198 跟貼 198

上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
15229 跟貼 15229

又一省份推動帶薪休假落地

澎湃新聞 2026-04-28 11:11:03
102 跟貼 102

31省份去年常住人口數據公布

第一財經資訊 2026-04-28 18:58:16
733 跟貼 733

4秒58！上海小將趙一程創造新的世界紀錄！

澎湃新聞 2026-04-28 15:13:06
980 跟貼 980

微信緊急公告：立即掛斷，不要回答！

第一財經資訊 2026-04-28 10:33:04
519 跟貼 519

比亞迪：旗下部分車型選裝天神之眼B輔助駕駛激光版的價格將從9900元上調為12000元

界面新聞 2026-04-28 15:38:04
814 跟貼 814

文旅部集中整治景區擺渡車，點名龍虎山、長白山、稻城亞丁等

南方都市報 2026-04-27 16:21:12
2131 跟貼 2131

80多萬買的新房未交房竟成工人臨時宿舍，業主要求減免物業費遭開發商拒絕相關部門介入協調

紅星新聞 2026-04-28 19:46:29
195 跟貼 195

深圳“電雞”治理別只靠勸！專家：人海戰術撐不起長效秩序

南方都市報 2026-04-28 07:00:37
502 跟貼 502

撒貝寧獲全國五一勞動獎章

閃電新聞 2026-04-28 16:25:55
218 跟貼 218

山東景區爭議：1996年前出生算老年人嗎？工作人員回應

南風不及你溫柔 2026-04-29 05:23:23
0 跟貼 0

今年“五一”假期小客車上高速繼續免收通行費

界面新聞 2026-04-28 14:05:28
71 跟貼 71

哲思 | 人生三修：靜心，穩事，柔行

人民論壇 2026-04-28 21:18:06
11 跟貼 11

繼續破紀錄，72小時訂單超10萬：比亞迪大唐這次會動M9的蛋糕嗎？
藍色海邊
2026-04-28 14:24:53

刻不容緩！中央政治局定調，釋放大信號！看清大局，中國全面出手！
互聯網思想
2026-04-28 23:24:38

美股三大指數集體收跌，道指跌0.06%，納指跌0.9%，標普500指數跌0.49%，熱門科技股多數下跌，博通跌超4%，英偉達跌超1%。
財聯社
2026-04-29 04:08:08

夏洛特公主長相絕了！有戴妃的甜美，凱特的凌厲，也有女王的霸氣
小魚愛魚樂
2026-04-28 09:28:11

斯諾克賽程：趙心童2次出場對陣墨菲，吳宜澤先戰8局，世界冠軍PK
劉姚堯的文字城堡
2026-04-28 09:37:20

美股收盤：OpenAI相關股票承壓三大指數集體下跌
財聯社
2026-04-29 05:39:18

陳思誠找小21歲阮巨不是瞎了眼：他比誰都精，要的是情緒穩定
小貓娛樂叭叭
2026-04-27 20:42:52

溫州民商銀行9.9%股權易主，浙商大佬仇建平輾轉入局
達摩財經
2026-04-26 09:32:45

美聯合10國對中國發起猛攻，中方不隔夜強力反制
至今
2026-04-29 03:03:01

砸進六個師，談判桌都不給！鐵了心的以色列，真主黨在劫難逃嗎？
寰球經緯所
2026-04-27 23:35:08

5月1日正式開刀！3萬就立案，所有打工人都要警惕
洞見小能手
2026-04-27 21:17:44

1976年，江青被捕入獄后，兩個人趁著深夜去看她，江青丑態畢露
兵鑒史
2026-04-29 03:01:16

下課！曝張慶鵬無緣率隊進季后賽將卸任北控主帥僅執教一季
醉臥浮生
2026-04-28 21:15:10

驚掉下巴！39 歲鄭欣宜暴瘦現身，整張臉瘦脫形，差點沒認出來
橙星文娛
2026-04-28 09:29:00

南京二級高級警長李才玉案2026年5月9日開庭
安志軍律師
2026-04-28 19:00:40

泡泡瑪特推出Labubu冰箱，售價5999元，上千人預約
大象新聞
2026-04-26 13:01:02

云南“14歲男生奸殺同班女生”被判無期，受害人家屬將申請抗訴
新京報
2026-04-28 19:36:18

阿sa蔡卓妍宣布結婚，阿嬌鐘欣潼發文祝福：很開心你等到了那個合拍又珍視你的人，看著你被愛意包裹，滿心滿眼都是溫柔幸福，真的好欣慰
極目新聞
2026-04-28 13:14:42

放話了，太陽隊老板在球隊被雷霆隊首輪橫掃后稱已開始籌劃下一步
好火子
2026-04-29 00:26:37

比披絲巾更可怕的是“瑜伽褲外穿”，廉價又卡襠，三角區更尷尬
生命之泉的奧秘
2026-03-20 03:56:49

2026-04-29 06:27:00

互聯網思想

AI時代，互聯網思想觀察

2434文章數 16907關注度

往期回顧全部

科技要聞

10億周活目標落空！傳OpenAI爆發內部分歧

7年獨家協議終止！OpenAI拿回自由，微軟卻沒虧

馬斯克訴OpenAI案正式開庭首富索賠1340億美元

DeepSeek V4上線三天，第一批實測出來了

發改委：依法依規禁止外資收購Manus項目

頭條要聞

美國：對35個伊朗相關實體及個人實施制裁

阿聯酋宣布退出歐佩克阿聯酋能源部長回應

19歲中國女孩被困緬甸交20萬贖金園區仍未放人

伊朗軍方：戰爭尚未結束軍隊嚴陣以待

媒體:臺海軍退役少校登烏魯木齊艦給出的結論很直接

頭條要聞

美國：對35個伊朗相關實體及個人實施制裁

阿聯酋宣布退出歐佩克阿聯酋能源部長回應

19歲中國女孩被困緬甸交20萬贖金園區仍未放人

伊朗軍方：戰爭尚未結束軍隊嚴陣以待

媒體:臺海軍退役少校登烏魯木齊艦給出的結論很直接

體育要聞

魔術黑八活塞，一步之遙？！

廣州17分大勝1-0廣東徐昕13+11弒舊主胡明軒0分

CBA-遼寧反客為主1-0山東趙繼偉14+7莫蘭德12+14

13年后回歸？63歲穆帥成皇馬新帥首選！老佛爺欽點解約金300萬歐

10年19冠！曼城官宣31歲功勛自由身離隊周薪25萬意甲3豪門哄搶

娛樂要聞

蔡卓妍官宣結婚，老公比她小10歲

孫楊私生子風波持續發酵！孩子近況罕見曝光

張凌赫被曝身體病癥，獨立起身困難

《浪姐7》何宣林疑似被“孤立”

斬獲影帝僅1天，央媒公開銳評于和偉演技

財經要聞

中央政治局會議定調，八大看點速覽！

OpenAI與微軟“離婚”了，反目成仇還是好聚好散

黃金珠寶行業調整年：從渠道變革到文化品牌的價值重估

中東戰火“燒”到北京車展？最愛車的經濟學家李稻葵：燃油車還能買，但這幾類車企危險了

“超預期”后還有好牌！政治局會議釋放關鍵信號

汽車要聞

拒絕瘋狂套娃！現代艾尼氪金星長在未來審美點上

阿維塔科技：五載深耕中的堅守與進化

21.99萬起極狐問道V9開啟預售定義東方科技旗艦MPV新標準

埃安N60上市10.68萬起標配激光雷達/零重力座椅

嵐圖汽車：以體系力破局內卷以確定性奔赴全球

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戲

數碼

藝術

公開課

本地新聞

用青花瓷的方式，打開西溪濕地

云游中國｜逛世界風箏都留學生探秘中國傳統文化

SAGA GIRLS 2026女團選秀

春色滿城關不?。座N梅浪漫盛放，吳山藏了一片四月雪

這不爽翻了?曝PS6或能穩穩運行60幀+光追的游戲畫面

《烽沙》游先看試玩報告：我在東周養刁民"/> 主站商城論壇自運營登錄注冊《烽沙》游先看試玩報告：我在東周養刁民泥頭車 2026-04-28...

《斬業人》游先看試玩報告：銀河酆都城"/> 主站商城論壇自運營登錄注冊《斬業人》游先看試玩報告：銀河酆都城 Marvin 2026-04-2...

《生化危機9》為何沒有艾達王？故事不需要她

數碼要聞

機械革命蒼龍16 / 18 Pro游戲本RTX 5070 12GB款開啟預約

韶音推出OpenSwim Pro 2運動耳機，1898元

NVIDIA正式發布GeForce RTX 5070筆記本電腦GPU 12GB版本

系統更新意外泄密三星智能眼鏡功能曝光支持快速配對

藝術要聞

趙樸初：比風水厲害100倍的宇宙定律

這小寫意，筆精墨妙

京東浙江總部公示，99.99米高，中國第一民企落子民營大??！

這些女神，竟然都是攝影師切爾尼亞季耶夫的復古作品！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

七個無法存下錢的壞習慣

李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

谷歌最貴叛徒演講曝光：《下一階段AI的預測》

10億周活目標落空！傳OpenAI爆發內部分歧

美國：對35個伊朗相關實體及個人實施制裁

美國：對35個伊朗相關實體及個人實施制裁

魔術黑八活塞，一步之遙？！

蔡卓妍官宣結婚，老公比她小10歲

中央政治局會議定調，八大看點速覽！

拒絕瘋狂套娃！現代艾尼氪金星長在未來審美點上

態度原創

用青花瓷的方式，打開西溪濕地

這不爽翻了?曝PS6或能穩穩運行60幀+光追的游戲畫面

機械革命蒼龍16 / 18 Pro游戲本RTX 5070 12GB款開啟預約

趙樸初：比風水厲害100倍的宇宙定律

10億周活目標落空！傳OpenAI爆發內部分歧

魔術黑八活塞，一步之遙？！

蔡卓妍官宣結婚，老公比她小10歲

中央政治局會議定調，八大看點速覽！

拒絕瘋狂套娃！現代艾尼氪金星長在未來審美點上

用青花瓷的方式，打開西溪濕地