網易首頁 > 網易號 > 正文申請入駐

英偉達CEO斯坦福演講：未來十年AI行業行動指南

2026-06-11 16:21:21　來源: Trend求索

北京舉報

分享至

黃仁勛解讀全棧設計、推理能耗、智能體架構，深度駁斥 AI 威脅論

2026 年 6 月 10 日

2026年5月，英偉達首席執行官黃仁勛應邀在斯坦福大學CS 153前沿系統課程上發表演講。

黃仁勛經常提到一個數字，很多人都理解錯了：一百萬倍。這指的是過去十年，英偉達將整體算力提升了一百萬倍；而如果僅依靠摩爾定律，同期算力增幅僅有十倍。

正是這種差距才讓人工智能得以落地生根。也正因算力迎來爆發式增長，科研人員得以使用全網海量數據訓練模型，無需再人工精挑細選數據集；各行各業的變革也提前到來，而非等到 2040 年。

本文深度拆解黃仁勛在斯坦福大學前沿系統課程上的演講精華，整理出十大核心要點，適合所有創業者、企業管理者與投資人參考學習。

1. 算力百萬倍增長的核心邏輯，是未來十年最重要的戰略啟示

摩爾定律放緩已持續十年之久。

“依托全棧協同設計模式，英偉達在十年間實現了十萬倍至一百萬倍的算力提升。達到這個量級后，具體數值區間已經不再重要。”

2015 年前后，登納德縮放定律失效。失去這一支撐后，摩爾定律十年內可能僅能實現十倍左右的性能增長。半導體物理的發展已經觸及瓶頸，但英偉達依舊完成了百萬倍的算力突破。

實現突破的核心就是協同設計：將中央處理器、圖形處理器、網絡設備、交換機、存儲、軟件以及編譯器圍繞同一目標同步優化，而非讓各個團隊各自負責單一模塊。正是這套垂直整合邏輯，讓一家硬件企業實現了收益的復利增長。

黃仁勛以精簡指令集架構（RISC）舉例佐證：斯坦福大學學者約翰?亨尼斯早已證明，編譯器與精簡指令集協同優化，效果遠優于兩套系統獨立迭代，整體效能始終大于各部分效能之和。將這套邏輯應用到完整計算架構中，便能實現百萬倍級的性能飛躍。

算力暴漲，不只是讓計算機運行速度變快，更是開辟了全新的發展空間。當算力提升百萬倍，科研人員不再糾結數據篩選，而是直接使用全網信息開展研究。現代 AI 的誕生，依靠的并非某一項算法突破，而是這套全新的設計理念。

行動建議： 在做架構規劃前，先判斷你是在單獨優化某一模塊，還是在開展跨層級的協同設計。這個答案，決定了你團隊的發展上限。

2. 斥資數十億打造無人問津的系統，第一性原理是決策底氣

目前市面上售價最高的傳統超級計算機，造價約為 3.5 億美元。

“我們打造的系統耗資數十億美元，放眼市場，當時沒有任何潛在客戶。市面上最貴的同類產品僅 3.5 億美元，我們的產品體量遠超于此，相當于在一個零需求市場布局。”

黃仁勛沒有依賴傳統市場調研，而是用第一性原理推演行業趨勢：大模型預訓練的算力需求未來會呈指數級上漲，支撐大規模訓練的系統造價也會創下新高。即便當時暫無明確客戶，英偉達依舊毅然投入研發。后來的 Hopper 架構（如 H100）正是基于這一判斷打造，產品落地之時，生成式 AI 的爆發讓市場需求恰好全面爆發。

這件事帶來的啟發，遠不止“逆勢布局”這么簡單。市場調研只能反映客戶當下的需求，而第一性原理思維，能結合技術底層的本質規律，預判客戶未來的剛需。前者立足當下做優化，后者著眼未來做布局，優秀的創業者總能分清二者的區別。

行動建議： 復盤你核心產品的布局思路，判斷決策依據是用戶訪談、競品分析，還是第一性原理推演。如果無法區分，這就是當下最需要解決的戰略問題。

3. 推理環節才是 AI 盈利核心，多數團隊都找錯了優化方向

訓練賦予模型智能，推理讓智能落地商用，整個 AI 產業的商業價值都圍繞推理環節實現。

“對比上一代產品，我們兩年內將推理性能提升了 50倍。而按照摩爾定律，同期性能增幅僅為 2 倍。”

絕大多數工程師都搞錯了核心瓶頸：文本生成（LLM推理）本質上屬于帶寬受限型任務，而非算力受限型任務。 預填充階段負責處理上下文信息，解碼階段負責逐一生成文本；解碼環節對內存帶寬（Memory Bandwidth）的需求極高，單顆芯片根本無法承載，這也成為整個流程的短板。

英偉達推出 Blackwell NVLink 集成互聯架構，將數十顆芯片整合為機柜級一體化計算系統，直擊內存帶寬瓶頸，在兩年內實現 50 倍推理性能提升。協同設計的復利效應就此顯現：十年百萬倍的算力飛躍，正是由一次次數十倍的性能提升疊加而來。

不少團隊一味死磕 MFU（模型浮點運算利用率），實則選錯了考核指標。黃仁勛認為，寧可預留充足冗余、保持較低的運算利用率，也不要為了跑滿 100% 的表面指標，導致各類業務負載（Workloads）都受到阿姆達爾定律（Amdahl's law）的嚴重制約。優化要直擊真實瓶頸，而非執著于容易統計的表面數據。

行動建議： 梳理團隊當前的研發與工程優化指標，剔除那些看似漂亮、實則和核心性能/成本瓶頸無關的考核項。

4. 斯坦福坐擁 400 億捐贈基金卻無超級計算機，問題不在芯片而在機制

當下在宏觀上并不存在絕對的芯片短缺問題，真正的癥結在有些機構的預算架構不合理。

“頂尖高校的各院系通常獨立申請科研經費，單筆資金規模有限，不足以搭建共享的大型頂級計算設施；各部門資源互相割裂，最終整座校園里師生都只能使用普通筆記本或租用零散算力，全校沒有一臺共享的超級計算機。”

黃仁勛給出了非常直接的解決方案：斯坦福手握 400 億美元捐贈基金，只需劃出 10 億美元，對接主流云服務商，當年就能讓全體學生用上頂級 AI 超級計算機。芯片和資金都可以協調，阻礙發展的是落后的資源分配機制。

關于管理與權責，他的觀點尤為犀利：當你告訴團隊“這不是你們的錯（Fault）”時，其實也無形中剝奪了他們的主觀能動性（Agency）——因為責任與掌控權本質上是一回事。將問題歸結為“客觀條件不足”，往往是在逃避解決問題的主動權。

大型企業也普遍存在同類問題：預算分散、算力資源形成部門壁壘，全員都高喊算力不足。能夠率先打破壁壘、統籌整合算力資源的機構，將主導未來十年的行業發展。

行動建議： 盤點團隊當前所有的算力與數據資源，梳理出分散閑置、可統籌復用的部分。將其定性為公司管理與預算架構問題，而非外部資源短缺問題。

5. 上一次計算領域迎來顛覆性變革在 1964 年，以此為節點復盤產品邏輯

這是一場徹底的行業重構，而非普通的技術迭代。

“如今，軟件開發模式、神經網絡運行邏輯、應用能力邊界都發生了巨變，整個計算體系迎來根本性革新。”

1964 年，IBM System/360 計算機確立了沿用至今的通用計算范式。此后的個人電腦、互聯網、移動設備、云計算，全都建立在這套體系之上：軟件由人工預先編寫并編譯成二進制文件，計算機嚴格執行既定指令。這套模式整整沿用了 60 年。

而神經網絡的運行邏輯和傳統編譯代碼截然不同，徹底打破了舊范式的所有固有認知：

軟件開發重構： 軟件不再依靠人工逐行編寫，而是通過數據訓練（Training）自動生成；
內容生產重構： 內容不再是從存儲器中靜態調取，而是由大模型實時動態生成；
人機交互重構： 計算機不僅能被動執行顯性指令，還能深度理解人類的模糊意圖；
能力重構： 以往依賴人類高階感知能力才能實現的應用，如今借助端到端 AI 均可高效落地。

英偉達的端到端自動駕駛訓練集群就是最好的證明。在傳統計算架構下，自動駕駛技術因長尾場景遲遲難以突破；而全面轉向深度學習后，整個賽道迎來全新發展機遇。真正的行業重構，是開辟全新可能性，而非在原有基礎上小幅提速。

行動建議： 深入復盤你公司產品的底層邏輯，找出哪些模塊仍被束縛在傳統計算范式中。這些過時的假設，要么隱藏著你最大的覆滅風險，要么孕育著你最大的時代機遇。

6. GPT 問世便注定智能體時代到來，先行者已提前搭建底層基建

生成式 AI 的價值，不只是生成漂亮的圖文內容，幕后是讓“思考過程”變得肉眼可見。

“模型內部生成 Token，本質就是思考；對外輸出 Token、調用工具，就是工具使用。因此在幾年前 GPT 推出時，當下的智能體發展趨勢就已經可以預判。”

在黃仁勛眼中，GPT 不只是聊天機器人，文本生成的底層機制本身就在模擬人類思考。模型內部生成的字符對應邏輯推理，對外生成的字符對應工具調用，智能體（Agent）的爆發是技術演進的必然結果，而非憑空設想。

從 GPT 落地至今，業內攻克了諸多工程難題：實現大規模分步推理訓練、優化模型穩定性、完善配套工具鏈。只要吃透底層技術原理，行業走向是完全可以清晰預判的。

當下的趨勢同樣明朗：智能體時代全面到來，持續型計算（Continuous Computing）正在逐步取代傳統按需調用的計算模式。所有基于舊模式搭建的系統，都需要重構。早早看清趨勢、布局底層基建的創業者，如今已進化為行業的上游服務商。

行動建議： 結合當前大模型分步推理的技術現狀，預判下一階段智能體對基礎設施的需求并提前落地布局。如果暫時無法做出判斷，補齊團隊的技術原理認知是首要任務。

7. 開源模型并非公關博弈，三大核心價值遠超表面噱頭

英偉達在內部業務中調用 Anthropic、OpenAI 等閉源模型的頻次位居全球前列，但這和他們大力布局開源模型并不矛盾。

“全球有眾多小語種，主流實驗室不會將其列為優先研發重點。如果沒有機構主動深耕，這些語種的 AI 應用永遠無法發展成熟。”

開源模型有三大長期被行業低估的核心價值：

覆蓋邊緣語種與文化： 全球有兩百多種語言難以得到頂級閉源實驗室的深度微調支持。英偉達開源 Nemotron 等模型，讓各地科研人員無需從零起步，就能針對本土語種進行定制優化，這是服務全球智能化的重要基建。
融入人類先驗知識： 最新的 AI系統不再是盲目堆砌純數據，而是將語言模型與世界認知模型（World Model）結合。依托人類過往的先驗經驗，系統僅需數百萬公里訓練數據即可在特定工程領域成型，遠少于傳統方案所需的數十億公里，大幅降低對極限數據的依賴。
安全可控與透明性： 閉源黑盒模型會讓網絡安全陷入無序的軍備競賽，漏洞極難排查。開源透明才是安全防護的基礎。

行動建議： 針對企業自研或正在使用的領域專用模型，嘗試融合搭載人類先驗知識的輕量化開源模型，判斷能否在特定工作負載中減少對海量數據的依賴。

8. Rubin 并非新型訓練芯片，而是首款專為智能體設計的計算機

智能體的運算模式，和傳統大模型的集群訓練（Training Cluster）完全不同。

“一套造價數十億美元的 AI 系統發出工具調用指令，任務會轉由 CPU 執行。而整套高端 GPU 集群，只能原地等待單顆 CPU 完成工作。”

傳統云計算架構，根本無法適配智能體的三大核心運行需求：

極低延遲的長期記憶： 智能體的記憶必須存儲在與處理器直連的高速存儲設備中，傳統網絡存儲的數據傳輸延遲會嚴重拖慢效率；
高單線程性能： 工具調用極度依賴 CPU。但傳統云端 CPU 主打并行吞吐量（多核心獨立任務），而智能體恰恰相反，需要單線程、極低延遲的串行運算能力。這導致昂貴的 GPU 集群常會因為等待單個 CPU 線程而陷入停滯。

因此，存儲與 CPU 架構都需要圍繞智能體的運行邏輯重新設計。英偉達未來的 Rubin 架構以及下一代 Vera 架構，便是為此而生，它們的大概率演進方向正是面向多層級、套娃式的“智能體集群控制（Agents running sub-agents）”場景。這套方法論十分明確：先理清真實運算模式，找準與傳統架構的差異，再針對性搭建系統。

行動建議： 深度梳理你當前智能體任務的運算流程，定位延遲產生的關鍵環節。如果你的架構與智能體業務不匹配，這個架構缺陷就是你目前面臨的性能天花板。

9. AI 能耗或將暴漲至當前千倍，行業趨勢已逐步形成

繼芯片之后，能耗成為第二大核心瓶頸，這一趨勢已經持續多年，但很多人至今后知后覺。

“未來 AI 計算所需能源，大概率會達到目前的一千倍。即便最終數值和這個預估存在幾個數量級的差距，也在情理之中。”

背后是計算模式的結構性變革：傳統計算為按需檢索模式，服務器閑置待命，收到請求后響應，完成任務再次休眠，能耗和查詢次數線性掛鉤。而新一代 AI 是生成式持續運行模式，模型全天候在線、實時感知信息并持續推理。二者的能耗邏輯截然不同。

面對能耗瓶頸，行業領先者通常手握兩大優化方向：

微觀層面： 極致提升“單位能耗的內容生成效率（Tokens per Watt）”；
宏觀層面： 從芯片底層出發，通過全棧協同設計，實現機柜級和數據中心級的整體能效優化。

外部機遇則來自能源基建。幾年前，太陽能、核能等新能源還需要政策補貼才能維持運營；如今 AI 龐大的算力需求，正推動市場資本自發、主動地涌入新能源建設。當下是發展可持續能源的黃金時期，旺盛的市場需求足以支撐清潔能源產業資本實現長周期自主循環。

行動建議： 在評估或開發推理鏈路時，將“單位能耗Token產出”列為戰略級指標。未來三年，在該維度保持領先的團隊，將形成難以被跨越的成本護城河。

10. AI 末日論毫無依據，這類論調本身就無法被證偽

在 AI 風險與安全防護這個話題上，黃仁勛態度鮮明，毫不妥協。

“所謂‘人類無法理解 AI 運行原理’‘AI 會瞬間變得超強并掌控世界’，全都是無稽之談。”

典型的末日論調認為：AI 會在某個未知時間點突然實現能力爆炸，人類無法預判、無法防御，甚至文明都會受到威脅。

黃仁勛的反駁有理有據：人類從數學和工程上早已掌握 AI 系統的運行原理，模型能力是隨著技術投入、計算算力和架構迭代穩步提升的，安全防護體系也可隨著版本的演進進行落地測試。整個行業發展軌跡清晰可預判，和“AI 突然瞬間失控”的敘事完全相悖。理性探討 AI 安全和治理，與刻意制造恐慌的末日論，有著本質區別。

這類不實言論危害深遠。很多優秀的學生和年輕人正在選擇專業方向，輿論會左右他們的判斷。如果年輕一代被灌輸了“AI 充滿未知危險”的恐懼，大家會轉向政策主張限制技術發展，而非投身基礎研發，最終將技術賽道拱手讓人。

GPU 屬于通用計算設備，全球數十億人都在使用，廣泛應用于醫療影像、物流調度、氣候模擬等領域。將 AI 粗暴地類比為原子彈，會嚴重擾亂理性思考，基于這類敘事制定的政策，也必然偏離正軌。

行動建議： 看到各類 AI 安全相關言論時，先判斷其是否具備科學上的“可證偽性”。如果沒有任何論據能夠推翻該觀點，那它只是主觀焦慮的情緒敘事，而非嚴謹的安全討論。

總結：計算架構全面重構，不同角色的行動方向

黃仁勛的核心觀點，并非只聚焦芯片技術，而是將全棧協同設計奉為通用準則：單獨優化某一模塊，增長存在明顯上限；跨層級整合設計，才能實現復利式突破。 這套邏輯，同樣適用于硬件研發、產品架構與企業組織管理。

創業者： 智能體運算模式和傳統訓練集群差異巨大，務必圍繞真實業務場景搭建架構，確保基礎設施匹配工作負載。未來 24 個月內吃透這套邏輯的團隊，將有機會打造出通用的底層平臺。
投資人： 能耗是長期結構性瓶頸，如今市場體量足以支撐新能源產業自主發展。長期價值將向高能效推理、智能體專用基建以及能源賽道集中。企業過往的行業地位不代表未來實力，擅長第一性原理思考的團隊更值得提前布局。
企業運營者與工程師： 沿用 60 年的傳統計算范式已經被顛覆。吃透這一變革本質的團隊，會完成架構的徹底重構；僅將其視作普通技術升級的團隊，未來十年都將在過時的邏輯里反復踩坑。
行業新人： 當下是計算領域機遇最廣闊的時代，全棧技術體系都在被重新定義。善于洞察變革、深度思考底層邏輯的人，將成為行業重構的主導者。

三大核心行動原則

全棧協同設計制勝： 單一模塊優化有上限，全鏈路整合才能突破瓶頸；
運算模式決定架構： 落地開發前先理清真實計算的物理邏輯，否則一切都是盲目嘗試；
趨勢有跡可循： GPT 催生智能體，智能體終將催生集群協同。立足現有信號推演趨勢，而非被動等待市場達成共識。

整個計算體系已然改變，這是六十年來，重塑行業的最佳時機。

本文編譯自substack，原文作者The AI Corner

https://www.the-ai-corner.com/p/jensen-huang-stanford-cs153-playbook-2026

聲明：內容由AI生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.