黃仁勛解讀全棧設計、推理能耗、智能體架構,深度駁斥 AI 威脅論
2026 年 6 月 10 日
![]()
2026年5月,英偉達首席執行官黃仁勛應邀在斯坦福大學CS 153前沿系統課程上發表演講。
黃仁勛經常提到一個數字,很多人都理解錯了:一百萬倍。這指的是過去十年,英偉達將整體算力提升了一百萬倍;而如果僅依靠摩爾定律,同期算力增幅僅有十倍。
正是這種差距才讓人工智能得以落地生根。也正因算力迎來爆發式增長,科研人員得以使用全網海量數據訓練模型,無需再人工精挑細選數據集;各行各業的變革也提前到來,而非等到 2040 年。
本文深度拆解黃仁勛在斯坦福大學前沿系統課程上的演講精華,整理出十大核心要點,適合所有創業者、企業管理者與投資人參考學習。
1. 算力百萬倍增長的核心邏輯,是未來十年最重要的戰略啟示
摩爾定律放緩已持續十年之久。
“依托全棧協同設計模式,英偉達在十年間實現了十萬倍至一百萬倍的算力提升。達到這個量級后,具體數值區間已經不再重要。”
2015 年前后,登納德縮放定律失效。失去這一支撐后,摩爾定律十年內可能僅能實現十倍左右的性能增長。半導體物理的發展已經觸及瓶頸,但英偉達依舊完成了百萬倍的算力突破。
實現突破的核心就是協同設計:將中央處理器、圖形處理器、網絡設備、交換機、存儲、軟件以及編譯器圍繞同一目標同步優化,而非讓各個團隊各自負責單一模塊。正是這套垂直整合邏輯,讓一家硬件企業實現了收益的復利增長。
黃仁勛以精簡指令集架構(RISC)舉例佐證:斯坦福大學學者約翰?亨尼斯早已證明,編譯器與精簡指令集協同優化,效果遠優于兩套系統獨立迭代,整體效能始終大于各部分效能之和。將這套邏輯應用到完整計算架構中,便能實現百萬倍級的性能飛躍。
算力暴漲,不只是讓計算機運行速度變快,更是開辟了全新的發展空間。當算力提升百萬倍,科研人員不再糾結數據篩選,而是直接使用全網信息開展研究。現代 AI 的誕生,依靠的并非某一項算法突破,而是這套全新的設計理念。
行動建議: 在做架構規劃前,先判斷你是在單獨優化某一模塊,還是在開展跨層級的協同設計。這個答案,決定了你團隊的發展上限。
2. 斥資數十億打造無人問津的系統,第一性原理是決策底氣
目前市面上售價最高的傳統超級計算機,造價約為 3.5 億美元。
“我們打造的系統耗資數十億美元,放眼市場,當時沒有任何潛在客戶。市面上最貴的同類產品僅 3.5 億美元,我們的產品體量遠超于此,相當于在一個零需求市場布局。”
黃仁勛沒有依賴傳統市場調研,而是用第一性原理推演行業趨勢:大模型預訓練的算力需求未來會呈指數級上漲,支撐大規模訓練的系統造價也會創下新高。即便當時暫無明確客戶,英偉達依舊毅然投入研發。后來的 Hopper 架構(如 H100)正是基于這一判斷打造,產品落地之時,生成式 AI 的爆發讓市場需求恰好全面爆發。
這件事帶來的啟發,遠不止“逆勢布局”這么簡單。市場調研只能反映客戶當下的需求,而第一性原理思維,能結合技術底層的本質規律,預判客戶未來的剛需。前者立足當下做優化,后者著眼未來做布局,優秀的創業者總能分清二者的區別。
行動建議: 復盤你核心產品的布局思路,判斷決策依據是用戶訪談、競品分析,還是第一性原理推演。如果無法區分,這就是當下最需要解決的戰略問題。
3. 推理環節才是 AI 盈利核心,多數團隊都找錯了優化方向
訓練賦予模型智能,推理讓智能落地商用,整個 AI 產業的商業價值都圍繞推理環節實現。
“對比上一代產品,我們兩年內將推理性能提升了 50倍。而按照摩爾定律,同期性能增幅僅為 2 倍。”
絕大多數工程師都搞錯了核心瓶頸:文本生成(LLM推理)本質上屬于帶寬受限型任務,而非算力受限型任務。 預填充階段負責處理上下文信息,解碼階段負責逐一生成文本;解碼環節對內存帶寬(Memory Bandwidth)的需求極高,單顆芯片根本無法承載,這也成為整個流程的短板。
英偉達推出 Blackwell NVLink 集成互聯架構,將數十顆芯片整合為機柜級一體化計算系統,直擊內存帶寬瓶頸,在兩年內實現 50 倍推理性能提升。協同設計的復利效應就此顯現:十年百萬倍的算力飛躍,正是由一次次數十倍的性能提升疊加而來。
不少團隊一味死磕 MFU(模型浮點運算利用率),實則選錯了考核指標。黃仁勛認為,寧可預留充足冗余、保持較低的運算利用率,也不要為了跑滿 100% 的表面指標,導致各類業務負載(Workloads)都受到阿姆達爾定律(Amdahl's law)的嚴重制約。優化要直擊真實瓶頸,而非執著于容易統計的表面數據。
行動建議: 梳理團隊當前的研發與工程優化指標,剔除那些看似漂亮、實則和核心性能/成本瓶頸無關的考核項。
4. 斯坦福坐擁 400 億捐贈基金卻無超級計算機,問題不在芯片而在機制
當下在宏觀上并不存在絕對的芯片短缺問題,真正的癥結在有些機構的預算架構不合理。
“頂尖高校的各院系通常獨立申請科研經費,單筆資金規模有限,不足以搭建共享的大型頂級計算設施;各部門資源互相割裂,最終整座校園里師生都只能使用普通筆記本或租用零散算力,全校沒有一臺共享的超級計算機。”
黃仁勛給出了非常直接的解決方案:斯坦福手握 400 億美元捐贈基金,只需劃出 10 億美元,對接主流云服務商,當年就能讓全體學生用上頂級 AI 超級計算機。芯片和資金都可以協調,阻礙發展的是落后的資源分配機制。
關于管理與權責,他的觀點尤為犀利:當你告訴團隊“這不是你們的錯(Fault)”時,其實也無形中剝奪了他們的主觀能動性(Agency)——因為責任與掌控權本質上是一回事。將問題歸結為“客觀條件不足”,往往是在逃避解決問題的主動權。
大型企業也普遍存在同類問題:預算分散、算力資源形成部門壁壘,全員都高喊算力不足。能夠率先打破壁壘、統籌整合算力資源的機構,將主導未來十年的行業發展。
行動建議: 盤點團隊當前所有的算力與數據資源,梳理出分散閑置、可統籌復用的部分。將其定性為公司管理與預算架構問題,而非外部資源短缺問題。
5. 上一次計算領域迎來顛覆性變革在 1964 年,以此為節點復盤產品邏輯
這是一場徹底的行業重構,而非普通的技術迭代。
“如今,軟件開發模式、神經網絡運行邏輯、應用能力邊界都發生了巨變,整個計算體系迎來根本性革新。”
1964 年,IBM System/360 計算機確立了沿用至今的通用計算范式。此后的個人電腦、互聯網、移動設備、云計算,全都建立在這套體系之上:軟件由人工預先編寫并編譯成二進制文件,計算機嚴格執行既定指令。這套模式整整沿用了 60 年。
而神經網絡的運行邏輯和傳統編譯代碼截然不同,徹底打破了舊范式的所有固有認知:
- 軟件開發重構: 軟件不再依靠人工逐行編寫,而是通過數據訓練(Training)自動生成;
- 內容生產重構: 內容不再是從存儲器中靜態調取,而是由大模型實時動態生成;
- 人機交互重構: 計算機不僅能被動執行顯性指令,還能深度理解人類的模糊意圖;
- 能力重構: 以往依賴人類高階感知能力才能實現的應用,如今借助端到端 AI 均可高效落地。
英偉達的端到端自動駕駛訓練集群就是最好的證明。在傳統計算架構下,自動駕駛技術因長尾場景遲遲難以突破;而全面轉向深度學習后,整個賽道迎來全新發展機遇。真正的行業重構,是開辟全新可能性,而非在原有基礎上小幅提速。
行動建議: 深入復盤你公司產品的底層邏輯,找出哪些模塊仍被束縛在傳統計算范式中。這些過時的假設,要么隱藏著你最大的覆滅風險,要么孕育著你最大的時代機遇。
6. GPT 問世便注定智能體時代到來,先行者已提前搭建底層基建
生成式 AI 的價值,不只是生成漂亮的圖文內容,幕后是讓“思考過程”變得肉眼可見。
“模型內部生成 Token,本質就是思考;對外輸出 Token、調用工具,就是工具使用。因此在幾年前 GPT 推出時,當下的智能體發展趨勢就已經可以預判。”
在黃仁勛眼中,GPT 不只是聊天機器人,文本生成的底層機制本身就在模擬人類思考。模型內部生成的字符對應邏輯推理,對外生成的字符對應工具調用,智能體(Agent)的爆發是技術演進的必然結果,而非憑空設想。
從 GPT 落地至今,業內攻克了諸多工程難題:實現大規模分步推理訓練、優化模型穩定性、完善配套工具鏈。只要吃透底層技術原理,行業走向是完全可以清晰預判的。
當下的趨勢同樣明朗:智能體時代全面到來,持續型計算(Continuous Computing)正在逐步取代傳統按需調用的計算模式。所有基于舊模式搭建的系統,都需要重構。早早看清趨勢、布局底層基建的創業者,如今已進化為行業的上游服務商。
行動建議: 結合當前大模型分步推理的技術現狀,預判下一階段智能體對基礎設施的需求并提前落地布局。如果暫時無法做出判斷,補齊團隊的技術原理認知是首要任務。
7. 開源模型并非公關博弈,三大核心價值遠超表面噱頭
英偉達在內部業務中調用 Anthropic、OpenAI 等閉源模型的頻次位居全球前列,但這和他們大力布局開源模型并不矛盾。
“全球有眾多小語種,主流實驗室不會將其列為優先研發重點。如果沒有機構主動深耕,這些語種的 AI 應用永遠無法發展成熟。”
開源模型有三大長期被行業低估的核心價值:
- 覆蓋邊緣語種與文化: 全球有兩百多種語言難以得到頂級閉源實驗室的深度微調支持。英偉達開源 Nemotron 等模型,讓各地科研人員無需從零起步,就能針對本土語種進行定制優化,這是服務全球智能化的重要基建。
- 融入人類先驗知識: 最新的 AI系統不再是盲目堆砌純數據,而是將語言模型與世界認知模型(World Model)結合。依托人類過往的先驗經驗,系統僅需數百萬公里訓練數據即可在特定工程領域成型,遠少于傳統方案所需的數十億公里,大幅降低對極限數據的依賴。
- 安全可控與透明性: 閉源黑盒模型會讓網絡安全陷入無序的軍備競賽,漏洞極難排查。開源透明才是安全防護的基礎。
行動建議: 針對企業自研或正在使用的領域專用模型,嘗試融合搭載人類先驗知識的輕量化開源模型,判斷能否在特定工作負載中減少對海量數據的依賴。
8. Rubin 并非新型訓練芯片,而是首款專為智能體設計的計算機
智能體的運算模式,和傳統大模型的集群訓練(Training Cluster)完全不同。
“一套造價數十億美元的 AI 系統發出工具調用指令,任務會轉由 CPU 執行。而整套高端 GPU 集群,只能原地等待單顆 CPU 完成工作。”
傳統云計算架構,根本無法適配智能體的三大核心運行需求:
- 極低延遲的長期記憶: 智能體的記憶必須存儲在與處理器直連的高速存儲設備中,傳統網絡存儲的數據傳輸延遲會嚴重拖慢效率;
- 高單線程性能: 工具調用極度依賴 CPU。但傳統云端 CPU 主打并行吞吐量(多核心獨立任務),而智能體恰恰相反,需要單線程、極低延遲的串行運算能力。這導致昂貴的 GPU 集群常會因為等待單個 CPU 線程而陷入停滯。
因此,存儲與 CPU 架構都需要圍繞智能體的運行邏輯重新設計。英偉達未來的 Rubin 架構以及下一代 Vera 架構,便是為此而生,它們的大概率演進方向正是面向多層級、套娃式的“智能體集群控制(Agents running sub-agents)”場景。這套方法論十分明確:先理清真實運算模式,找準與傳統架構的差異,再針對性搭建系統。
行動建議: 深度梳理你當前智能體任務的運算流程,定位延遲產生的關鍵環節。如果你的架構與智能體業務不匹配,這個架構缺陷就是你目前面臨的性能天花板。
9. AI 能耗或將暴漲至當前千倍,行業趨勢已逐步形成
繼芯片之后,能耗成為第二大核心瓶頸,這一趨勢已經持續多年,但很多人至今后知后覺。
“未來 AI 計算所需能源,大概率會達到目前的一千倍。即便最終數值和這個預估存在幾個數量級的差距,也在情理之中。”
背后是計算模式的結構性變革:傳統計算為按需檢索模式,服務器閑置待命,收到請求后響應,完成任務再次休眠,能耗和查詢次數線性掛鉤。而新一代 AI 是生成式持續運行模式,模型全天候在線、實時感知信息并持續推理。二者的能耗邏輯截然不同。
面對能耗瓶頸,行業領先者通常手握兩大優化方向:
- 微觀層面: 極致提升“單位能耗的內容生成效率(Tokens per Watt)”;
- 宏觀層面: 從芯片底層出發,通過全棧協同設計,實現機柜級和數據中心級的整體能效優化。
外部機遇則來自能源基建。幾年前,太陽能、核能等新能源還需要政策補貼才能維持運營;如今 AI 龐大的算力需求,正推動市場資本自發、主動地涌入新能源建設。當下是發展可持續能源的黃金時期,旺盛的市場需求足以支撐清潔能源產業資本實現長周期自主循環。
行動建議: 在評估或開發推理鏈路時,將“單位能耗Token產出”列為戰略級指標。未來三年,在該維度保持領先的團隊,將形成難以被跨越的成本護城河。
10. AI 末日論毫無依據,這類論調本身就無法被證偽
在 AI 風險與安全防護這個話題上,黃仁勛態度鮮明,毫不妥協。
“所謂‘人類無法理解 AI 運行原理’‘AI 會瞬間變得超強并掌控世界’,全都是無稽之談。”
典型的末日論調認為:AI 會在某個未知時間點突然實現能力爆炸,人類無法預判、無法防御,甚至文明都會受到威脅。
黃仁勛的反駁有理有據:人類從數學和工程上早已掌握 AI 系統的運行原理,模型能力是隨著技術投入、計算算力和架構迭代穩步提升的,安全防護體系也可隨著版本的演進進行落地測試。整個行業發展軌跡清晰可預判,和“AI 突然瞬間失控”的敘事完全相悖。理性探討 AI 安全和治理,與刻意制造恐慌的末日論,有著本質區別。
這類不實言論危害深遠。很多優秀的學生和年輕人正在選擇專業方向,輿論會左右他們的判斷。如果年輕一代被灌輸了“AI 充滿未知危險”的恐懼,大家會轉向政策主張限制技術發展,而非投身基礎研發,最終將技術賽道拱手讓人。
GPU 屬于通用計算設備,全球數十億人都在使用,廣泛應用于醫療影像、物流調度、氣候模擬等領域。將 AI 粗暴地類比為原子彈,會嚴重擾亂理性思考,基于這類敘事制定的政策,也必然偏離正軌。
行動建議: 看到各類 AI 安全相關言論時,先判斷其是否具備科學上的“可證偽性”。如果沒有任何論據能夠推翻該觀點,那它只是主觀焦慮的情緒敘事,而非嚴謹的安全討論。
總結:計算架構全面重構,不同角色的行動方向
黃仁勛的核心觀點,并非只聚焦芯片技術,而是將全棧協同設計奉為通用準則:單獨優化某一模塊,增長存在明顯上限;跨層級整合設計,才能實現復利式突破。 這套邏輯,同樣適用于硬件研發、產品架構與企業組織管理。
- 創業者: 智能體運算模式和傳統訓練集群差異巨大,務必圍繞真實業務場景搭建架構,確保基礎設施匹配工作負載。未來 24 個月內吃透這套邏輯的團隊,將有機會打造出通用的底層平臺。
- 投資人: 能耗是長期結構性瓶頸,如今市場體量足以支撐新能源產業自主發展。長期價值將向高能效推理、智能體專用基建以及能源賽道集中。企業過往的行業地位不代表未來實力,擅長第一性原理思考的團隊更值得提前布局。
- 企業運營者與工程師: 沿用 60 年的傳統計算范式已經被顛覆。吃透這一變革本質的團隊,會完成架構的徹底重構;僅將其視作普通技術升級的團隊,未來十年都將在過時的邏輯里反復踩坑。
- 行業新人: 當下是計算領域機遇最廣闊的時代,全棧技術體系都在被重新定義。善于洞察變革、深度思考底層邏輯的人,將成為行業重構的主導者。
三大核心行動原則
- 全棧協同設計制勝: 單一模塊優化有上限,全鏈路整合才能突破瓶頸;
- 運算模式決定架構: 落地開發前先理清真實計算的物理邏輯,否則一切都是盲目嘗試;
- 趨勢有跡可循: GPT 催生智能體,智能體終將催生集群協同。立足現有信號推演趨勢,而非被動等待市場達成共識。
整個計算體系已然改變,這是六十年來,重塑行業的最佳時機。
本文編譯自substack,原文作者The AI Corner
https://www.the-ai-corner.com/p/jensen-huang-stanford-cs153-playbook-2026
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.