![]()
2026 年 4 月 15 日,Nvidia CEO Jensen Huang 在一場最新訪談中,系統(tǒng)回應(yīng)了外界最關(guān)心的幾個問題:
1)TPU 是否會動搖 Nvidia 在 AI 算力市場的主導(dǎo)地位;
2)Nvidia 的真正護(hù)城河究竟是什么;
3)英偉達(dá)為何不直接下場做云服務(wù);
4)以及美國是否應(yīng)該繼續(xù)限制中國獲得 AI 芯片。
在 Jensen 看來,Nvidia 的核心優(yōu)勢從來不只是單顆芯片性能,而是圍繞 AI 計(jì)算搭建起來的完整體系。這個體系既包括 GPU、互聯(lián)、軟件棧和 CUDA 生態(tài),也包括對上游晶圓、封裝、內(nèi)存等關(guān)鍵供應(yīng)鏈資源的提前布局和組織能力。他表示,Nvidia 所做的事情,本質(zhì)上是把“電子轉(zhuǎn)化為 token”,而這個過程遠(yuǎn)不只是制造一顆芯片那么簡單。
對于 Google TPU、AWS Trainium 等專用加速器的競爭,Jensen 并不否認(rèn)它們在特定 AI 場景中的價值,但強(qiáng)調(diào) Nvidia 提供的是更廣義的“加速計(jì)算”平臺,而不只是某種單點(diǎn)優(yōu)化的 AI 芯片。他認(rèn)為,AI 發(fā)展并不只依賴矩陣乘法效率,未來模型架構(gòu)、注意力機(jī)制、訓(xùn)練與推理流程都在快速變化,因此,一個可編程、可擴(kuò)展、擁有龐大安裝基數(shù)的軟件硬件平臺,仍然比單一用途的專用芯片更有韌性。
在商業(yè)模式上,Jensen 也解釋了為何 Nvidia 沒有直接變成一家 hyperscaler。按照他的說法,Nvidia 的原則一直是“做盡可能必要的事,但只做必要的部分”。也就是說,如果底層計(jì)算平臺、軟件庫、互聯(lián)架構(gòu)這些事情不由 Nvidia 來做,行業(yè)可能根本做不起來;但云服務(wù)、算力租賃和資本運(yùn)作,本來就會有人做,因此 Nvidia 更愿意扶持 CoreWeave、Nebius、Nscale 這樣的合作伙伴,而不是親自與整個生態(tài)競爭。
這場訪談中,最具爭議的一部分,仍然是關(guān)于中國市場的表態(tài)。面對“是否應(yīng)該向中國出售 AI 芯片”的追問,Jensen 的態(tài)度非常明確:美國當(dāng)然應(yīng)該拿到最先進(jìn)、最多、最優(yōu)先的 AI 算力,也必須保持領(lǐng)先;但這并不意味著美國應(yīng)該主動將中國這個全球第二大計(jì)算市場整體讓出去。
他認(rèn)為,如果美國用過于絕對化的政策,將本國芯片企業(yè)排除出這一市場,結(jié)果只會加速中國本土芯片產(chǎn)業(yè)和本土 AI 技術(shù)棧的發(fā)展,最終讓越來越多的模型和開發(fā)者生態(tài)運(yùn)行在非美國技術(shù)棧上。對美國來說,這種結(jié)果可能比短期競爭本身更危險(xiǎn)。Jensen 的立場并不是“無限制出售”,而是反對一種過于粗放、過于極端的政策設(shè)計(jì):最先進(jìn)技術(shù)當(dāng)然應(yīng)優(yōu)先留在美國,但與此同時,美國企業(yè)也不應(yīng)被迫提前退出全球關(guān)鍵市場。
此外,Jensen 還談到 Nvidia 為何沒有同時押注多條完全不同的芯片路線。他表示,并非沒評估過各種架構(gòu)可能性,而是在模擬后發(fā)現(xiàn),許多看起來激進(jìn)的新路線并不優(yōu)于當(dāng)前方案。因此,Nvidia 仍會優(yōu)先沿著現(xiàn)有技術(shù)路徑繼續(xù)推進(jìn)。不過,他也提到,隨著 token 的商業(yè)價值上升,推理市場正在發(fā)生變化,未來不只是“高吞吐”重要,“更低時延、能賣出更高價格的 token”也會形成新的市場空間。
整體來看,這場訪談釋放出的核心信號很明確,Jensen Huang 試圖將 Nvidia 定義為 AI 基礎(chǔ)設(shè)施時代的“總裝平臺” —— 它賣的不是某一代 GPU,而是一整套從芯片、網(wǎng)絡(luò)、軟件、供應(yīng)鏈到開發(fā)者生態(tài)的系統(tǒng)能力。而在中國問題上,他也再次表明,自己支持美國保持絕對領(lǐng)先,但反對以主動放棄市場的方式來維護(hù)這種領(lǐng)先。
![]()
視頻全部內(nèi)容翻譯。
標(biāo)題:Jensen Huang:TPU 競爭、為什么應(yīng)該向中國賣芯片,以及 Nvidia 的供應(yīng)鏈護(hù)城河
引語:“如果未來幾年達(dá)到 1 萬億美元級別的規(guī)模,Nvidia 也有相應(yīng)的供應(yīng)鏈來支撐它。”
導(dǎo)語:這場對談中,Dwarkesh 向 Jensen 提問了多個核心問題,包括:TPU 競爭、Nvidia 對先進(jìn)芯片所需稀缺供應(yīng)鏈的掌控、是否應(yīng)該向中國出售 AI 芯片、Nvidia 為什么不自己下場做 hyperscaler、公司如何投資等等。
時間軸
00 : 00 : 00 —— Nvidia 最大的護(hù)城河,是不是對稀缺供應(yīng)鏈的控制?
00 : 16 : 25 —— TPU 會打破 Nvidia 在 AI 算力上的主導(dǎo)地位嗎?
00 : 41 : 06 —— Nvidia 為什么不自己做 hyperscaler?
00 : 57 : 36 —— 該不該把 AI 芯片賣給中國?
01 : 35 : 06 —— Nvidia 為什么不做多種不同的芯片架構(gòu)?
![]()
00 : 00 : 00 —— Nvidia 最大的護(hù)城河,是不是對稀缺供應(yīng)鏈的控制? Dwarkesh Patel:
最近,很多軟件公司的估值下跌,因?yàn)槭袌稣J(rèn)為 AI 會讓軟件商品化。一個可能有些天真的看法是:Nvidia 把 GDS2 文件交給 TSMC,TSMC 負(fù)責(zé)生產(chǎn)邏輯芯片和交換芯片,再把它們和 SK Hynix、Micron、Samsung 生產(chǎn)的 HBM 封裝在一起,最后送到臺灣的 ODM 廠商組裝成整機(jī)柜。也就是說,Nvidia 本質(zhì)上是在做“由別人制造出來的軟件”。如果軟件真的會被商品化,那 Nvidia 會不會也被商品化?
![]()
Jensen Huang:
歸根結(jié)底,必須有東西把電子轉(zhuǎn)化為 token。把電子轉(zhuǎn)成 token,并且讓 token 的價值隨著時間持續(xù)提升,這件事很難被徹底商品化。電子到 token 的轉(zhuǎn)化,是一段極其復(fù)雜的旅程。制造一個 token,就像讓一個分子比另一個分子更有價值一樣,是讓一個 token 比另一個 token 更有價值。這里面涉及的藝術(shù)、工程、科學(xué)和發(fā)明極其龐大,而且現(xiàn)在還在實(shí)時發(fā)生。無論是制造過程本身,還是背后的科學(xué)基礎(chǔ),都遠(yuǎn)沒有被完全理解,這段旅程也遠(yuǎn)未結(jié)束,所以并不認(rèn)為它會被商品化。
當(dāng)然,效率一定會繼續(xù)提高。剛才那個問題,其實(shí)很接近 Nvidia 對自身的理解:輸入是電子,輸出是 token,中間是 Nvidia。Nvidia 的職責(zé),是在“盡可能多做必要的事”和“盡可能少做非必要的事”之間找到平衡,從而實(shí)現(xiàn)這種轉(zhuǎn)化,并把能力做到極致。所謂“盡可能少做”,就是凡是沒必要親自做的部分,就交給合作伙伴,納入生態(tài)系統(tǒng)。
如果看今天的 Nvidia,大概擁有全球最大的合作伙伴生態(tài)之一,上游有供應(yīng)鏈伙伴,下游有整機(jī)廠商、應(yīng)用開發(fā)者、模型開發(fā)者。AI 像一個五層蛋糕,Nvidia 在這五層上都有生態(tài)布局。公司盡量少做事,但真正必須親自做的部分,恰恰極難,所以不認(rèn)為這些部分會被商品化。
甚至企業(yè)軟件也未必會被商品化。現(xiàn)在大多數(shù)軟件公司其實(shí)都在做“工具”,少數(shù)是在做工作流的編碼系統(tǒng)。Excel 是工具,PowerPoint 是工具,Cadence 和 Synopsys 也都是工具。對這件事的看法其實(shí)和不少人相反:未來 agent 的數(shù)量會指數(shù)級增長,工具使用者的數(shù)量也會指數(shù)級增長,因此這些工具的調(diào)用實(shí)例數(shù)很可能會暴漲。
比如 Synopsys Design Compiler 的調(diào)用次數(shù)就很可能激增,同時會有越來越多的 agent 去使用樓層規(guī)劃工具、版圖工具、設(shè)計(jì)規(guī)則檢查工具。今天受限的是工程師數(shù)量,明天這些工程師會被大量 agent 輔助,設(shè)計(jì)空間探索會前所未有地展開,而他們依然會使用今天這些工具。
所以,工具的使用量很可能讓軟件公司受益。之所以這種變化還沒大規(guī)模發(fā)生,只是因?yàn)?agent 現(xiàn)在還不夠擅長使用工具。未來要么這些公司自己造出 agent,要么 agent 逐步強(qiáng)到足以熟練使用這些工具,最后很可能兩者并存。
Dwarkesh Patel:
根據(jù) Nvidia 最新披露的數(shù)據(jù),公司在晶圓代工、內(nèi)存和封裝上的采購承諾已經(jīng)接近 1,000 億美元。SemiAnalysis 甚至報(bào)道稱,未來可能達(dá)到 2,500 億美元。一個解讀是:Nvidia 真正的護(hù)城河,其實(shí)是提前鎖定了未來很多年的稀缺部件。別人就算有加速器,能不能拿到足夠的內(nèi)存?能不能拿到邏輯芯片?這是不是 Nvidia 未來幾年的真正護(hù)城河?
Jensen Huang:
這確實(shí)是別人很難復(fù)制的一件事。Nvidia 在上游做了非常大的承諾。有些是顯性的,比如這些采購承諾;有些是隱性的。舉例來說,上游很多投資其實(shí)是供應(yīng)鏈伙伴自己做的,因?yàn)闀苯痈嬖V那些 CEO:這個產(chǎn)業(yè)未來會有多大,為什么會變成這樣,判斷邏輯是什么,看到了什么。
正因?yàn)槌掷m(xù)地去“告知、激勵、對齊”這些上游企業(yè)的 CEO,他們才愿意投入。為什么他們愿意為 Nvidia 投資,而不是別人?原因就在于,他們知道 Nvidia 有能力把他們的產(chǎn)能買下來,也有能力通過下游需求把它賣出去。Nvidia 的下游需求和銷售能力足夠大,所以他們敢在上游下注。
如果看 GTC,很多人會驚嘆它的規(guī)模和參會者數(shù)量。它像是一個 360 度全景式的 AI 宇宙。大家聚在一起,是因?yàn)楸舜诵枰姷綄Ψ健vidia 把整個產(chǎn)業(yè)鏈拉到一起,讓下游看見上游,讓上游看見下游,也讓所有人看見 AI 的最新進(jìn)展。更重要的是,他們還能和原生 AI 創(chuàng)業(yè)公司面對面接觸,親眼看到新公司、新產(chǎn)品和新趨勢。很多時候,Jensen 花大量時間去教育、告知整個供應(yīng)鏈和生態(tài)系統(tǒng),幫助他們理解機(jī)會到底有多大。
不少人會說,Jensen 的 keynote 總是一項(xiàng)接一項(xiàng)發(fā)布新品,有時像在“上課”。但這恰恰是有意為之。目標(biāo)就是確保整個上游、下游和生態(tài)系統(tǒng)都理解:接下來會發(fā)生什么、為什么會發(fā)生、何時發(fā)生、規(guī)模有多大,并且能像 Nvidia 一樣系統(tǒng)化地推演這一切。
如果按剛才那種方式理解“護(hù)城河”,那么 Nvidia 的優(yōu)勢在于:它能為未來建產(chǎn)能。若未來幾年真能做到 1 萬億美元級規(guī)模,Nvidia 有能力配套相應(yīng)供應(yīng)鏈。沒有足夠廣的觸達(dá)能力、沒有業(yè)務(wù)運(yùn)轉(zhuǎn)的速度,就不可能撐起這種供應(yīng)鏈。沒有誰會為一個業(yè)務(wù)周轉(zhuǎn)不快的架構(gòu)單獨(dú)建供應(yīng)鏈。Nvidia 之所以能維持這個規(guī)模,是因?yàn)橄掠涡枨笞銐驈?qiáng),所有人都能看到它、聽到它、理解它,這才讓公司能在今天做到這樣的規(guī)模。
Dwarkesh Patel:
但更具體一點(diǎn)說,上游真的跟得上嗎?這么多年里,Nvidia 的收入幾乎在年復(fù)一年翻倍,向全球提供的 FLOPS 更是增長得更快。
Jensen Huang:
而且是在這么大的基數(shù)上翻倍,這本身已經(jīng)很驚人了。
Dwarkesh Patel:
但問題在于邏輯芯片產(chǎn)能。Nvidia 已經(jīng)是 TSMC N3 和 N2 的最大客戶之一。按 SemiAnalysis 的說法,今年 AI 將占掉 N3 的 60 %,明年會達(dá)到 86 %。當(dāng) AI 已經(jīng)占了大頭,還怎么繼續(xù)翻倍?AI 算力增長會不會最終被上游卡住?全球怎么可能每年把晶圓廠再翻一倍?
Jensen Huang:
從某種意義上說,全球上游和下游在任何一個時點(diǎn)上,都會出現(xiàn)即時需求大于即時供給的局面。甚至有時候,真正的瓶頸可能是水管工。
他還補(bǔ)充說,這恰恰說明行業(yè)狀態(tài)是健康的:需求高于供給,總比供給過剩要好。若某個環(huán)節(jié)成了明顯瓶頸,整個行業(yè)就會撲上去解決它。比如前幾年 CoWoS 一直被認(rèn)為是瓶頸,但現(xiàn)在大家已經(jīng)不怎么談了,因?yàn)楫a(chǎn)業(yè)界花了兩年時間持續(xù)擴(kuò)充這部分產(chǎn)能,如今情況已經(jīng)改善不少。TSMC 也意識到,CoWoS 和 HBM 不再是“小眾技術(shù)”,而是主流計(jì)算基礎(chǔ)設(shè)施的一部分,因此它們的擴(kuò)產(chǎn)節(jié)奏,必須與邏輯芯片保持同步。
Jensen 還提到,Nvidia 現(xiàn)在已經(jīng)可以更大范圍地影響供應(yīng)鏈。AI 革命早期,很多今天說的話,五年前就已經(jīng)在講。有人信了并提前投資,比如 Micron。現(xiàn)在公司不只是“發(fā)現(xiàn)瓶頸后去補(bǔ)”,而是提前幾年預(yù)取瓶頸、提前布局,比如在硅光子領(lǐng)域和 Lumentum、Coherent 等公司的投入,就是在重塑未來供應(yīng)鏈。為了支撐規(guī)模增長,Nvidia 不只是發(fā)明新技術(shù),也在推動新流程、新測試設(shè)備、投資相關(guān)企業(yè),幫助整個生態(tài)把產(chǎn)能抬起來。
當(dāng)被問到“最難擴(kuò)的瓶頸是什么”時,Jensen 的回答是:水管工和電工。
他的觀點(diǎn)是,社會老是在討論“AI 會消滅工作”,但真正的問題可能恰恰相反:如果不斷勸年輕人別去做某些職業(yè),未來就會短缺這些職業(yè)的人。十年前就有人說“放射科醫(yī)生快沒用了”,結(jié)果今天真正短缺的恰恰是放射科醫(yī)生。
對于“EUV 設(shè)備怎么每年翻倍”這個問題,Jensen 的回答很直接:沒有什么瓶頸是 2 到 3 年以上解決不了的。
只要需求信號足夠明確,這些環(huán)節(jié)并不難復(fù)制。一旦 TSMC 確信未來需要更多產(chǎn)能,ASML 自然也會跟上。相比之下,他真正擔(dān)心的不是芯片產(chǎn)能,而是能源政策。因?yàn)闆]有能源,就沒有新的制造業(yè),也沒有 AI 工廠、EV、機(jī)器人、先進(jìn)封裝。芯片產(chǎn)能擴(kuò)張是 2 到 3 年問題,CoWoS 也是 2 到 3 年問題,但能源是更慢、更基礎(chǔ)的約束。
00 : 16 : 25 —— TPU 會打破 Nvidia 在 AI 算力上的主導(dǎo)地位嗎? Dwarkesh Patel:
如果看 TPU,世界前三大模型里,Claude 和 Gemini 至少有兩個是基于 TPU 訓(xùn)練的。這對 Nvidia 意味著什么?
Jensen Huang:
Nvidia 做的不是單純的 TPU,而是“加速計(jì)算”。加速計(jì)算適用于分子動力學(xué)、量子色動力學(xué)、數(shù)據(jù)處理、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)、流體力學(xué)、粒子物理學(xué),當(dāng)然也包括 AI。它的適用范圍遠(yuǎn)遠(yuǎn)大于 TPU 或 ASIC。
在 Jensen 看來,今天大家都在談 AI,但計(jì)算遠(yuǎn)比 AI 寬得多。Nvidia 推動的是從通用計(jì)算走向加速計(jì)算的范式轉(zhuǎn)換。正因?yàn)槠脚_面向的是各種類型的應(yīng)用、各種框架、各種算法,它的市場邊界要大得多。并且,Nvidia 的系統(tǒng)設(shè)計(jì)是為了讓別人也能運(yùn)營,而很多自研芯片體系只能自己內(nèi)部用。正因如此,Nvidia 才能進(jìn)入所有云,包括 Google、Amazon、Azure 和 OCI。
當(dāng) Dwarkesh 提出另一種質(zhì)疑時——AI 的核心不就是一次又一次矩陣乘法嗎?既然如此,像 TPU 這種大規(guī)模脈動陣列不就比 GPU 更適合 AI 嗎?
Jensen Huang 的回答是:
矩陣乘法確實(shí)重要,但那不是 AI 的全部。假如要發(fā)明一種新的 attention 機(jī)制、一種新的模型結(jié)構(gòu),比如混合型 SSM,或者把 diffusion 和 autoregressive 融合到一起,就需要一個可編程性更強(qiáng)的架構(gòu)。真正推動 AI 快速發(fā)展的,不只是硬件本身,而是算法創(chuàng)新。摩爾定律一年只提升大約 25 %,但如果算法變了,性能可以一年跳 10 倍、100 倍。Nvidia 的優(yōu)勢就在于:它不僅硬件可編程,而且是極端的協(xié)同設(shè)計(jì)公司,能同時從處理器、系統(tǒng)、互聯(lián)、網(wǎng)絡(luò)、庫和算法各個層面去改進(jìn)。沒有 CUDA,很難做到這一點(diǎn)。
隨后,Dwarkesh 又追問:既然 Nvidia 60 % 的收入都來自五大 hyperscaler,而這些客戶本身有能力寫自定義 kernel、替代一部分 CUDA,那 CUDA 還算不算 Nvidia 的真正護(hù)城河?
Jensen Huang:
CUDA 不只是一個編程接口,而是一個極其豐富的生態(tài)。如果要先在某個平臺上開發(fā),最聰明的選擇仍然是先為 CUDA 開發(fā),因?yàn)樗С謳缀跛锌蚣堋riton、vLLM、SGLang 以及新一代 RL 框架,都在利用 Nvidia 的后端能力。開發(fā)者最需要的,一是穩(wěn)定且成熟的底層,二是龐大的安裝基數(shù)。Nvidia 現(xiàn)在擁有數(shù)億塊 GPU 的安裝基數(shù),遍布所有云、各種型號、各種場景,連機(jī)器人里也有 CUDA。對開發(fā)者來說,這意味著軟件和模型一旦寫出來,就能在大量機(jī)器上運(yùn)行,這種價值非常高。
Jensen 還強(qiáng)調(diào),Nvidia 為這些 AI 實(shí)驗(yàn)室投入了大量工程資源,幫助它們優(yōu)化棧和 kernel。很多時候,一輪優(yōu)化就能把模型性能提升 2 倍、3 倍,甚至 50 %。在他看來,Nvidia 今天真正的飛輪是:
最豐富的安裝基數(shù)
最強(qiáng)的可編程性
最完整的生態(tài)
最低的總擁有成本( TCO )
最高的 token / watt 效率
最廣的云覆蓋范圍
如果目標(biāo)是出租算力,Nvidia 的客戶最多;如果目標(biāo)是讓 1 GW 級數(shù)據(jù)中心創(chuàng)造最多收入,Nvidia 的 token / watt 又最好。所以他認(rèn)為,Nvidia 的成功并不是偶然,而是整套飛輪共同作用的結(jié)果。
對于 Anthropic 同時使用 TPU 和 Trainium 的現(xiàn)象,Jensen 的判斷是:Anthropic 是一個特殊樣本,不代表趨勢。
在他看來,沒有 Anthropic,TPU 和 Trainium 的增長都會遜色很多。其他公司嘗試替代方案并不會讓他反感,因?yàn)閯e人試過之后,才會意識到 Nvidia 的強(qiáng)項(xiàng)到底在哪里。至于有人說“就算自研芯片比 Nvidia 差 70 % 也沒關(guān)系,畢竟 Nvidia 毛利太高”,Jensen 的反駁是:ASIC 的毛利率其實(shí)也很高,差距并沒有想象中那么夸張。
00 : 41 : 06 —— Nvidia 為什么不自己做 hyperscaler?
當(dāng) Dwarkesh 問到,既然 Nvidia 已經(jīng)這么有錢了,為什么不自己做 foundation model lab,或者直接自己做云,把算力租給外界時,Jensen 的回答延續(xù)了他前面那套哲學(xué):
“做盡可能必要的事,做盡可能少的事。”
他的意思是,Nvidia 負(fù)責(zé)的部分,是那些如果不由 Nvidia 來做,可能根本不會有人做成的事情。比如:
NVLink
CUDA 全棧
CUDA - X 各類垂直庫
面向不同領(lǐng)域的加速計(jì)算體系
計(jì)算光刻庫 cuLitho
這些都是長期虧錢、長期投入、沒人愿意先做的事情,但如果 Nvidia 不做,行業(yè)未必能走到今天。既然如此,公司就該專注于這部分。
但云不一樣。云這個市場里本來就會有人做,如果 Nvidia 自己也下場,反而偏離了邊界。所以,它更傾向于支持生態(tài)中的 neocloud,比如 CoreWeave、Nscale、Nebius,讓這些公司成長起來,而不是自己變成云廠商。Nvidia 的目標(biāo)不是“什么都做”,而是讓整個生態(tài)繁榮起來,讓全球盡可能多的行業(yè)和國家都建立在 AI 和美國技術(shù)棧之上。
Jensen 還說,Nvidia 在投資 foundation model 公司時,也盡量不“押單一贏家”。因?yàn)?Nvidia 自己創(chuàng)業(yè)時就曾是那個最不被看好的公司之一。早期 3D 圖形市場里有 60 家公司,如果當(dāng)年讓人預(yù)測誰會活下來,Nvidia 大概會排在“最不可能活下來”的前列。正因?yàn)橐娺^這種事,所以公司更傾向于支持整個生態(tài),而不是過早地只押某一家公司。
關(guān)于 GPU 供貨分配,Jensen 也否認(rèn)了“誰出價高就優(yōu)先給誰”的說法。
他的說法是,Nvidia 基本遵循預(yù)測、下單、排隊(duì)、誰先準(zhǔn)備好數(shù)據(jù)中心誰先拿貨的原則,不會因?yàn)閮r格更高就把貨優(yōu)先給對方。
理由很簡單:這是壞的商業(yè)實(shí)踐。
Nvidia 更愿意成為行業(yè)可信賴的基礎(chǔ)設(shè)施提供者,而不是在供需緊張時隨意加價。
00 : 57 : 36 —— 該不該把 AI 芯片賣給中國?
這部分是整篇對談里最激烈的一段。
Dwarkesh Patel 的問題大意是:
如果像 Anthropic Mythos 這樣的模型已經(jīng)能發(fā)現(xiàn)大量高危漏洞,甚至具備明顯的網(wǎng)絡(luò)攻擊能力,那么如果中國公司、中國實(shí)驗(yàn)室等拿到更多 AI 芯片,就可能訓(xùn)練出類似模型,并大規(guī)模部署。這會不會威脅美國企業(yè)和國家安全?
Jensen Huang 的核心回答有幾層:
第一,Mythos 訓(xùn)練所需的算力,并沒有高到中國拿不到。
第二,中國本身就是全球第二大計(jì)算市場,擁有大量芯片、充足能源和大量 AI 研究人員。
第三,把中國徹底當(dāng)成敵人、試圖扼殺它,并不是最安全的辦法。更合理的是保持研究溝通,尤其要在“AI 不該被用于什么”這個問題上建立對話。
第四,AI 安全并不是靠把某一方“掐死”來實(shí)現(xiàn)的,而是要依賴一個繁榮的 AI 安全生態(tài),這又離不開開源模型、開源棧和廣泛參與。若把中國排除出去,反而可能讓全球形成兩個平行生態(tài):一個開放生態(tài)跑在非美國技術(shù)棧上,一個封閉生態(tài)跑在美國技術(shù)棧上。
Jensen 認(rèn)為,這對美國來說是非常糟糕的結(jié)果。
當(dāng) Dwarkesh 進(jìn)一步質(zhì)疑:中國畢竟還停留在 7 nm,沒有 EUV,芯片性能和總 FLOPS 明顯落后美國。是不是應(yīng)該盡量讓美國先達(dá)到這些危險(xiǎn)能力,再爭取緩沖時間修補(bǔ)系統(tǒng),而不是繼續(xù)給中國更多算力?
Jensen 的回應(yīng)是:
這種推理走向了極端,好像只有在中國“完全沒有算力”的情況下,美國才能保持領(lǐng)先。但現(xiàn)實(shí)并不是這樣。中國已經(jīng)有大量算力,而且擁有巨大的能源和基礎(chǔ)設(shè)施儲備。AI 本來就是并行計(jì)算問題,如果單顆芯片不夠先進(jìn),也可以通過堆更多芯片來彌補(bǔ)。中國有大量空置但通電的數(shù)據(jù)中心,有強(qiáng)大的制造能力,也有充足的主流芯片產(chǎn)能。7 nm 芯片并不等于不能做 AI,今天很多模型本來就是在 Hopper 這一代上訓(xùn)練出來的。
Jensen 甚至明確說:
中國有大量邏輯芯片
也有足夠的 HBM2
算法創(chuàng)新本身就能大幅彌補(bǔ)算力不足
DeepSeek 這樣的進(jìn)展已經(jīng)證明,中國的 AI 研究不是邊緣現(xiàn)象
在他看來,真正值得擔(dān)心的,不是中國“有沒有芯片”,而是如果未來全球 AI 模型越來越多地優(yōu)先運(yùn)行在非美國技術(shù)棧上,那才是美國真正的壞消息。因?yàn)檫@意味著開發(fā)者生態(tài)、軟件優(yōu)化、模型適配,會逐步倒向另一套基礎(chǔ)設(shè)施。
Dwarkesh Patel:
先退一步看,問題核心似乎是:這里既有潛在收益,也有潛在代價,真正要判斷的是收益是否大于代價。這里想讓 Jensen 承認(rèn)的,是這個潛在代價本身確實(shí)存在。算力是訓(xùn)練強(qiáng)大模型的投入要素,而強(qiáng)大模型也確實(shí)具備強(qiáng)大的進(jìn)攻性能力,比如網(wǎng)絡(luò)攻擊。美國公司先到達(dá) Mythos 這一級能力,是一件好事,因?yàn)樗鼈冸S后可以暫緩公開,讓美國企業(yè)和政府先加固軟件防線,再把這種能力公開出去。
如果中國擁有更多算力,或者更大規(guī)模的眾包算力,它們可能會更早訓(xùn)練出 Mythos 級別的模型,并大規(guī)模部署,那會是非常糟糕的結(jié)果。而美國之所以暫時避免了這一點(diǎn),其中一個原因恰恰是美國擁有更多算力,這背后也包括 Nvidia 這樣的公司提供支持。所以,把芯片賣給中國,本身就存在這樣的代價。先不談收益,是否承認(rèn)這是一種潛在成本?
Jensen Huang:
也要看到另一種潛在代價:如果讓 AI 技術(shù)棧中最關(guān)鍵的層之一,也就是芯片層,直接放棄全球第二大市場,那么對方就能在這個市場里建立規(guī)模、建立自己的生態(tài),最終讓未來的 AI 模型朝著一套和美國技術(shù)棧截然不同的方向優(yōu)化。隨著 AI 向全球擴(kuò)散,他們的標(biāo)準(zhǔn)、他們的技術(shù)棧,最終可能會比美國的更有優(yōu)勢,因?yàn)樗麄兊哪P褪情_放的。
當(dāng) Dwarkesh 追問,憑 Nvidia 的 CUDA 工程師和 kernel 工程師能力,很難想象中國生態(tài)會形成長期鎖定時,Jensen 的回應(yīng)是:
中國是全球最大的開源軟件貢獻(xiàn)者,這是事實(shí)。中國也是全球最大的開放模型貢獻(xiàn)者,這是事實(shí)。而今天,這一切仍然建立在美國技術(shù)棧、也就是 Nvidia 技術(shù)棧之上,這同樣是事實(shí)。
在他看來,AI 五層技術(shù)棧每一層都重要,美國應(yīng)該在五層都贏。其中最重要的當(dāng)然是應(yīng)用層,因?yàn)檎嬲龜U(kuò)散到社會、真正被廣泛使用的,是應(yīng)用層。但每一層都不能輸。
他進(jìn)一步表示,如果把 AI 描繪成“核彈”一樣的東西,讓整個社會都害怕 AI、排斥 AI,那實(shí)際上是在傷害美國自己。就像如果一直宣傳“軟件工程師會被 AI 全部取代”,結(jié)果大家都不去學(xué)軟件工程,那最終受損的是美國自己。放射科醫(yī)生也是同樣道理:把一個職業(yè)和它內(nèi)部的某個任務(wù)混為一談,會導(dǎo)致整個職業(yè)供給出現(xiàn)問題。
Jensen 的總結(jié)是:
很多極端前提會把問題推向“非零即一切、非黑即白”的方向,而現(xiàn)實(shí)不是這樣。美國當(dāng)然應(yīng)該第一,當(dāng)然應(yīng)該在 AI 的每一層都保持領(lǐng)先。但幾年之后,當(dāng)美國希望把自己的技術(shù)、標(biāo)準(zhǔn)和技術(shù)棧輸出到印度、中東、非洲和東南亞時,再回看今天的政策,很可能會發(fā)現(xiàn):正是這種過于極端的政策,讓美國無謂地讓出了全球第二大市場。
所以,不應(yīng)該主動放棄這個市場。真輸了,那是競爭失敗;但為什么要先主動讓出?當(dāng)然,也沒有人主張“毫無節(jié)制地把所有芯片隨時賣給中國”。最先進(jìn)的技術(shù)、最多的技術(shù)、最先上市的技術(shù),當(dāng)然都應(yīng)該優(yōu)先留在美國。但與此同時,也應(yīng)該盡量在全球范圍內(nèi)競爭并取勝。這兩件事可以同時成立,前提是政策要有足夠的細(xì)膩度和成熟度,而不是走向絕對化。
Jensen 還補(bǔ)充說:
如果美國被迫退出中國市場,這首先就是一個政策錯誤,而且已經(jīng)出現(xiàn)反作用。它不但加速了中國本土芯片產(chǎn)業(yè)發(fā)展,也迫使中國整個 AI 生態(tài)更集中地轉(zhuǎn)向內(nèi)部架構(gòu)。現(xiàn)在還不算太晚,但這件事已經(jīng)發(fā)生了。
未來中國不會永遠(yuǎn)停留在 7 nm。他們很擅長制造,還會繼續(xù)向前推進(jìn)。5 nm 和 7 nm 之間也不存在 10 倍差距。真正重要的不只是制程,架構(gòu)重要、網(wǎng)絡(luò)重要、能源也重要。這也是為什么 Nvidia 當(dāng)年要收購 Mellanox。整個問題遠(yuǎn)沒有“制程代差”那么簡單。
01 : 35 : 06 —— 為什么 Nvidia 不做多套完全不同的芯片架構(gòu)?
Dwarkesh Patel:
回到另一個問題。既然前沿產(chǎn)能越來越緊張,而 Nvidia 在 TSMC 的 N3、未來 N2 上都已經(jīng)是大客戶,是否有可能重新利用 N7 這樣較舊工藝上的閑置產(chǎn)能?比如重新做一個 Hopper 或 Ampere 風(fēng)格的芯片,但結(jié)合今天對數(shù)值、系統(tǒng)和其它優(yōu)化的理解。2030 年前,有沒有可能出現(xiàn)這種情況?
Jensen Huang:
沒這個必要。因?yàn)槊恳淮軜?gòu)的提升,不只是晶體管尺寸縮小這么簡單。里面包含了大量工程、封裝、堆疊、數(shù)值設(shè)計(jì)和系統(tǒng)架構(gòu)創(chuàng)新。
當(dāng)產(chǎn)能吃緊時,輕易“退回”到另一個更舊工藝節(jié)點(diǎn),所需的研發(fā)投入大到幾乎沒人承擔(dān)得起。Nvidia 可以繼續(xù)向前壓,不認(rèn)為自己能負(fù)擔(dān)得起“向后重做”這件事。當(dāng)然,如果有一天世界真的走到一個極端場景 —— 比如從此以后再也不會有更多前沿產(chǎn)能了——那會不會立刻回去用 7 nm?答案是當(dāng)然會,毫不猶豫。
Dwarkesh Patel:
還有一個問題。既然 Nvidia 有資源、也有工程人才,為什么不同時推進(jìn)多條完全不同的芯片路線?比如一條做 Cerebras 那種晶圓級方案,一條做類似 Tesla Dojo 的超大封裝方案,一條甚至干脆不走 CUDA。既然沒人知道 AI 和計(jì)算架構(gòu)未來會怎么演化,為什么要把雞蛋放在一個籃子里?
Jensen Huang:
當(dāng)然可以這么做,只是沒有更好的理由。不是做不到,而是這些路線并不更優(yōu)。Nvidia 會在模擬器里把這些方案都跑一遍,結(jié)果是:它們可證明地更差。既然更差,就不會去做。
公司現(xiàn)在做的,就是自己最想做、也最認(rèn)可的那些項(xiàng)目。未來如果 workload 真的發(fā)生巨大變化——注意,不只是算法變化,而是工作負(fù)載本身、以及背后的市場形態(tài)發(fā)生變化——那 Nvidia 也可能會考慮加入別的加速器。
他舉的例子是,最近 Nvidia 新增了 Groq,并打算把它并入 CUDA 生態(tài)。之所以現(xiàn)在這么做,是因?yàn)?token 的價值已經(jīng)顯著提升了。幾年前,token 幾乎是免費(fèi)的,或者說幾乎不值錢;但現(xiàn)在,不同客戶愿意為不同質(zhì)量、不同響應(yīng)速度的 token 支付不同價格。
Jensen 的意思是:
如果客戶本身通過這些 token 賺很多錢,比如軟件工程師使用 AI 工具后能獲得更高生產(chǎn)率,那么只要 token 更快響應(yīng)、能讓他們更高效,他們就愿意支付更高價格。
而這種市場,是最近才真正浮現(xiàn)出來的。也就是說,同樣一個模型,未來可能會因?yàn)轫憫?yīng)時間不同而分化出不同市場層級。所以 Nvidia 現(xiàn)在開始擴(kuò)展推理市場的帕累托前沿,專門創(chuàng)造一個“響應(yīng)更快、但吞吐更低”的推理細(xì)分市場。過去行業(yè)普遍認(rèn)為“吞吐越高越好”,但現(xiàn)在可能存在另一種世界:哪怕工廠整體吞吐更低,只要 token 的平均售價更高,也依然值得。
Jensen 的結(jié)論是:
從純架構(gòu)視角看,如果有更多資源,仍然會優(yōu)先押注 Nvidia 當(dāng)前這套架構(gòu),而不是分散去做一堆完全不同的路線。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.