網易首頁 > 網易科技 > 網易科技 > 正文

最新播客2萬字實錄|黃仁勛:逼DeepSeek與華為深度綁定,這對美國太可怕了

0
分享至

出品 | 網易智能

作者 | 小小

編輯 | 王鳳枝


英偉達CEO黃仁勛最近接受了美國知名科技播客主持人德瓦克什·帕特爾(Dwarkesh Patel)的專訪,全面回應了關于公司護城河、谷歌TPU競爭、對華芯片出口等關鍵議題。

他強調英偉達的護城河已延伸至供應鏈深處,通過上千億美元的采購承諾與臺積電及存儲供應商建立了深度綁定。

對于TPU競爭,黃仁勛指出Anthropic只是ASIC增長的獨特個例而非趨勢。英偉達的加速計算覆蓋了分子動力學、數據處理、流體力學等遠超越AI的廣闊市場,且CUDA的高可編程性使其能每年實現10到50倍的性能飛躍。

他同時解釋了為何英偉達不親自成為超大規模云服務商。盡管現金流充沛,英偉達仍恪守做必須做的事且盡可能少做的原則,選擇通過投資CoreWeave、OpenAI、Anthropic等支持生態系統,而非親自下場與客戶爭利。他同時承認未能更早大規模投資Anthropic是自己的失誤。此外他強調即使AI革命從未發生,英偉達仍會憑借加速計算在物理、化學、數據處理等領域成為一家非常大的公司。

關于對華出口,他批評極端的出口管制政策十分幼稚。黃仁勛指出AI算力是芯片與能源的結合,盡管受到EUV光刻機的限制,中國仍擁有龐大的7nm芯片制造能力。考慮到當前主流大模型主要還是在Hopper這一代架構上訓練,中國完全可以通過充沛的電力能源和擴大芯片集群規模,來彌補單顆芯片的性能差距。

不僅如此,中國龐大的AI研究團隊正通過更高效的計算機科學來提升模型性能。黃仁勛以DeepSeek為例警告稱這絕非無關緊要的進步。如果這類優秀的開源模型被迫專門針對華為等本土硬件進行深度優化且運行效果最佳,客觀上將直接削弱美國技術棧的全球優勢。他認為主動放棄全球第二大市場將迫使中國建立獨立于美國的底層計算架構。隨著這些基于開源標準的技術逐步向全球南方輸出,美國極有可能在長期的AI生態標準競爭中陷入被動。


以下為黃仁勛專訪全文:

01控制供應鏈是英偉達最大護城河?

帕特爾:很多軟件公司估值在跌,因為大家覺得AI會把軟件變成大宗商品。有種看法是英偉達把設計文件發給臺積電,臺積電造邏輯芯片和開關,再用SK海力士、美光、三星的HBM封裝,然后送到臺灣地區的ODM那里組裝成機架。本質上英偉達做的是軟件,硬件是別人造的。如果軟件被商品化,英偉達是否也會被商品化?

黃仁勛:最終總得有人把電子轉化成Token。這個轉化過程很難被完全商品化。讓一個Token比另一個更有價值就像讓一個分子比另一個分子更有價值一樣,需要大量的技術、工程、科學和發明。這些工作遠未被完全理解也遠未結束。我不認為這種被商品化的情況會發生。

但我們會讓這個過程變得更高效。你問這個問題的方式其實就是我對公司的思考模型,輸入是電子且輸出是Token,中間是英偉達。我們的原則是做必要的事但盡量少做。所謂盡量少做就是我自己不需要做的就找伙伴合作,讓它成為我生態系統的一部分。

今天的英偉達可能是擁有最大合作伙伴生態系統的公司,包括上游下游供應鏈、所有計算機公司、應用開發者、模型廠商。AI就像一個五層蛋糕,我們在每一層都有自己的生態。我們盡量少做但我們必須做的那部分極其困難,我不認為那部分會被商品化。

另外我也不覺得企業軟件公司會被商品化。現在大多數軟件公司是工具廠商,比如Excel、PowerPoint、Cadence、Synopsys。我的看法和很多人相反,AI智能體的數量會指數級增長且工具用戶的數量也會指數級增長。這些工具的實例數量很可能會暴增。

比如Synopsys的設計編譯器會有大量智能體來用它做布局、設計規則檢查。今天限制我們的是工程師數量,明天每個工程師身后都會有一群智能體。我們能用前所未有的方式探索設計空間,用的還是今天的工具。工具的高頻使用會讓軟件公司飛速發展。現在之所以還沒發生是因為智能體還不夠會用工具。要么這些軟件公司自己造智能體,要么智能體會變得足夠好去熟練使用這些工具,我覺得兩者都會發生。

帕特爾:我看你最新的文件里對代工廠、內存、封裝有近1000億美元的采購承諾。半導體研究機構SemiAnalysis認為這個數字會達到2500億美元。一種解讀是英偉達的護城河在于鎖定了未來多年的稀缺組件。別人或許有加速器但拿不到內存和邏輯芯片。這是否是你們未來幾年的主要護城河?

黃仁勛:這是我們能做到而別人很難做到的事情之一。我們向上游做了巨大承諾,有些是顯性的就是你提到的那些。有些是隱性的,比如上游很多投資是我跟那些CEO說我來告訴你這個行業會有多大、為什么會有這么大,我推理給你看并讓你看到我所看到的,然后他們才投的。

他們為什么愿意為我投資而不是為別人?因為他們知道我有能力買下他們的供應并通過我的下游賣出去。英偉達的下游需求和下游供應鏈太龐大了,所以他們愿意在上游投資。

你看GTC大會,大家驚嘆于它的規模和人氣。那是整個AI社區聚在一起,因為他們需要互相交流與被看見。我讓他們聚在一起,讓下游看到上游且上游看到下游,所有人看到AI的進步。他們還能見到所有AI原生代、所有初創公司。這樣他們就能親眼驗證我告訴他們的事情。我花大量時間,直接或間接地讓供應鏈、合作伙伴、生態系統理解面前的機會。

有人說我的主題演講像是在上課且有點折磨人。其實那就是我的用意。我得讓整個供應鏈、上下游、生態系統理解即將發生什么、為什么發生、何時發生、規模多大,并且能像我一樣系統性地思考。

關于護城河我們其實是在為未來提前布局。如果我們未來幾年真的成長到萬億美元規模,到那時自然有能力搭建與之匹配的供應鏈。但前提是沒有我們今天的業務體量和影響力也沒有我們業務的高速流轉,就像現金流一樣供應鏈也有自己的流轉和周轉速度。如果業務周轉慢沒有人會愿意為一個空架子搭建供應鏈。我們今天能維持這樣的規模,根本原因在于下游需求極其旺盛。當他們親眼看到、聽到、意識到這一切正在真實發生,才讓我們得以在現有規模下做成現在這些事。

帕特爾:我想具體了解一下上游能否跟得上。你們連續多年收入翻倍,每年向世界提供的算力增長超過兩倍。

黃仁勛:在這個規模上還能翻倍確實很驚人。

帕特爾:但你看邏輯芯片。你們是臺積電N3節點的最大客戶也是N2節點的最大客戶之一。SemiAnalysis發現今年AI會占N3產能的60%,明年到86%。如果你已經占了大頭怎么翻倍?年復一年地翻倍?我們是否已經進入一個階段,即AI算力增速必須因為上游限制而放緩?你看到解決辦法了嗎?歸根到底我們怎么才能年復一年地把晶圓廠產能也翻一倍?

黃仁勛:在任何一個時間點,瞬時需求都可能大于全球上下游的總供應。甚至可能被水管工數量限制,這確實發生過。

帕特爾:水管工應該被邀請參加明年的GTC。

黃仁勛:好主意。但這其實是個好現象。你希望一個行業的瞬時需求大于總供應,反過來就不太好了。如果某個組件缺口太大,整個行業會蜂擁去解決。你看現在已經沒太多人討論CoWoS了。因為過去兩年我們拼命解決這個問題現在情況已經不錯了。臺積電現在知道CoWoS的供應必須跟得上邏輯和內存的需求。他們正在以和擴展邏輯同樣的速度擴展CoWoS和未來封裝技術。這非常好,因為CoWoS和HBM內存以前是比較小眾的,現在它們成了主流計算技術。

我們現在能影響更廣泛的供應鏈了。AI革命剛開始時我說的這些話五年前就說過了。有人相信并投資了,比如美光CEO桑杰·梅赫羅特拉(Sanjay Mehrotra)及其團隊。我清楚記得那次會議,我準確地說明了會發生什么、為什么發生以及今天的狀況。他們真的加倍投入了。我們在LPDDR和HBM內存上合作,他們大力投資結果取得了巨大的成功。有些人來得晚一些但現在都來了。

每個瓶頸都會得到大量關注。我們現在提前幾年就開始預判瓶頸。比如過去幾年我們在Lumentum、Coherent和硅光生態系統上的投資,重塑了供應鏈。我們圍繞臺積電建立了整個供應鏈并和他們合作開發硅光整合平臺COUPE,發明了很多技術并把專利授權給供應鏈保持開放。

我們通過發明新技術、新流程、新測試設備比如雙面探測、投資公司幫他們擴產來增強供應鏈。我們在努力塑造生態系統,讓供應鏈能夠支撐這個規模。

帕特爾:有些瓶頸好像比其他瓶頸容易解決,比如CoWoS擴產。

黃仁勛:我們負責克服最難的那個。

帕特爾:哪個?

黃仁勛:水管工和電工。這是我擔心那些末日論者的地方。他們說工作要消失、崗位要完蛋。如果我們阻止人們成為軟件工程師,我們就會耗盡軟件工程師。十年前就有同樣的預言。有些末日論者說無論如何別當放射科醫生,你現在還能在網上看到那些視頻說放射科會是第一個消失的職業,世界再也不需要放射科醫生了。猜猜我們現在缺什么?放射科醫生。

帕特爾:有些東西可以規模化有些則不行,你每年怎么造出兩倍的邏輯芯片?最終內存和邏輯都受限于EUV光刻機。你怎么年復一年地拿到兩倍的EUV光刻機?

黃仁勛:這些產能都是可以快速規模化的,兩三年內就能做到。你只需要向供應鏈發出一個需求信號。能造一個就能造十個,能造十個就能造一百萬個。這些東西復制起來并不難。

帕特爾:你會在供應鏈里走多遠?會直接去找ASML說三年后英偉達要做到年收入兩萬億美元,我們需要多得多的EUV光刻機嗎?

黃仁勛:有些要直接說,有些間接說。如果能說服臺積電,ASML也會被說服。我們要找到關鍵的瓶頸點。但如果臺積電被說服了,幾年內你就會有足夠多的EUV。

我的觀點是沒有任何瓶頸會持續超過兩三年。與此同時我們還在把計算效率提高10倍、20倍,Hopper到Blackwell是30到50倍。因為CUDA很靈活我們在不斷發明新算法、新技術,在增加容量的同時提高效率。這些事情都不讓我擔心。讓我擔心的是我們下游的東西。能源政策阻止能源擴展,而沒有能源你建不了新產業。沒有能源你沒法搞一個新的制造業。

我們要讓美國再工業化。我們要把芯片制造、計算機制造、封裝帶回來。我們要造電動汽車、機器人。我們要造AI工廠。沒有能源這些都建不起來,而能源需要很長時間。芯片產能是兩三年能解決的問題。CoWoS產能也是兩三年能解決的問題。

02 TPU會打破英偉達對AI算力的控制嗎?

帕特爾:世界上排名前三的模型里,有兩個即Claude和Gemini都是在谷歌TPU上訓練的。這對英偉達意味著什么?

黃仁勛:我們做的東西很不一樣。英偉達做的是加速計算,不只是一個張量處理單元。加速計算可以用在很多地方,涵蓋分子動力學、量子色動力學、數據處理、結構化數據、非結構化數據、流體動力學、粒子物理。除此之外也做AI。

加速計算比這廣泛得多。雖然AI是當下的話題且顯然很重要和影響很大,但計算比這寬泛得多。英偉達重塑了計算的方式,從通用計算轉向加速計算。我們的市場覆蓋范圍比任何TPU或ASIC都要大得多,我們是唯一一家能加速各種應用的公司。我們有巨大的生態系統,各種框架和算法都能在英偉達上跑。

因為我們的計算機設計成讓別人可以操作,所以任何運營商都能買我們的系統。而大部分自建系統你得自己當運營商,因為它們的靈活性不夠導致別人操作不了。因為誰都能搭建并操作我們的系統,所以我們存在于每一個云里,包括谷歌、亞馬遜、Azure以及甲骨文的云平臺。

如果你想租給別人用,那你最好有來自很多行業的龐大客戶群做承購方。如果你想自己用,我們當然也能幫你自己運營,就像我們在xAI幫馬斯克那樣。而且我們能讓任何公司、任何行業的運營商都具備能力,你可以給禮來公司建一臺用于科學研究和藥物發現的超級計算機,我們可以幫他們運營,用于整個藥物發現和生物科學領域。

有一大堆應用是TPU做不了的。英偉達的CUDA也是一個很棒的張量處理單元,但它還能處理數據處理的每一個環節、計算、AI等等。我們的市場機會大得多,覆蓋范圍廣得多。因為我們支持現在世界上每一個應用,你可以在任何地方建英偉達系統并且知道一定會有客戶。這是一個很不一樣的局面。

帕特爾:你們的收入很驚人但不是來自制藥也不是來自量子計算,而是主要來自AI。因為AI這個前所未有的技術正在以史無前例的速度增長。那問題就來了,什么才是對AI本身最有利的?TPU本質上是一個巨大的脈動陣列,特別擅長做矩陣乘法。GPU則更靈活且適合那些有很多分支判斷或者內存訪問不規則的任務。但問題在于AI到底在干什么?說白了AI就是一遍又一遍地做那些非常可預測的矩陣乘法。既然如此你為什么還要在芯片上留出面積給線程束調度器或線程與內存體之間的切換這類通用功能呢?這些面積本來可以全部用來做矩陣乘法。而TPU恰恰就是專門針對當下正在爆發的那部分計算需求設計的。你覺得呢?

黃仁勛:矩陣乘法是AI的重要部分但不是全部。如果你想出一種新的注意力機制、換一種分解方式、或者發明一個全新的架構即混合狀態空間模型(SSM),你需要一個普遍可編程的架構。如果你想做一個融合了擴散模型和自回歸的模型,你需要的也是一個普遍可編程的架構。我們能跑你能想到的任何東西。這就是優勢。因為它是可編程的,所以發明新算法要容易得多。

發明新算法的能力才是AI進步這么快的原因。TPU和其他東西一樣都受摩爾定律影響,每年大概進步25%。要每年實現10倍或100倍的飛躍,唯一的方法是每一年都從根本上改變算法和計算方式。

這就是英偉達的根本優勢。Blackwell比Hopper能效高50倍。我第一次說35倍時沒人信。后來有人寫文章說我留了一手實際上是50倍。單靠摩爾定律做不到,我們靠的是新模型比如專家混合模型(MoE),它們被并行化、分解、分布在整個計算系統里。如果沒有CUDA也沒有真正深入去寫新內核的能力,這很難做到。

這是可編程架構和英偉達極端協同設計能力的結合。我們甚至可以把一些計算卸載到網絡結構本身比如NVLink,或者網絡里的Spectrum-X。我們可以同時改變處理器、系統、網絡結構、庫和算法。沒有CUDA我根本不知道從哪下手。

帕特爾:這引出一個關于英偉達客戶的有趣問題。你們60%的收入來自五個超大規模云廠商。在另一個時代客戶是教授做實驗,他們需要CUDA且用不了別的加速器,他們只需要用CUDA跑PyTorch且一切都優化好了。但這些超大規模云廠商有能力自己寫內核。事實上為了從特定架構里擠出最后5%的性能,他們必須這么做。Anthropic和谷歌主要跑自己的加速器即TPU和Trainium。就連用GPU的OpenAI也有Triton因為他們需要自己的內核。他們不用cuBLAS和NCCL而是有自己的軟件棧也能編譯到其他加速器上。如果你的大部分客戶能且正在做CUDA的替代品,那CUDA在多大程度上還是前沿AI跑在英偉達上的關鍵因素?

黃仁勛:CUDA是一個豐富的生態系統。如果你想在任何計算機上做開發,首選CUDA是非常明智的。因為生態系統太豐富了,我們支持每一個框架。如果你想寫自定義內核,我們對Triton的貢獻巨大,Triton的后端有大量英偉達技術。

我們很樂意幫助每一個框架變得更好。框架很多比如Triton、vLLM、SGLang。現在又冒出一堆強化學習框架比如verl和NeMo RL。后訓練和強化學習這塊正在爆炸。所以如果你想基于某個架構做開發選CUDA最有意義,因為你知道它的生態很好。

你知道如果出了問題,問題更可能出在你自己的代碼里而不是底下那堆積如山的底層系統上。別忘了你面對的是多么龐大的代碼規模。當系統不工作時你要問自己是我錯了還是計算機錯了?你當然希望每次都發現是自己錯了,因為只有這樣你才能始終信任計算機。顯然我們自己還有很多bug。但關鍵在于我們的系統已經被無數次檢驗過,你可以放心地在上面構建。這就是我想說的第一點即生態系統的豐富性、可編程性和能力。

第二點如果你是個開發者,你最想要的是一個裝機基礎。你希望自己的軟件能跑在很多其他計算機上。你不是只為自己寫軟件而是為你所在的集群或別人的集群寫,因為你是框架開發者。英偉達的CUDA生態系統最終就是它最大的財富。

我們現在有數億個GPU在外面,每個云里都有。從A10、A100、H100、H200到L系列、P系列以及各種尺寸和各種形狀。如果你是個機器人公司,你希望那個CUDA堆棧能直接在機器人內部運行。我們幾乎無處不在。這個裝機基礎意味著一旦你開發了軟件或模型,它在任何地方都能用。這個價值無可估量。

最后我們存在于每一個云里,這讓我們真正獨一無二。如果你是個AI公司或開發者,你不確定會和哪個云服務商合作也不知道想把負載跑在哪里。沒關系,我們無處不在包括你自己的機房。生態系統的豐富性、裝機基礎的廣泛性、存在位置的多樣性,這些加在一起讓CUDA價值連城。

帕特爾:有道理。但我想問的是這些優勢對你最大的客戶來說到底有多重要?對很多人來說CUDA可能很有價值。但你收入的大頭其實來自那些有能力自己搭建軟件棧的大客戶。特別是如果未來AI進入一些可以用強化學習進行嚴格驗證的領域,那問題就變成了誰能寫出在大型集群上跑得最快的矩陣乘法和注意力內核?這是一個非常可驗證的優化問題。

那些超大規模云廠商完全有能力自己寫這些定制內核。當然英偉達的性價比可能還是更好所以他們可能依然會選擇英偉達。但這樣一來問題就變成了最后是不是只比誰的硬件規格更好以及每美元能買到的算力和帶寬更多?

歷史上英偉達靠著CUDA護城河,在AI硬件和軟件上都能保持70%以上的利潤率。但現在的問題是如果你最大的客戶其實有能力繞過這條護城河,你還能維持這么高的利潤率嗎?

黃仁勛:我們分配給這些AI實驗室的工程師數量是驚人的,跟他們一起工作優化他們的軟件棧。原因是沒人比我們更懂我們的架構。這些架構不像CPU那么通用。CPU有點像凱迪拉克且好開和不飆快車,誰都能開得不錯且有巡航控制,一切都很簡單。而英偉達的GPU和加速器更像F1賽車。我能想象每個人都能開到160公里時速,但要推到極限需要相當多的專業知識。我們用大量AI來寫內核。

我很確定在相當長一段時間內我們仍然會被需要。我們的專業知識常常能讓AI實驗室合作伙伴輕松再提升2倍性能。優化完一個內核或整個軟件棧后,模型速度提升50%、2倍乃至3倍,這很常見。考慮到他們擁有所有Hopper和Blackwell的集群規模,這是一個巨大的數字。提升一倍直接等于收入翻倍。

英偉達的計算堆棧在總擁有成本TCO上是全世界最好的,沒人能比。沒有任何一個平臺能向我展示出比我們更好的性能與TCO比。Dylan的InferenceMAX基準測試就擺在那里,誰都可以用。但TPU不來測且Trainium也不來測。我很鼓勵他們用InferenceMAX來展示自己所謂的超低推理成本。但很難因為沒人愿意來。

還有MLPerf,我也很想讓Trainium來展示他們一直宣稱的40%優勢。也很想聽他們展示TPU的成本優勢。但在我看來從第一性原理出發他們說的那些優勢完全說不通。所以我認為我們成功的原因很簡單就是我們的TCO太好了。

第二你說我們60%的客戶是前五大云廠商,但這些業務大部分是面向外部的。比如AWS中使用英偉達的芯片大部分是給外部客戶而不是內部用。Azure里的客戶顯然也都是外部的,甲骨文的同樣如此。他們青睞我們是因為我們的影響力大,我們能給他們帶來全世界最優秀的客戶且這些客戶都建在英偉達上。而這些公司之所以建在英偉達上,是因為我們的影響力和多功能性太強了。

所以我認為這個飛輪是裝機基礎、架構的可編程性、生態系統的豐富性,再加上世界上有成千上萬家AI公司。如果你是AI初創公司你會選哪個架構?你會選最豐富的而我們就是最豐富的,你會選安裝基礎最大的而我們就是最大的,你會選生態最完善的。這就是飛輪。

結合以上幾點來看我們的每美元性能最好且客戶的Token成本最低。我們的每瓦性能世界最高,所以如果一個合作伙伴建了一個1吉瓦的數據中心,這個數據中心最好能產出最大量的收入和Token,這直接等于收入。你希望它產出盡可能多的Token來最大化收入,而我們是世界上每瓦Token數最高的架構。另外如果你的目標是出租基礎設施,我們有世界上最多的客戶。這就是飛輪運轉的原因。

帕特爾:有意思。我想問題歸根結底是實際的市場結構到底是什么樣?因為即使有其他公司存在,可能有一個世界里面成千上萬家AI公司每家都占大致相等的算力份額。但現實情況是即便通過這五大云廠商,真正在亞馬遜上用算力的其實是Anthropic、OpenAI以及那些大型基礎實驗室。這些大玩家自己有能力也有資源讓不同的加速器跑起來。

如果你說的這些關于性價比和每瓦性能等等都是真的,那為什么像Anthropic這樣的公司幾天前剛宣布和博通與谷歌達成一項涉及多吉瓦的TPU交易,把他們大部分算力放在上面?對谷歌來說TPU也占了他們絕大部分算力。所以如果我看這些大型AI公司似乎他們的算力曾經全是英偉達現在不是了。我很好奇如果紙面上這些優勢都成立,他們為什么偏偏選了別的加速器?

黃仁勛:Anthropic只是一個特例并不是什么大趨勢。你可以想一想如果沒有Anthropic這家公司,TPU哪來的增長?百分之百是因為Anthropic。同樣如果沒有Anthropic,Trainium又哪來的增長?百分之百也是因為Anthropic。這基本上是公開的秘密了。不是什么ASIC的機會變得很多而是只有一個Anthropic而已。

帕特爾:但OpenAI和AMD有交易且他們自己在造Titan加速器。

黃仁勛:是的,但我覺得大家都承認他們絕大部分算力還是跑在英偉達上。我們仍然會一起做很多工作。我不介意別人用別的東西、嘗試別的東西。如果他們不嘗試怎么知道我們的有多好?有時候你需要被提醒一下。我們必須不斷贏得我們現在的位置。

總有人夸下海口。你看看有多少ASIC項目被取消了。僅僅因為你要造一個ASIC你還得造出比英偉達更好的東西這沒那么容易。實際上這不合理除非英偉達一定有什么缺陷。但我們的規模和速度擺在這里,我們是世界上唯一一家每年都推出新品的公司且每年都實現巨大飛躍。

帕特爾:我猜他們的邏輯是它不需要比英偉達更好,只要不比70%差太多就行,因為他們付給你70%的利潤率。

黃仁勛:不,別忘了ASIC的利潤率也很高。假設英偉達利潤率是70%且ASIC利潤率是65%。你到底省了什么?

帕特爾:你是說像博通那樣的?

黃仁勛:對。你得付錢給別人。據我所知ASIC利潤率非常高,他們自己也這么認為且對他們驚人的ASIC利潤率很自豪。

所以你問為什么。很久以前我們就是沒能力做。當時我沒有深刻意識到做一個像OpenAI、Anthropic這樣的基礎AI實驗室有多難以及他們需要供應商本身的巨額投資。我們當時沒能力投資Anthropic幾十億美元來換取他們用我們的算力。但谷歌和AWS有能力。他們一開始就投入巨資且作為回報Anthropic用了他們的算力。我們當時就是沒能力。

我的失誤是我沒有深刻意識到他們真的別無選擇,沒有風投會投50到100億美元到一個AI實驗室指望它變成Anthropic,這是我的失誤。但即使我當時理解了我也不認為我們有能力那么做。但我不會再犯同樣的錯誤了。

我很樂意投資OpenAI也很樂意幫他們擴展,我相信這是必要的。后來當我有能力時Anthropic來找我們,我很樂意成為投資者且很樂意幫他們擴展。我們當時就是做不到。如果我能讓一切重來,如果當時的英偉達有現在這么大我會非常樂意那么做。

03英偉達為什么不成為超大規模云廠商?

帕特爾:多年來英偉達一直是AI領域賺錢并賺大錢的公司。現在你在投資,比如據報道你們已向OpenAI投了300億美元并向Anthropic投了100億美元。現在他們的估值漲了且我相信還會繼續漲。所以如果這些年來你一直在給他們提供算力且你看到了它的發展方向,而他們一兩年前的價值只有現在的十分之一甚至一年前,而你又有那么多現金,那要么英偉達自己成為一個基礎實驗室投入巨資去做,要么在現在這個估值下更早地做你這些交易。而且你有現金。所以為什么不更早做呢?

黃仁勛:我們在力所能及的時候盡快做了且一有能力就盡快做了。如果我能我會更早做。在Anthropic需要我們做的時候我們就是沒能力,那時這不在我們的考慮范圍內。

帕特爾:怎么講?是錢的問題嗎?

黃仁勛:是的即投資規模。我們當時從未在公司外部做過投資,更不用說那么大數額了。我們沒有意識到我們需要這么做。我一直以為他們可以像所有公司一樣去風投那里融資。但他們想做的事風投做不到。OpenAI想做的事風投做不到。我現在認識到了但我當時不知道。

但這就是他們的天才之處,他們聰明就聰明在這里。他們當時就意識到必須做那樣的事。我很高興他們做到了。即使這導致Anthropic去找了別人,我仍然很高興它發生了。Anthropic的存在對世界是好事且我為此高興。

帕特爾:我想你們仍然在賺很多錢而且每個季度都賺得更多。既然你有這么多不斷賺來的錢,英偉達應該用它做什么?有一個答案是已經出現了一整套中間商生態系統,把資本支出轉化為這些實驗室的運營支出讓他們可以租算力。因為芯片很貴但它們生命周期里能賺很多錢,因為AI模型越來越好。它們產生的Token價值在增加但部署成本高。英偉達有錢做資本支出。事實上據報道你們正在支持CoreWeave且金額高達63億美元并已經投了20億。英偉達為什么不自己成為一個云服務商?為什么不自己成為超大規模云廠商并自己出租算力?

黃仁勛:這是我們公司的理念且我認為是明智的。我們應該做必要的事但盡量少做。意思是說在我們構建計算平臺的工作上如果我們不做,我真心相信沒人會做。如果我們不冒我們冒的那些險,如果我們不按我們的方式做NVLink并不構建整個軟件棧,不按我們的方式創建生態系統并不投入20年CUDA并在大部分時間里虧損,如果我們不做沒人會做。

如果我們不創建所有CUDA-X庫使它們面向特定領域,十五年前我們開始做特定領域庫,因為我們意識到如果我們不創建這些特定領域庫,無論是光線追蹤、圖像生成還是早期AI工作、這些模型,或者數據處理、結構化數據處理、向量數據處理,如果我們不創建沒人會做。我完全相信這一點。我們為計算光刻做了一個庫叫cuLitho,如果我們不做沒人會做。所以加速計算之所以能有今天的進步是因為我們做了這些。

所以我們應該做那件事且應該全身心投入并全力以赴去做。然而世界上有很多云,如果我不做總有人會做。所以我們奉行做必要的事但盡量少做的理念,它存在于我們公司的每一天。我做的每一件事都用這個視角來看。

就云而言如果我們不支持CoreWeave存在,這些新云、這些AI云就不會存在。如果我們不幫CoreWeave它們就不會存在。如果我們不支持Nscale他們就不會有今天的成就。如果不支持Nebius他們也不會是今天這樣。現在他們做得非常好。

這是一種商業模式。我們應該做必要的事且盡量少做。所以我們投資于我們的生態系統因為我希望我的生態系統蓬勃發展。我希望這個架構、AI能夠連接盡可能多的行業、盡可能多的國家,讓整個星球都建立在AI之上并建立在美國技術棧之上。這個愿景正是我們在追求的。

還有一件事,有很多優秀的基礎模型公司且我們盡量投資所有人。這是我們做的另一件事。我們不挑贏家且我們需要支持所有人。這是我們應該做的也是我們的樂趣所在。這對我們的業務至關重要。但我們也不遺余力地不去挑贏家所以我投了一家就會投所有。

帕特爾:你為什么特意不挑贏家?

黃仁勛:首先這不是我們的工作。其次英偉達剛起步時有60家3D圖形公司而我們是唯一活下來的。如果你從這60家里猜誰會成功,英偉達會排在最不可能成功名單的首位。

這是很久以前的事了。英偉達的圖形架構恰恰是錯的且不是有點錯。我們造了一個完全錯的架構,開發者沒法支持它且它永遠不會成功。我們基于良好的第一性原理推理但最終得出了錯誤的解決方案。每個人都會把我們排除在外但我們活下來了。

所以我有足夠的謙遜認識到這一點即不要挑贏家。要么讓他們自己照顧自己,要么就照顧所有人。

帕特爾:有一點我沒明白,你說我們不是因為他們是新云就優先考慮他們想扶持他們,但你也列舉了一堆新云說沒有英偉達它們就不會存在。這兩件事怎么兼容?

黃仁勛:首先他們自己得想存在并且來請求我們幫助。當他們想存在并且有商業計劃、專業知識和熱情時,他們顯然覺得自己有些能力。但如果歸根結底他們需要一些投資來啟動,我們會支持他們。但他們越早啟動飛輪越好。

你的問題是我們想不想做融資業務?答案是不想。有人在做融資業務,我們寧愿和他們合作而不是自己當融資方。我們的目標是專注于我們做的事且保持商業模式盡可能簡單并支持我們的生態系統。

當像OpenAI這樣的組織需要300億美元規模的投資因為他們在IPO之前,而我們深信他們會成為一家不可思議的公司,世界需要他們存在且世界希望他們存在,我希望他們存在并且他們順風順水,讓我們支持他們并讓他們擴展。這些投資我們會做因為他們需要我們。但我們不是想做盡可能多的事而是想做盡可能少的事。

帕特爾:這可能是個顯而易見的問題,但我們在GPU短缺的情況下過了好幾年,現在因為模型變好導致短缺還在加劇。

黃仁勛:我們確實缺GPU。

帕特爾:是的。英偉達以分配稀缺配額而聞名,不只看誰出價高而是看我們希望確保這些新云存在,比如給CoreWeave一些,給Crusoe一些,給Lambda一些。這對英偉達有什么好處?首先你同意這種分化市場的描述嗎?

黃仁勛:不同意。你的前提完全錯了。我們對這些事情足夠謹慎且非常謹慎。第一如果你不下采購訂單光說沒用。在收到采購訂單之前我們能做什么?所以第一件事是我們和每個人努力工作完成預測,因為這些東西要很長時間才能造好且數據中心也要很長時間。我們通過預測等方式來協調供需這是首要任務。

第二我們盡量和盡可能多的人做預測但最終你還是得下訂單。也許無論什么原因你沒下訂單,我能怎么辦?在某個時間點先到先得。除此之外如果你的數據中心還沒準備好,或者某些組件還沒準備好讓你啟用數據中心,我們可能會先服務別的客戶。這只是為了最大化我們自己工廠的吞吐量且我們可能會做一些調整。

除此之外優先順序是先到先得。你得下采購訂單。當然有一些故事。比如這一切始于一篇關于拉里·佩奇和馬斯克跟我吃飯時求取GPU的文章,那從未發生。我們確實吃了飯且是很愉快的一頓飯但他們從未求取GPU。他們只是需要下訂單。一旦下了訂單我們會盡力把產能分配給他們這不復雜。

帕特爾:好。所以聽起來有一個隊列,然后根據數據中心是否準備好、何時下采購訂單,你在某個時間拿到貨。但這聽起來仍然不是價高者得。有什么理由不那樣做?

黃仁勛:我們從不那樣做。

帕特爾:為什么不是價高者得?

黃仁勛:因為那是不好的商業實踐。你定好價格然后人們決定買不買。我理解芯片行業其他人會在需求高時漲價但我們不那樣做。這從來不是我們的做法。你可以信賴我們。我寧愿做個可靠的人并做行業的基石。你不用事后猜測。如果我報了一個價那就是那個價,就這樣。如果需求飆升價格依然穩定。

帕特爾:另一方面這就是你們和臺積電關系好的原因吧?

黃仁勛:是的,英偉達和他們做生意快30年了。英偉達和臺積電沒有簽署法律合同但總有一些粗略的公平。有時我對且有時我錯。有時我拿了好deal且有時我拿了差deal。但總體而言這段關系非常好。我可以完全信任他們并且可以完全依賴他們。

你可以信賴英偉達的一點是今年的Vera Rubin會不可思議。明年Vera Rubin Ultra會來。后年Feynman會來。再后一年我還沒介紹名字。每一年你都可以信賴我們。你去找世界上任何其他ASIC團隊隨便挑,你能說我可以把全部業務押在你身上且你每年都會為我服務嗎?你能說你的Token成本每年都會下降一個數量級且我可以像相信時鐘一樣相信你嗎?

我剛才對臺積電說了類似的話。對歷史上任何其他代工廠你都不可能這么說。但今天你可以對英偉達這么說。你可以每年都信賴我們。如果你想買10億美元的AI工廠沒問題。想買1億美元沒問題。1000萬美元或者只有一個機架都沒問題。或者只有一個顯卡沒問題。如果你想下1000億美元的訂單也沒問題。我們是當今世界上唯一一家你可以這么說的公司。

我也可以對臺積電這么說。我想買一個或者買十億個都沒問題。我們只需要經過規劃流程以及所有成熟的人會做的事。所以我認為英偉達能成為世界AI產業的基石,這個地位我們花了幾十年才達到。這是巨大的承諾和巨大的奉獻。我們公司的穩定性與一致性非常重要。

04是否應該向中國銷售AI芯片?

帕特爾:我想問關于中國的問題。我實際上不知道我是否支持向中國賣芯片但我喜歡對嘉賓唱反調。達里奧·阿莫代伊(Dario Amodei)支持出口管制,我問他為什么美國和中國不能都在數據中心里擁有一群天才?但既然你站在另一邊我會反過來問你。

一種思考方式是Anthropic幾天前發布了Mythos預覽版。這個模型他們甚至沒有公開發布,因為他們說它有很強的網絡攻擊能力且世界還沒準備好,要等他們把那些零日漏洞修補好。但他們說它發現了所有主流操作系統和每個瀏覽器的成千上萬個高危漏洞。它在OpenBSD里發現了一個漏洞且那個是專門設計來避免零日漏洞的操作系統,這個漏洞存在了27年。

所以如果中國公司、中國實驗室、中國政府能拿到AI芯片,來訓練一個像Claude Mythos這樣有網絡攻擊能力的模型并用更多算力跑幾百萬個實例,這是否對美國公司、美國國家安全構成威脅?

黃仁勛:首先Mythos是在相當普通的算力上訓練的且算力規模也相當普通,只不過訓練它的是一家非常優秀的公司。它所用的算力類型和數量在中國其實非常充足。你要知道芯片在中國是存在的。

他們制造了全球60%以上的主流芯片,這個產業對他們來說非常大。他們擁有世界上最厲害的計算機科學家之一。如你所知幾乎所有AI實驗室里大部分研究人員都是中國人,占了全球50%的AI研究人員。所以問題來了,既然他們已經擁有這么多資產如充足的能源與大量的芯片以及全球近半的AI人才,如果你真的擔心他們,那么創造一個更安全的世界最好的方式是什么?

去打壓他們把他們變成敵人可能不是最好的答案。他們是競爭對手且我們希望美國贏。但我認為進行對話、進行研究對話可能是最安全的。由于我們目前對中國的態度在這個領域明顯缺失。我們的AI研究人員和他們的AI研究人員交流至關重要。我們雙方都試圖就AI不應該被用來做什么達成一致,這至關重要。

關于在軟件里找漏洞,當然這正是AI應該做的。它會在很多軟件里找到漏洞嗎?當然。有很多漏洞。AI軟件里也有很多漏洞。這正是AI應該做的,我很高興AI達到了一個水平能幫我們提高這么多生產力。

有一件事被低估了,就是圍繞網絡安全、AI網絡安全、AI安全、AI隱私的生態系統非常豐富。有一整個AI初創公司生態系統在試圖為我們創造那個未來,即一個不可思議的AI智能體周圍有成千上萬個AI智能體在保護它并確保它安全。那個未來一定會到來。

認為會有一個AI智能體到處跑而沒人看著這有點瘋狂。我們很清楚這個生態系統需要蓬勃發展。事實證明這個生態系統需要開源且需要開放模型和開放軟件棧,這樣所有AI研究人員與所有厲害的計算機科學家才能去構建同樣強大的AI系統并保證AI的安全。所以我們需要確保的一件事是保持開源生態系統的活力,這不能被忽視。其中很多來自中國且我們不應該扼殺它。

關于中國當然我們希望美國擁有盡可能多的算力。我們受限于能源但有很多人在解決這個問題,我們不能讓能源成為國家的瓶頸。但我們也希望世界上所有的AI開發者都在美國技術棧上開發,并把AI的進步尤其是開源的部分貢獻給美國生態系統。創建兩個生態系統將是極其愚蠢的,一個開源的且只能跑在外國技術棧上,一個封閉的且跑在美國技術棧上。我認為這對美國將是可怕的后果。

帕特爾:信息量很多,我梳理一下。中國有算力但有些估計說因為他們沒有EUV也就是因為芯片制造出口管制,他們實際能生產的Flops只有美國的十分之一。那么他們最終能訓練出像Mythos這樣的模型嗎?能。但問題在于因為我們有更多的Flops,美國實驗室能先達到這些能力水平因為Anthropic先達到了。

另外就算他們訓練出這樣的模型,大規模部署的能力也很重要。如果你有個網絡黑客有一百萬個實例比有一千個危險得多。所以推理算力真的很重要。事實上他們有這么多優秀的AI研究人員,這恰恰是可怕的地方,因為讓這些工程師研究人員更高效的是什么?是算力。

如果你和美國任何一個AI實驗室聊他們會說限制他們的是算力。DeepSeek創始人、通義千問領導層都說過。他們說他們受限于算力。那么問題來了,我們讓美國公司因為有更多算力而先達到Mythos級別的能力并讓我們的社會為此做好準備,這不是更好嗎?而中國因為算力少會更晚達到這個水平?

黃仁勛:我們的目標當然應該始終是第一個到達也始終擁有更多算力。但要讓你描述的那種結果成立,你必須把情況推到極端也就是他們得完全沒有算力。只要他們還有一些算力,問題就變成了到底需要多少才夠?事實上中國擁有的算力是巨大的。你剛才也說了他們是世界第二大計算市場。如果他們真想集中算力做一件事他們完全有能力做到。

帕特爾:但這是真的嗎?有人估計說中芯國際在工藝節點上落后。

黃仁勛:他們擁有的能源是驚人的對吧?AI是個并行計算問題不是嗎?為什么他們不能因為能源幾乎免費就把4倍、10倍的芯片放在一起?他們有這么多能源。他們有完全空置且完全通電的數據中心。他們的基礎設施容量巨大。如果他們想他們就把更多芯片聚在一起即使是7納米的。

他們制造芯片的能力是世界上最大的之一,半導體行業知道他們壟斷了主流芯片。他們有超額產能且產能過剩。所以認為中國將無法獲得AI芯片的想法完全是胡說八道。當然如果你問我如果全世界根本沒有算力美國會不會遙遙領先?但那不是一個真實場景。他們已經擁有大量算力。你擔心的那個閾值他們已經達到并超過了。

所以我認為你誤解了,AI是一個五層蛋糕,最底層就是能源。當你能源充足時它可以彌補芯片的不足。如果你芯片充足它可以彌補能源的不足。例如美國能源稀缺,這就是為什么英偉達必須不斷推進架構并做極端協同設計,以便在芯片運出量少的情況下因為能源太有限而我們的每瓦吞吐量高得離譜。

但是如果你的瓦特數完全充足且幾乎是免費的,你會在乎每瓦性能嗎?你會有很多。你可以用舊芯片來做。7納米芯片基本上就是Hopper。我必須告訴你今天的模型大部分是在Hopper這一代上訓練的。所以7納米芯片已經足夠好了。能源豐富是他們的優勢。

帕特爾:但還有他們能否制造足夠多芯片的問題。

黃仁勛:但他們能。證據是什么?華為剛剛度過了公司歷史上業績最好的一年。

帕特爾:他們出貨了多少芯片?

黃仁勛:大量。數百萬個,比Anthropic擁有的多得多。

帕特爾:問題在于中芯國際能生產多少邏輯芯片以及能生產多少內存?

黃仁勛:我告訴你實際情況。他們有大量的邏輯芯片也有大量的HBM2內存。

帕特爾:但如你所知訓練和推理的瓶頸往往是帶寬量。所以如果你用的是HBM2,我不記得具體數字,但和你最新的產品比內存帶寬可能差了一個數量級,這非常大。

黃仁勛:華為是一家網絡公司。

帕特爾:但這不能改變你需要EUV來制造最先進HBM的事實。

黃仁勛:完全不對。你可以把它們聚在一起就像我們用NVL72聚在一起一樣。他們已經展示了硅光子技術,把所有計算連成一個巨大的超級計算機。你的前提完全錯了。

事實是他們的AI發展進展得相當順利。世界上最好的AI研究人員因為他們算力有限,他們也提出極其聰明的算法。記住我剛才說摩爾定律每年大約進步25%。然而通過優秀的計算機科學我們仍然可以把算法性能提高10倍。我的意思是優秀的計算機科學才是杠桿。

毫無疑問MoE是一個偉大的發明。所有那些令人難以置信的注意力機制減少了計算量。我們必須承認AI的大部分進步來自算法進步而不僅僅是原始硬件。如果大部分進步來自算法、計算機科學和編程,那告訴我他們的AI研究大軍不是他們的根本優勢?我們看到了。DeepSeek絕不是一個無關緊要的進展。要是哪天像DeepSeek這樣的成果先在華為平臺上出現,那對我們國家會是非常糟糕的結果。

帕特爾:為什么?因為目前像DeepSeek這樣的模型如果是開源的,可以在任何加速器上跑。為什么將來會不是這樣?

黃仁勛:假設它針對華為優化了且針對他們的架構優化了,那就會讓我們的處于劣勢。你描述了一種我認為是好消息的情況。一家公司開發了軟件并開發了一個AI模型且在美國技術棧上跑得最好。我認為那是好消息。你把它作為前提說那是壞消息。我來告訴你真正的壞消息即世界上所有的AI模型都是在非美國硬件上開發的并且跑得最好。

帕特爾:我想我只是沒看到證據表明存在巨大的差異會阻止你切換加速器。美國的實驗室正在跨所有云且跨所有加速器跑他們的模型。

黃仁勛:我就是證據。你拿一個為英偉達優化的模型,然后試著在別的東西上跑。

帕特爾:但美國的實驗室確實在那么做。

黃仁勛:而且它們跑得并不更好。英偉達的成功就是完美的證據。AI模型是在我們的軟件棧上創建的且在我們的軟件棧上跑得最好,這怎么就不合邏輯了?

帕特爾:Anthropic的模型在GPU上跑也在Trainium和TPU上跑。

黃仁勛:需要做很多工作才能改過來。但是去全球南方并去中東。開箱即用,如果所有AI模型都在別人的技術棧上跑得最好,那你現在就是在提出一個荒謬的主張說這對美國是好事。

帕特爾:但我不理解這個論點。假設中國公司先推出了下一個Mythos。他們先在美國軟件里發現所有安全漏洞,但他們可以在英偉達硬件上運行然后擴展到全球南方。這怎么會是好事?

黃仁勛:那不好。所以我們別讓那發生。

帕特爾:你為什么認為這是完全可以替代的,如果你不給他們運算力,它就會被華為完全取代?他們是落后的對吧?他們的芯片比你差。

黃仁勛:現在有證據即他們的芯片產業巨大。

帕特爾:你可以直接比較一下H200和華為910C的Flops、帶寬或內存。華為那款大概只有H200的二分之一到三分之一。

黃仁勛:他們用更多的數量來彌補。

帕特爾:看來你的論點是他們有所有這些現成的能源對吧?他們需要用芯片來填充。

黃仁勛:而且他們擅長制造。

帕特爾:我相信最終他們也許能在制造上超過所有人。但眼下這幾年很關鍵。

黃仁勛:你說的關鍵幾年具體是哪些年?

帕特爾:就是接下來的幾年。我們會擁有能發動各種網絡攻擊的模型。

黃仁勛:在那種情況下如果接下來的幾年是關鍵,那么我們必須確保世界上所有的AI模型都是在美國技術棧上構建的。

帕特爾:如果它們是在美國技術棧上構建的,那又怎么防止它們如果它們擁有更先進的能力去發動等同于Mythos的網絡攻擊呢?

黃仁勛:無論如何都沒有保證。

帕特爾:但如果你提早擁有它,我們可以為它做準備。

黃仁勛:聽著你為什么要讓AI產業的一層失去整個市場以便你能讓另一層受益?有五層且每一層都必須成功。最需要成功的那一層是AI應用。你為什么如此執著于那個AI模型和那一家公司?為了什么?

帕特爾:因為這些模型實現了這些令人難以置信的攻擊能力而且你需要算力來運行它們。

黃仁勛:能源、芯片和AI研究人員生態系統使它成為可能。

帕特爾:好我們退一步說。中國得自己建出足夠的7納米產能。別忘了他們現在還卡在7納米,而你們會往3納米、2納米、1.6納米走比如Feynman那一代。到時候你在用1.6納米他們還在7納米。他們只能靠數量來彌補單顆芯片的性能差距。而他們能源充足。你賣給他們越多芯片他們手里的總算力就越多。

黃仁勛:聽著我只是覺得你的說法太絕對了。美國理應領先。美國的算力規模比世界上任何其他地方都高出100倍。美國理應領先。好吧美國現在就領先。英偉達打造的是最先進的技術。我們確保美國實驗室最先知道這些技術并最先有機會購買。如果他們錢不夠我們甚至會投資他們。美國理應領先。我們想盡一切辦法確保美國領先。第一點你同意嗎?我們確實正在這么做。

帕特爾:但如果他們的瓶頸是算力,把芯片運到中國怎么能讓美國保持領先?

黃仁勛:不。我們有Vera Rubin給美國。Vera Rubin是給美國的。現在我算不算美國的一部分?你把我算作美國的一部分嗎?

帕特爾:算。

黃仁勛:那英偉達呢?你把英偉達算作一家美國公司對吧?第一為什么我們不能拿出一種更平衡的監管方式讓英偉達能在全球取勝,而不是把全球市場拱手讓掉?為什么要讓美國把世界讓出去?

芯片產業是美國生態系統的一部分,是美國技術領導力的一部分,是AI生態系統的一部分也是AI領導力的一部分。為什么你的政策和你的理念會導向讓美國放棄全球市場中如此巨大的一塊?

帕特爾:阿莫代伊曾引用過一句話,他說這就像波音吹噓我們向敵對國家出售核彈但導彈外殼是波音制造的。這在某種程度上支持了美國技術棧。從根本上說你在給敵國這種能力。

黃仁勛:把AI和你剛才提到的那些東西相提并論是荒唐的。

帕特爾:但AI類似于濃縮鈾對吧?它可以有積極用途也可以有消極用途。我們仍然不想把濃縮鈾送到其他國家。

黃仁勛:這是一個糟糕的類比且一個不合邏輯的類比。

帕特爾:但是如果這些算力可以運行一個能對美國所有軟件進行零日漏洞利用的模型,那它怎么就不是一種武器呢?

黃仁勛:首先解決這個問題的方法是與研究人員、與中國、與所有國家進行對話,確保人們不以那種方式使用技術。這是必須發生的對話。

第二點我們還需要確保美國領先,Vera Rubin、Blackwell在美國大量供應并堆積如山。顯然我們的結果會顯示這一點。我們有大量的算力。我們這里有很棒的AI研究人員。

然而我們也必須認識到AI不僅僅是一個模型。AI是一個五層蛋糕。AI產業在每一層都很重要且我們希望美國在每一層都獲勝包括芯片層。放棄整個市場不會讓美國長期在芯片層、在計算堆棧中贏得技術競賽,這就是事實。

帕特爾:我想關鍵問題是現在向中國賣芯片怎么能幫我們在長期獲勝?你看特斯拉向中國賣了很久的電動汽車,iPhone也在中國賣得很好。但這些并沒有把中國鎖定在美國的技術生態里。他們照樣做出了自己的電動汽車且現在在全球占主導。智能手機也是一樣。

黃仁勛:當我們今天開始對話時你承認英偉達的地位非常不同。你用了護城河這樣的詞。對我們公司來說最重要的事情是我們生態系統的豐富性,這關乎開發者。50%的AI開發者在中國。美國不應該放棄這一點。

帕特爾:但我們美國有很多英偉達開發者,這并不能阻止美國實驗室將來也能夠使用其他加速器。事實上現在他們也在使用其他加速器這很好。我不明白為什么在中國情況不會是這樣,如果你向他們出售英偉達芯片就像谷歌可以使用TPU和英偉達一樣。

黃仁勛:我們得持續創新。你可能也知道我們的份額在增長而不是在縮小。你剛才隱含了一個前提即就算我們在中國市場競爭也遲早會輸掉。我不是那種一醒來就覺得自己會輸的人。這種輸家心態和輸家前提對我來說毫無意義。

我們不是在造汽車。汽車今天買這個品牌明天換另一個很容易。計算不是這樣。x86能活到今天是有原因的且ARM那么有粘性也是有原因的。這些生態系統很難替代。換掉它們需要花大量時間和精力且大多數人根本不愿意這么做。所以我們的任務就是繼續培育這個生態系統并不斷推進技術,這樣我們才能在市場上競爭。

你基于遲早會輸這個前提就說我們應該放棄一個市場。我無法認同這種邏輯。這沒有道理。我不認為美國是輸家。我們這個行業不是輸家。

關鍵是你走向了極端。你的論點從極端開始認為如果我們在關鍵時刻給他們任何算力我們就會失去一切這很幼稚。

帕特爾:讓我為自己闡述一下我的論點。我的想法不是說存在某個關鍵的計算閾值而是任何邊際算力都是有幫助的。所以如果你有更多的算力你可以訓練一個更好的模型。

黃仁勛:我只想讓你承認對美國技術產業的任何邊際銷售都是有益的。

帕特爾:如果跑在這些芯片上的AI模型具備網絡攻擊能力,或者這些芯片被用來訓練這類模型并運行更多攻擊實例,那它雖然不是核武器但確實啟用了一種武器。

黃仁勛:按你這個邏輯你不如把它用到微處理器和DRAM上。你甚至可以用到電上。

帕特爾:但事實上我們確實對制造最先進DRAM的相關技術實施了出口管制。我們對中國制造芯片的各種東西都有各種出口管制。

黃仁勛:我們向中國銷售大量的DRAM和CPU且我認為這是正確的。

帕特爾:我想這回到了根本問題即AI是否不同?如果你擁有那種能在軟件中發現零日漏洞的技術,我們是否希望最大限度地減少中國首先達到并廣泛部署它的能力?

黃仁勛:我們希望美國領先且我們可以控制這一點。

帕特爾:如果芯片已經在那里且他們正用它們來訓練那個模型我們如何控制?

黃仁勛:我們有大量的算力。我們有大量的AI研究人員。我們在盡可能快地競賽。

帕特爾:再說一次我們擁有的核武器比任何人都多但我們不想把濃縮鈾送到任何地方。

黃仁勛:我們不是濃縮鈾且它是一個芯片而且是一個他們可以自己制造的芯片。

帕特爾:但他們從你這里購買是有原因的。我們有中國公司創始人的引言說他們受限于算力。

黃仁勛:因為我們的芯片更好。總的來說我們的芯片更好。這是毫無疑問的。如果沒有我們的芯片你能承認華為經歷了創紀錄的一年嗎?你能承認一大批芯片公司已經上市了嗎?你能承認嗎?

帕特爾:能。

黃仁勛:你能否也承認我們曾經在那個市場擁有非常大的份額而我們現在不再擁有大份額?我們也可以承認中國約占世界技術產業的40%。為美國技術產業放棄這個市場對我們的國家是一種傷害。對我們的國家安全是一種傷害且對我們的技術領先地位是一種傷害,這一切都為了一個公司的利益。這對我來說毫無意義。

帕特爾:我想我有點困惑,感覺你在說兩種不同的陳述。一是如果我們被允許競爭我們將贏得與華為的競爭因為我們的芯片會好得多。二是沒有我們他們也會做完全相同的事情。這兩件事怎么能同時進行呢?

黃仁勛:這顯然是真的。在沒有更好選擇的情況下你會接受唯一的選擇。這怎么不合邏輯了?這太合邏輯了。

帕特爾:他們想要英偉達芯片是因為它們更好?

黃仁勛:是的。

帕特爾:芯片更好意味著更多的算力且更多的算力意味著你可以訓練更好的模型。

黃仁勛:我們的芯片更好不只是算力更高,還因為它更容易編程且我們有更好的生態系統。而且我們向中國賣芯片美國自己也在受益。我們維持了美國的技術領先地位且開發者繼續在美國技術棧上工作。當這些AI模型擴散到全球時美國技術棧仍然是那個最適合運行它們的平臺。這樣我們就能持續推進和擴散美國技術。我認為這是好事也是美國技術領先地位中非常重要的一環。

現在你所倡導的政策導致美國電信行業基本上被政策排擠出世界,以至于我們不再控制自己的電信。我不認為那是明智的。這有點狹隘并且導致了我在向你描述的、你似乎很難理解的意外后果。

帕特爾:現在問題很清楚就是好處和成本哪個更大。我想讓你承認一個潛在的成本。算力是訓練強大模型的輸入而強大模型確實有很強的攻擊能力比如網絡攻擊。美國公司先達到Mythos那種能力水平然后暫緩發布,給美國公司和美國政府時間修補漏洞并加固軟件這是好事。

但如果中國因為獲得了更多算力而更早做出類似的模型并大規模部署,那會很糟糕。這件事到現在還沒發生一個關鍵原因就是美國公司包括英偉達擁有更多的算力。所以我們把芯片賣給中國就是在幫他們縮小這個差距。這是一個成本。先不談好處你承不承認這確實是一個潛在的成本?

黃仁勛:那我也告訴你另一個潛在的成本。如果我們放棄中國市場即世界第二大市場,就等于把AI堆棧中最重要的一層也就是芯片層整個讓了出去。他們會在自己的市場里發展規模并建立自己的生態系統。未來的AI模型會針對他們的技術棧做優化而他們的模型又是開放的。隨著AI擴散到全球其他地方他們的標準和技術棧反而會變得比我們的更優越。

帕特爾:我想我只是足夠相信英偉達的內核工程師和CUDA工程師,認為他們可以優化。

黃仁勛:AI不僅僅是內核優化你知道的。

帕特爾:當然但你可以做很多事情比如從蒸餾到一個非常適合你芯片的模型。

黃仁勛:我們會盡力的。

帕特爾:你擁有所有的軟件。很難想象即使他們在一段時間內有一個稍微更好的開源模型,會對中國生態系統產生長期鎖定。

黃仁勛:中國現在是全球開源軟件最大的貢獻者也是開放模型最大的貢獻者。而今天這些開源生態是建立在美國技術棧、建立在英偉達之上的。

AI技術棧的五層都很重要且美國應該每一層都贏。當然最重要的是最上面的應用層,誰能把AI擴散到社會里用得最多誰就從這場工業革命里受益最大。但每一層都必須成功。

如果我們把這個國家嚇住讓所有人都覺得AI是核彈且所有人都討厭AI、害怕AI,我不知道這對美國有什么好處。你這是在害美國。如果我們嚇唬所有人讓他們別去學軟件工程說AI會消滅所有軟件工程崗位,結果我們真的沒了軟件工程師那才是對美國最大的傷害。

如果我們嚇唬所有人讓他們別當放射科醫生,說計算機視覺已經免費了且AI讀片比人強,那我們是混淆了工作和任務。放射科醫生的工作是照護病人而讀片只是其中的一項任務。如果我們連這個都搞錯了且嚇得沒人去讀放射科,我們最后會缺放射科醫生并缺好的醫療服務。

所以我說當你從一個極端前提出發把一切看成要么零要么無窮,最后就會用一種不真實的方式嚇唬人。真實世界不是這樣的。

我們希望美國第一嗎?當然。我們需要AI技術棧的每一層都領先嗎?當然。

你今天談Mythos因為Mythos確實重要。但幾年后當美國想把我們的技術棧、我們的技術推廣到全世界比如到印度、中東、非洲、東南亞,當我們的國家想出口技術且想出口標準的時候,我希望到那時我們倆能再聊一次。到那天我會告訴你你今天設想的這些政策是如何讓美國無緣無故地放棄了世界第二大市場的。

我們不應該主動放棄這個市場。如果競爭不過失去也就失去了但為什么要主動讓出去?現在沒人主張全有或全無,不是說我們要把所有東西都賣給中國。沒人這么主張。

我們應該始終把最好的技術、最多的技術優先留在美國,并且讓美國最先擁有。但與此同時我們也應該去全球各地競爭并贏下市場。這兩件事可以同時做到。只是需要一些分寸、一些成熟而不是非黑即白。這個世界不是非黑即白的。

帕特爾:好關鍵在于這一點。他們會針對自己幾年后能造出的最好芯片來優化模型。這些模型會被出口到世界各地從而形成標準。由于EUV出口管制正如我們所說你們將邁向1.6納米。但即使幾年后他們很可能仍然停留在7納米。

在國內他們可能會說我們有這么多能源且可以大規模量產所以繼續用7納米也沒問題。但在出口市場上他們的7納米芯片要直接跟你們的1.6納米芯片競爭。到那時候他們的模型必須針對7納米做極其深度的優化,以至于在7納米上跑他們的模型反而比在你們的1.6納米上跑效果更好。

黃仁勛:我們能不能先看看事實?Blackwell在光刻技術上比Hopper先進了50倍嗎?差得遠。我反復強調過摩爾定律已經死了。從Hopper到Blackwell單看晶體管姑且說提升了75%吧而且中間隔了三年。但Blackwell比Hopper快50倍。

我的觀點是架構很重要且計算機科學也很重要。半導體物理學當然重要但計算機科學同樣重要。AI的影響力主要來自整個計算堆棧,這就是為什么CUDA如此有效且如此受歡迎的原因。它是一個生態系統且一個計算架構并提供了極大的靈活性。你想徹底改變架構且搞出MoE、搞出擴散模型、搞出分解式架構都能做到而且很容易做到。

事實是AI對上層堆棧的依賴程度不亞于下層架構。從這個角度說我們的架構和軟件堆棧是針對我們自己的生態系統優化的這本身就是優勢。正如我們剛對話時就談到英偉達的生態系統有多豐富。為什么大家總是首選CUDA來編程?因為他們確實喜歡且中國的研究人員也一樣。

但如果我們被迫離開中國這是一個政策錯誤,顯然會適得其反且對美國不利。它會加速他們的芯片產業并迫使他們所有的AI生態系統專注于自己的內部架構。現在糾正還不算太晚但事情已經在發生了。

你將來會看到他們不會停留在7納米這很明顯。他們擅長制造且會從7納米繼續往前推進。那5納米和7納米之間有10倍的差距嗎?答案是否定的。架構很重要且網絡也很重要,這就是英偉達收購Mellanox的原因。能源也很重要。所有這些都很重要且事情并不像你說的那么簡單。

05英偉達為什么不制造多種不同的芯片架構?

帕特爾:我們之前討論了臺積電和內存等環節的瓶頸。如果未來我們處在這樣一個局面即你已經占了N3節點的大部分產能且接下來會占N2的大部分,你會不會考慮回頭用N7的閑置產能?比如說AI需求太大且領先節點的擴產跟不上,那你就用舊節點來造Hopper或Ampere但加上我們今天知道的數值格式改進和其他優化。你覺得2030年之前會發生這種事嗎?

黃仁勛:沒必要。因為每一代架構的提升不光是靠晶體管尺寸。我們在工程、封裝、堆疊、數值格式、系統架構上做了大量工作。

產能不夠的時候再回頭去搞一個舊節點,那需要投入的研發成本沒人負擔得起。我們能負擔的是往前走而不是往回走。當然如果有一天全球產能真的徹底到頭了,問我愿不愿意回頭用7納米?我當然愿意。

帕特爾:有人跟我討論過一個問題即英偉達為什么不并行做幾個完全不同架構的芯片項目?比如像Cerebras那樣的晶圓級芯片或者像Dojo那樣的大封裝甚至做一個不帶CUDA的。你們有資源也有人才且可以同時做這些。既然AI和芯片架構的方向不確定為什么要把所有雞蛋放在一個籃子里?

黃仁勛:我們可以做只是我們沒有發現更好的方向。你說的那些我們都模擬過且結果證明它們不如現在的方案。所以我們不做。我們正在做的就是我們想做的。如果未來的工作負載發生根本性變化我不是指算法而是指實際的計算任務類型,這取決于市場的需求形態,我們可能會考慮增加其他類型的加速器。

比如最近我們納入了Groq且會把它整合到CUDA生態里。原因在于Token的價值現在已經很高了且可以對Token實行差異化定價。幾年前Token要么免費要么很便宜。現在不同客戶有不同的需求且愿意為不同的答案付不同的錢。比如我們的軟件工程師如果能給他們響應更快的Token讓他們效率更高,我愿意為此多付錢。

但這個市場是最近才出現的。所以我們決定擴展帕累托前沿并做一個響應更快但吞吐量更低的推理細分市場。以前吞吐量高就是更好,但現在我們認為可能存在一個高ASP(平均售價)Token的市場即使工廠的總吞吐量下降更高的單價也能彌補。這就是我們做這件事的原因。除此之外如果我有更多的錢我還是會投到英偉達現有的架構上。

帕特爾:這種高端Token和推理市場細分的想法很有意思。假設深度學習革命沒有發生英偉達現在在做什么?

黃仁勛:加速計算且我們一直在做這個。我們公司的基本判斷是通用計算的擴展能力基本到頭了。

所以我們把GPU和CUDA跟CPU結合起來,把CPU上的某些工作負載卸載到GPU上加速。這樣可以把一個應用提速100倍甚至200倍。這些應用可以是工程、科學、物理、數據處理、計算機圖形、圖像生成等等。即使沒有AI,英偉達也會是一家非常大的公司。

原因很簡單即通用計算繼續擴展的路基本走完了且出路在于特定領域的加速。我們起步于計算機圖形但還有很多其他領域涵蓋粒子物理、流體、結構化數據處理等等都能從CUDA受益。我們的使命就是把加速計算帶給世界并推進那些通用計算做不了的應用,幫助突破某些科學領域。早期的應用包括分子動力學、能源勘探的地震數據處理、圖像處理等等。

如果沒有AI我會很難過。但正因為我們在計算上取得的進步,我們讓深度學習變得普及了。任何研究人員、科學家、學生都能用一臺PC或一張GeForce顯卡做很厲害的科學。這個基本承諾一點都沒變。

你看GTC大會開頭那部分跟AI一點關系都沒有,包括計算光刻、量子化學、數據處理。這些工作依然非常重要。我知道AI很讓人興奮但還有很多人做著非常重要且跟AI無關的工作。張量不是唯一的計算方式。我們想幫助所有人。

帕特爾:非常感謝。

黃仁勛:不客氣。我很享受與你的對話。

帕特爾:我也是。

相關推薦
熱點推薦
立訊精密: 預計2027年Q3~Q4批量交付CPC

立訊精密: 預計2027年Q3~Q4批量交付CPC

每日經濟新聞
2026-04-20 21:40:20
特朗普:若有突破進展 愿同伊朗高級別領導人會面

特朗普:若有突破進展 愿同伊朗高級別領導人會面

財聯社
2026-04-20 21:36:15
輸山西10分!揪出3個“混子”球員,坑慘了廣東隊

輸山西10分!揪出3個“混子”球員,坑慘了廣東隊

體育哲人
2026-04-20 22:16:13
白發與身體有什么關系?務必了解!

白發與身體有什么關系?務必了解!

新浪財經
2026-04-20 02:03:22
多個城市門店暫停營業!又一老牌海鮮自助扛不住了?

多個城市門店暫停營業!又一老牌海鮮自助扛不住了?

藍鯨新聞
2026-04-20 17:59:30
騎士消息:登帝解散原因曝光,阿倫展現格局,G2出場情況更新

騎士消息:登帝解散原因曝光,阿倫展現格局,G2出場情況更新

冷月小風風
2026-04-20 10:36:47
ASML現任CEO:中國一旦自主開發設備,放棄我們的光刻機,就有可能用稀土卡我們脖子

ASML現任CEO:中國一旦自主開發設備,放棄我們的光刻機,就有可能用稀土卡我們脖子

芯火相承
2026-04-20 19:29:49
脫口秀女演員自曝在潑水節執勤經歷,“穿著警察制服,幾個水氣球連續正中面門,被高壓水槍滋胸和屁股,每年要扛出多個被潑蒙掉的女孩”

脫口秀女演員自曝在潑水節執勤經歷,“穿著警察制服,幾個水氣球連續正中面門,被高壓水槍滋胸和屁股,每年要扛出多個被潑蒙掉的女孩”

揚子晚報
2026-04-20 12:24:51
媒體人:廣東隊滑落至第五不能只怪杜鋒,陣容先天就有短板

媒體人:廣東隊滑落至第五不能只怪杜鋒,陣容先天就有短板

懂球帝
2026-04-20 23:43:05
哈蘭德:我背上很多抓痕,女朋友不太高興;父親教我不能假摔

哈蘭德:我背上很多抓痕,女朋友不太高興;父親教我不能假摔

懂球帝
2026-04-20 23:25:16
新華社快訊:保加利亞前總統拉德夫領導的政黨聯盟在議會選舉中大幅領先

新華社快訊:保加利亞前總統拉德夫領導的政黨聯盟在議會選舉中大幅領先

新華社
2026-04-20 20:46:23
宋仲基帶老婆看音樂會!發福油膩盡顯老態,凱蒂素顏比宋慧喬驚艷

宋仲基帶老婆看音樂會!發福油膩盡顯老態,凱蒂素顏比宋慧喬驚艷

金風說
2026-04-20 16:26:03
普通家庭千萬不要買“小聯排別墅”,看著很高級,住著卻難受!

普通家庭千萬不要買“小聯排別墅”,看著很高級,住著卻難受!

裝修秀
2026-04-20 10:50:03
頂流的日常,太正點了

頂流的日常,太正點了

陳意小可愛
2026-04-21 00:29:48
賴文峰出獄后已做爸爸!如今直播帶貨,吃楊鈺瑩過往愛情的紅利

賴文峰出獄后已做爸爸!如今直播帶貨,吃楊鈺瑩過往愛情的紅利

TVB的四小花
2026-04-20 18:57:25
預售價近40萬元的小鵬,把所有人都忽悠了!

預售價近40萬元的小鵬,把所有人都忽悠了!

新浪財經
2026-04-19 02:52:50
日本人破防了:DNA檢測日本祖先被證實,日本人不是徐福后代

日本人破防了:DNA檢測日本祖先被證實,日本人不是徐福后代

掠影后有感
2026-04-19 10:16:27
谷愛凌出席2026科學突破獎頒獎禮:與黃仁勛夫婦合影 氣質拉滿

谷愛凌出席2026科學突破獎頒獎禮:與黃仁勛夫婦合影 氣質拉滿

快科技
2026-04-20 08:11:06
一張封面讓以色列炸鍋,大使怒罵,雜志不道歉,最后視頻曝光

一張封面讓以色列炸鍋,大使怒罵,雜志不道歉,最后視頻曝光

海綿芝士局
2026-04-20 16:17:16
與孔令輝分手12年,被黑人托在肩上的馬蘇,終是為自己的風流買單

與孔令輝分手12年,被黑人托在肩上的馬蘇,終是為自己的風流買單

情感大頭說說
2026-04-18 21:06:00
2026-04-21 01:00:49

科技要聞

HUAWEI Pura X Max發布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

利潤暴跌7成,字節到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

旅游
游戲
手機
藝術
軍事航空

旅游要聞

以“Fun”為名,深圳布吉將發布全域旅游品牌IP

大司馬回歸兩個月,某音人氣穩居頂流行列,道出風光背后心酸現狀

手機要聞

Find X9 Ultra打造專業生態 口袋中的電影創作神器

藝術要聞

沙特官宣:全球最大單體建筑,延期十年!網友:又是畫餅?

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關懷版
×