![]()
輸入電子,輸出Token,中間是英偉達。
編輯|藍洞商業(yè) 趙衛(wèi)衛(wèi)
英偉達CEO黃仁勛接受播客主持人Dwarkesh Patel的深度訪談,一小時四十分鐘的內(nèi)容涵蓋了行業(yè)競爭格局、AI商業(yè)化和中國市場等諸多問題。
談到英偉達的定位時,他認為英偉達的業(yè)務本質(zhì)是「將電子轉化為Token」,其核心競爭力在于這一轉化過程的效率與工程藝術,而非單一軟件層面的商品化風險。
黃仁勛認為,英偉達的職責是,「必要之事盡力而為,力所能免之事絕不多做」,以此支撐這種轉化以極致的性能實現(xiàn)。他認為的「絕不多做」意味著,凡是英偉達無需親自完成的環(huán)節(jié),都會與合作伙伴共建生態(tài),交由生態(tài)伙伴落地。
此外,黃仁勛還提到,電力、內(nèi)存、封裝等上游瓶頸都能在2–3年內(nèi)被行業(yè)集群式突破,唯一真正棘手的搭建、安裝超大規(guī)模AI數(shù)據(jù)中心所必需的設施。英偉達的重要價值在于向整個供應鏈布道未來,促使上游CEO敢于下注大規(guī)模資本開支。
而對于競爭對手谷歌的TPU,黃仁勛認為谷歌TPU和亞馬遜的Trainium增長100%來自Anthropic這一個客戶,這是孤例,而非行業(yè)趨勢。
事實上,谷歌和亞馬遜AWS早期向Anthropic投入了數(shù)十億美元,芯片使用是投資條款的一部分,這與其他AI公司的采購邏輯不同,而英偉達是通用加速計算平臺,可運行分子動力學、量子色動力學、數(shù)據(jù)處理、流體力學等全領域工作負載。
本質(zhì)上,這是英偉達對行業(yè)的一種明確表態(tài):英偉達的真正護城河不是GPU性能本身,而是四重疊加,包括CUDA生態(tài)、裝機基數(shù)、協(xié)同設計能力、供應鏈上下游塑造力,而任何只針對芯片性能的挑戰(zhàn)都低估了系統(tǒng)。
更重要的是,黃仁勛明確反對當前的芯片對華管制政策,中國擁有全球50%的AI研究人員、60%的主流芯片制造、充沛的能源和大量空置數(shù)據(jù)中心,因而即使只使用7nm芯片,通過堆量也可彌補制程差距。
以下為經(jīng)過編輯訪談核心要點:
AI 不會使英偉達商品化甚至同質(zhì)化
問:我們已經(jīng)看到許多軟件公司估值崩塌,原因是市場預期AI將使軟件商品化。本質(zhì)上,英偉達制造的是軟件,由其他人來做物理制造。如果軟件被商品化了,英偉達是否也會被商品化?
黃仁勛:歸根結底,某種東西必須將電子轉化為Token。將電子轉化為Token、并使Token隨著時間推移變得更有價值——這一過程很難被徹底商品化。
從電子到Token的轉化是一段令人驚嘆的旅程。制造一個Token,就像讓一個分子比另一個分子更有價值、一個Token比另一個Token更有價值。其中所蘊含的藝術性、工程、科學與創(chuàng)造,我們正在實時見證它的發(fā)生。這一轉化、這一制造過程、以及其中涉及的科學,遠未被深入理解,這段旅程也遠未結束。我不認為英偉達會被商品化,當然,我們會讓它變得更高效。
我對公司業(yè)務的心智模型是,輸入是電子,輸出是Token,中間是英偉達。我們的職責是「必要之事盡力而為,力所能免之事絕不多做」,凡是不必自己做的,就與合作伙伴共建生態(tài)。
我也不認為企業(yè)軟件公司、工具類公司會被商品化。今天大多數(shù)軟件公司本質(zhì)上是工具制造商,Excel是工具,PowerPoint是工具,Cadence、Synopsys都是工具。
Agent的數(shù)量將指數(shù)級增長,工具使用者的數(shù)量也將指數(shù)級增長。新思科技的設計工具的實例數(shù)量將暴漲,因為會有大量Agent在使用布圖規(guī)劃器、布局工具、設計規(guī)則檢查器。今天我們受限于工程師數(shù)量,明天這些工程師將被大量Agent支撐,我們將以前所未有的方式探索設計空間。
供應鏈和護城河
問:據(jù)最新披露,英偉達對晶圓廠、存儲、封裝的采購承諾接近1000億美元,實際規(guī)模將達2500億美元。一種解讀是英偉達真正的護城河,是鎖定了未來數(shù)年稀缺組件的產(chǎn)能,即使有人做出了競品,他們是否能拿到內(nèi)存和邏輯產(chǎn)能,這是否是英偉達未來幾年的關鍵護城河?
黃仁勛:這是我們能做、而別人難以復制的事情之一。我們在上游做出了巨大的承諾,有些是顯性的,有些是隱性的——我們的供應鏈自己投入了大量資本,因為我告訴這些CEO:「讓我告訴你這個行業(yè)會有多大、為什么會這樣、讓我與你一起推演、讓我給你看我看到的。」
正因為這一「告知、啟發(fā)、對齊」的過程,上游不同行業(yè)的CEO們才愿意投資。為什么他們愿意為我投、而不是為別人投?因為他們知道我有能力消化他們的產(chǎn)能,并通過下游銷售出去。英偉達的下游供應鏈與下游需求如此龐大,他們才愿意在上游投入。
在GTC大會上,所有人都為規(guī)模與參與者所驚嘆。這是全360度的AI宇宙,所有人齊聚一堂。他們需要彼此見面,我把他們聚到一起,讓下游看到上游,上游看到下游,所有人一起看到AI的進展:更重要的是,讓他們親眼見到AI原住民、所有AI初創(chuàng)公司以及正在發(fā)生的所有精彩。我花大量時間,直接或間接地向我們的供應鏈、合作伙伴、生態(tài)系統(tǒng)傳達我們面前的機會。
有人常說:Jensen,大多數(shù)主題演講都是一個接一個的發(fā)布。但我們的Keynote總有一部分近乎教育。事實上這正是我的意圖:我必須確保上游與下游整條供應鏈、整個生態(tài)都理解即將到來的一切:為什么來、何時來、規(guī)模多大,并能像我一樣系統(tǒng)地推理。
關于你所說的護城河——我們有能力為未來而建。如果未來幾年我們的業(yè)務規(guī)模是1萬億美元,我們有供應鏈去支撐它。沒有我們的觸達能力、沒有我們業(yè)務的velocity,就沒有今天的一切。有現(xiàn)金流、就有供應鏈流(churns)。如果供應鏈流轉效率低,沒人會為一個架構去建供應鏈。我們能維持這種規(guī)模,只因為下游需求如此巨大。
行業(yè)競爭格局變化
問:若看谷歌TPU,全球前三大模型中可能有Claude、Gemini兩個是在TPU上訓練的。這對英偉達意味著什么?TPU專為矩陣乘法的大型脈動陣列優(yōu)化,沒有為線程調(diào)度、分支、內(nèi)存切換而浪費芯片面積。對于當前主要由矩陣乘組成的AI負載,這是否比GPU更有針對性?
黃仁勛:我們做的是完全不同的東西。英偉達做的是加速計算,不是張量處理單元。加速計算用于分子動力學、量子色動力學、數(shù)據(jù)處理、結構化與非結構化數(shù)據(jù)、流體力學、粒子物理——此外才用于AI。英偉達重塑了計算方式,從通用計算轉向加速計算。
我們的業(yè)務覆蓋范圍,是任何TPU或專用ASIC都比不了的。我們的GPU系統(tǒng)從設計之初就考慮了通用性,不管是誰,只要想做算力業(yè)務,都能直接用我們的設備,但很多公司自研的專用芯片系統(tǒng),只能自己內(nèi)部用,從一開始就沒設計成能給別人用的靈活架構。
正因為通用性強,現(xiàn)在所有主流云廠商的平臺上都有我們的GPU,不管是Google、AWS、Azure還是OCI,都能買到。不管是像xAI那樣自己搭集群跑模型的客戶,還是禮來(Eli Lilly)這樣要建超算做藥物研發(fā)的藥企,我們都能支持。
矩陣乘法是AI里很核心的運算,但它絕對不是AI的全部。要是你想搞出新的注意力機制,采用新的算力解耦方案,或者干脆發(fā)明全新的模型架構,比如把狀態(tài)空間模型(SSM)和其他技術結合的混合方案,就必須用能靈活編程的通用架構。哪怕你想把擴散模型和自回歸模型的技術結合起來,也得靠這種通用能力才能實現(xiàn)。
市面上任何你能想到的AI計算任務,我們的GPU都能跑通 ,這就是我們的核心優(yōu)勢,能讓研究者輕輕松松搞出新算法。而TPU這類專用芯片,和其他硬件一樣,只能靠摩爾定律每年擠25%左右的性能;要想實現(xiàn)10倍、100倍的性能飛躍,必須靠算法和計算方式的底層革新,這才是英偉達真正的護城河。
我第一次宣布Blackwell架構的能效比Hopper高35倍的時候,沒人信。后來行業(yè)人士證實,我實際留有余量 ,實際能效提升能到50倍,光靠摩爾定律根本做不到這種級別的提升。
我們靠的是多方面的創(chuàng)新:MoE(混合專家模型)這類新模型、并行計算、算力解耦和分布式架構,靠CUDA編寫新的核心計算函數(shù),再加上軟硬件極致協(xié)同設計,把部分計算任務放到NVLink高速互聯(lián)和Spectrum-X網(wǎng)絡里處理,才拿到了這種性能飛躍。
英偉達的邊界和錯失
問:報道說英偉達投資OpenAI 300億美元,Anthropic投入約100億美元,為什么不早投資,你早已經(jīng)看清了方向。英偉達為什么不做AI智算云(Neocloud)?
黃仁勛:只要我們有能力做,就立刻去做,要是能更早,我肯定會更早行動。當年Anthropic找我們投資的時候,我們既沒那個能力,也根本沒往這方面想。一方面是投資規(guī)模的問題,我們那時候從來沒做過對外投資,壓根沒意識到還需要做這件事。我當時還以為,他們跟其他公司一樣,找風投就能解決資金問題。
但他們要做的事,根本不是風投能扛得住的。沒有哪家風投會往一個前途未卜的AI實驗室投50到100億美元,除非他們后來做成了Anthropic這樣的規(guī)模。
他們早就看清了這一點,這就是他們的厲害之處。我當時沒看到這一層,但現(xiàn)在絕對不會再犯同樣的錯。我很慶幸能投資OpenAI,還支持它擴大規(guī)模,這一步非常關鍵;后來Anthropic再找我們的時候,我也很樂意成為他們的投資人。
「必要的事盡力做,非必要的事絕不做」(do as much as needed, as little as possible),這也是我們公司的哲學。
我們之所以要搭建計算平臺,是因為這件事要是我們不做,就沒人會去做——不管是NVLink、全棧技術,還是20年來持續(xù)虧損投入的CUDA,還有CUDA-X旗下的各類領域專用工具庫(比如cuLitho、光線追蹤、圖像生成、向量/結構化數(shù)據(jù)處理等等),這些事?lián)Q別人,根本不會去做。
但云業(yè)務不一樣,世界上有那么多云廠商,我們不做,總會有人做。
要是沒有CoreWeave,這些新興云廠商(Neocloud)也不會出現(xiàn);Nscale、Nebius這些廠商,也是一樣的道理。我們從不挑選行業(yè)贏家 ,30年前,有60家做3D圖形的公司,當時看這份名單,沒人會覺得英偉達能活下來。我們最早的圖形架構完全走錯了方向, 我一直記著這一點,也始終保持謙卑。
GPU 分配和臺積電的關系
問:在 GPU 長期缺貨的情況下,英偉達是怎么分配稀缺算力的?是不是誰出價高就給誰?
黃仁勛:我們從來不會這么做。我們定好價格,客戶自己決定買還是不買。芯片行業(yè)里有些公司會在需求高漲時漲價,但我們不會。你可以完全信賴我們——我更愿意做整個行業(yè)穩(wěn)定可靠的基石。我報給你的價格,就是最終價格。
我們的分配原則就是先到先得,依據(jù)是采購訂單(PO)以及客戶的數(shù)據(jù)中心是否就緒。如果你不下單,說再多都沒用。如果你的數(shù)據(jù)中心還沒建好、關鍵部件沒到位,無法立刻上架使用,我們可能會先把產(chǎn)能交給其他就緒的客戶,這樣做只是為了最大化工廠的出貨效率。
順便澄清一件事——網(wǎng)上傳拉里?佩奇、埃隆?馬斯克和我共進晚餐懇求GPU的故事,完全沒有發(fā)生過。晚餐確實有,氣氛也很好,但他們從來沒有求我給GPU,他們只需要正常下采購訂單就行。
英偉達和臺積電合作已近30年,我們之間甚至沒有正式的法律合同,靠的就是一種大致的公平與默契。有時候我占優(yōu),有時候他們占優(yōu);有時候我拿到更好的條件,有時候則相反,但整體合作關系極好,彼此完全信任、完全依賴。
你可以完全信賴英偉達每年的產(chǎn)品節(jié)奏:今年是AI超級芯片平臺Vera Rubin,明年是Vera Rubin Ultra,再下一年是Feynman,之后還有尚未公布名稱的新品。你可以像相信鐘表一樣篤定 ,每年你的Token成本都會實現(xiàn)數(shù)量級的下降。
我剛才也說到臺積電,歷史上沒有任何一家晶圓代工廠,能讓你給出這樣的評價。你可以來找我們買10億美元、1億美元、1000萬美元的AI工廠算力,也可以只買一個機架、一張顯卡;你甚至可以下1000億美元的超級訂單。當今全球只有我們兩家公司能做到這一點。
臺積電我也可以給出同樣的評價,想買一套設備,或是10億美元的產(chǎn)能,都沒問題,我們只需要走規(guī)劃流程,用成熟行業(yè)的方式推進就好。
中美AI 研究應該對話
問:為什么不應該對中國進行芯片出口管制?
黃仁勛:中國承擔了全球60%以上的主流芯片制造,他們擁有全球一些最優(yōu)秀的計算機科學家,所有AI實驗室里大部分AI研究人員都是中國人,全球50%的AI研究人員來自中國。
我認為開展對話,尤其是研究對話可能才是最安全的做法。正因為目前的競爭狀態(tài),這一領域的缺失格外明顯。AI研究人員之間必須對話,必須共同界定「AI不應用于什么」。
有一點一直被低估:圍繞網(wǎng)絡安全、AI網(wǎng)絡安全、AI安全、AI隱私與AI安全治理的生態(tài)體系。有一大批AI初創(chuàng)企業(yè)正在共同構建這樣的未來:一個核心超級智能體的周圍,會有成千上萬個AI智能體為其保駕護航,保障它的安全與可控。這樣的未來必然會到來。
如果放任一個AI智能體不受任何監(jiān)管地運行,這種想法本身就很不理智。因此我們必須確保開源生態(tài)保持活力,這一點絕不能忽視。而大量開源創(chuàng)新都來自中國,我們不應該扼殺這種活力。
AI是一套五層架構,最底層就是能源。能源充沛,就可以彌補芯片性能的不足;芯片數(shù)量充足,也能彌補能源的短缺。
舉個例子,美國的能源供應相對緊缺,這也是為什么英偉達必須持續(xù)升級架構、進行極致的軟硬件協(xié)同設計,即便我們出貨的芯片數(shù)量有限,受制于能源規(guī)模,也能實現(xiàn)極致的每瓦算力。
但如果能源供應極度充沛、成本幾乎為零,誰還會在意每瓦算力的高低?即便用老舊芯片也足夠實現(xiàn)目標。7nm芯片的能力已能對標Hopper,完全滿足訓練需求。今天主流大模型大多基于Hopper架構訓練。因此7納米芯片完全夠用,充沛的能源就是他們的核心優(yōu)勢。
但隨之而來的問題是,他們真的能生產(chǎn)出足夠多的芯片嗎?答案是可以。證據(jù)是什么?華為剛剛創(chuàng)下史上最佳年度業(yè)績,其芯片出貨量達數(shù)百萬顆,遠超Anthropic所使用的芯片總規(guī)模。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.