文 | 字母AI
黃仁勛近年來的變化,就是頭發比以前白了。
![]()
有人說白頭發是因為基因、歲數,也有一部分人認為,是因為焦慮、壓力。
2026年5月,黃仁勛在斯坦福大學面向在校學生的公開演講中說到,“我90%的工作都是硬撐,但任何工作,我都努力做到最好。”
實際上早在33年前,黃仁勛在采訪中就曾表示過他自己的壓力,黃仁勛說“英偉達距離倒閉只有30天。”
最近黃仁勛又多了一個頭發變白的理由,那就是OpenAI和博通一起發布了Jalape?o芯片。
這是OpenAI第一顆自研的推理芯片。從設計到流片只用了九個月,目標部署10GW,而且這顆芯片已經可以跑GPT-5.3了。
OpenAI跟Anthropic不一樣,后者又有谷歌的TPU,又有亞馬遜的Trainium。OpenAI此前一直是堅定的英偉達用戶,現在有了Cerebras還不夠,又和博通混到了一起。
英偉達還在狂奔,但英偉達有敵人了
5月20日,英偉達公布了最新一個季度的財報。單季營收816億美元,毛利率是74.9%,自由現金流接近490億美元。數據中心收入752億美元,同比增長92%。
顯然,英偉達仍然在春風得意。
但現在的局面就是,英偉達正在被圍攻。
就拿博通來說吧,他們最近的財報就很亮眼。在最新一個季度里,公司AI半導體業務收入達到108億美元,同比增長143%。
而博通預計,2026財年這塊業務的收入將達到約560億美元,而上一個財年約為200億美元。
博通跟英偉達不一樣,博通做的是ASIC,也就是“按客戶需求定做的AI芯片”。客戶想要什么芯片,它就幫客戶專門做什么芯片。
現在的AI算力不是一顆芯片在工作,而是幾萬、幾十萬顆芯片組成一個集群一起工作。模型訓練時,芯片要不斷交換參數;推理時,尤其是專家模型和長上下文任務,芯片之間也要頻繁傳數據。
也就是說你芯片算得再快,如果網絡跟不上,整個算力集群就會被最慢的通信環節拖住。
這就是博通的優勢了,博通本質上是一個通信公司。它除了做ASIC以外,還給它的客戶做連接這些芯片的高速以太網交換芯片。
比如博通最新的Tomahawk 6交換芯片,單顆交換能力達到102.4Tbps,面向的就是超大規模AI集群。OpenAI與博通的10GW合作公告里就明確寫到,合作內容也不只包括定制AI加速器,還明確包括配套的Ethernet網絡方案。
還有一點,博通足夠“中立”。
這是很多人都會忽略的地方。無論是OpenAI也好,還是Anthropic也好,他們都不希望把自己的核心芯片計劃交給另一家也在做大模型、做云服務的公司。
而博通剛好不做模型、不賣云,它也不和客戶搶最終用戶。 就是因為這層身份在,所以OpenAI和Anthropic才會都選擇它。
英偉達現在的對手可不只有博通,還有亞馬遜。
AWS雖然不單獨披露Trainium的收入,但亞馬遜CEO安迪·杰西(Andy Jassy)在今年4月的股東信里表示,包括Trainium、Graviton和Nitro在內,亞馬遜的自研芯片業務,年化收入已經突破200億美元。
關鍵后面他還補了一刀,說如果把這個芯片部門當成獨立公司,讓亞馬遜在2026年生產的所有芯片,按市場價賣給AWS和外部客戶,那么年收入大約是500億美元。
其實亞馬遜的Trainium芯片,正在成為亞馬遜第二大生意。
谷歌這邊,情況也是一樣的。
Anthropic在去年10月拿到了最多100萬顆谷歌TPU的使用權,超過1GW的算力容量在2026年上線。今年4月,Anthropic又跟谷歌和博通簽了新的協議,鎖定了約3.5GW的下一代TPU算力,2027年開始交付。
與此同時,谷歌云的單季收入在2026年第一季度首破200億美元,同比增長63%,谷歌還披露其AI Agent相關收入同比增長了800%。
OpenAI和Anthropic正在 脫離英偉達的管控
英偉達除了要面對四面八方圍過來的友商,還得去應付OpenAI和Anthropic這兩個小弟。
OpenAI現在把算力分成了兩條路線,一條還是英偉達,另一條線是Cerebras和博通。
Cerebras做的東西跟市面上所有AI芯片都不一樣,它用的是晶圓級芯片,一整片晶圓就是一個處理器,上面有幾十萬個計算核心。這種架構的核心優勢是數據移動極少,延遲極低。
對推理來說,延遲低意味著模型輸出更快。
今年1月,OpenAI跟Cerebras簽了一份價值超過200億美元的多年期協議,承諾部署750MW的Cerebras推理算力,交付時間橫跨到2028年。
基于這筆合同,Cerebras拿到了OpenAI給的10億美元運營資金貸款,隨后在5月完成了64億美元的IPO。
Cerebras的年收入指引還不到9億美元,但一份OpenAI的合同就給這家公司帶來了超過200億美元的收入。
甚至我可以斷言,Cerebras現在就是OpenAI的硬件部門。
博通跟Cerebras不同的地方在于,后者簽的訂單是算力合同。要在規定的時間內,給OpenAI提供一定規模的推理服務。
而前者的訂單內容,是OpenAI自己主導設計芯片。OpenAI最清楚自家模型推理時,算力、內存、KV Cache、網絡通信分別卡在哪里。
這就跟買車一樣,你只開公路,那就沒必要選配越野輪胎、四驅和底盤護板,這些配置只有越野的時候才有用,公路完全用不上。你就能把這錢省下來去升級別的地方。
這是OpenAI的第一顆自研推理芯片,從架構設計到流片只用了九個月。
博通說這是先進半導體歷史上最快的ASIC開發周期。Jalape?o從一張白紙開始,完全圍繞ChatGPT的推理進行設計。
GPT-5.3-Codex-Spark已經在實驗室里跑在Jalape?o工程樣片上,跑的是生產環境的目標頻率和功耗。OpenAI的說法是,每瓦性能“遠超當前最先進水平”。
Jalape?o的目標部署規模是10GW,相當于10座大型核電站。
雖然在訓練端,OpenAI仍然離不開英偉達GPU。因為前沿大模型訓練對算力密度和互聯帶寬的要求非常高,目前只有英偉達的GPU能夠滿足OpenAI的標準。
但推理不同。推理是穩定、海量、重復的工作負載。每天幾億人問ChatGPT同樣類型的問題,模型結構不變,計算模式高度可預測。
這種負載最適合被專用化,把通用GPU里那些用不上的電路全都砍掉,只保留大模型推理需要的部分,便宜而且高效。
Anthropic走的是另一條路。
它把推理和訓練一起押在了AWS Trainium上。Trainium是AWS自己的AI芯片,兼顧訓練和推理。
今年4月,亞馬遜又向Anthropic投了50億美元,累計投資達到130億美元,并保留了追加至多200億美元的權利。
禮尚往來,Anthropic承諾未來十年在AWS上花費超過1000億美元,鎖定5GW的Trainium算力,覆蓋Trainium2到Trainium4三代芯片、數千萬顆Graviton CPU。
圍繞這個超級大合同,亞馬遜在印第安納州建了兩個巨型數據中心園區,名為“Rainier項目”,規劃總容量約4.7GW。
我簡單算了算,如果OpenAI和Anthropic兩個大型園區全天運行,一年要消耗掉1288億度電,相當于15座大型核電站。
這個數字可能看著有點虛,我換成熱量你就能看懂了。14.7GW功率下,每秒消耗是147億焦耳(14.7 × 10? J),那么每天就是1.27 × 101?焦耳。相當于30.4萬噸TNT。
然而,就是這么大一筆訂單,卻全然和英偉達一毛錢關系都沒有。
博通突然上位
最后回過頭來看博通。
你有沒有想過這么一個問題,為什么OpenAI、Anthropic的“去英偉達”路線,最后都得經過博通?
就拿OpenAI來說,明明它可以仰仗微軟,畢竟OpenAI本來就有很大一部分算力是從微軟的Azure買來的。但現實就是,OpenAI正在遠離微軟。
這里面的核心邏輯是,OpenAI和Anthropic都想要芯片的“定義權”。
看似OpenAI跟博通開發Jalape?o芯片的整個過程中付出了很多,設計了整個芯片。可如果你了解芯片行業你就清楚,設計芯片其實是行業內最簡單的部分,難的是后面的工程化、量產和網絡系統。而這些部分,全都掌握在博通手里。
一顆AI芯片,真正跟模型推理直接相關的計算邏輯,可能只占整個芯片面積的一半不到。
剩下這些用來搬運數據、串行接口、主機通信的模塊,每一塊都極其復雜,從頭設計任何一塊都要幾十個工程師干大半年。
博通做了幾十年通信芯片,這些IP全是現成的。之所以Jalape?o九個月能從圖紙到流片,其實跟新聞稿中提到的OpenAI用AI設計芯片關系不大,真正靠的是博通豐富的基礎設施。
2023年AI剛火起來的時候,所有人的眼睛都盯著英偉達。GPU是稀缺品,H100一卡難求,英偉達的市值從幾千億一路沖到幾萬億。博通那陣子反而沒什么聲音。
隨著行業的發展,博通開始意識到,想自己造芯片的AI公司越來越多。不過大家都不想從頭開始研究芯片,又累又苦又費時間精力。
所以就催生出了一個新詞,叫做“芯片自主權外包”。
博通的位置剛好卡在這里,我能幫你設計,我幫你找代工廠,我幫你管供應鏈,我幫你做網絡。最后芯片是你的,你想怎么用怎么用,不用跟我分成。
博通賺的不是產品的錢,是服務的錢。這就導致博通的客戶越成功,博通的生意就越大。
而這件事,英偉達做不了。不是技術上做不了,是商業模式上做不了,因為英偉達賣的是成品,它只懂成品那套邏輯。
博通是把整套鏈路全都鋪滿了,你任何一個環節有需求,博通都能給你找到對應的價碼。
還有一層。英偉達的客戶之間是競爭關系。
它如果幫OpenAI設計芯片,Anthropic會怎么想?谷歌會怎么想?Meta會怎么想?
而且英偉達現在還需要面對一個問題:造芯片的錢,很大一部分根本不是它賺的。
一顆GPU,最貴的部分不是核心,是旁邊堆的那幾層HBM。HBM是一種堆疊式高帶寬內存,模型參數越大,需要的HBM越多。
全球能大規模量產HBM的,就那么幾家。比如三星和SK 海力士,這兩家幾乎平分了這個市場。
換句話說,英偉達賣一顆 GPU,里面相當一部分收入轉手就交給了韓國人。更何況HBM的產能本身就緊張,擴產周期極長。一座HBM工廠從規劃到量產要好幾年,比建GPU的先進封裝產線還慢。
所以這就是今天的黃仁勛,前有狼后有虎,手里牽著的兩個娃還不老實。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.