![]()
英偉達創始人兼CEO黃仁勛周五抵達首爾,釋放了關于AI基礎設施周期的明確信號:三星電子、SK海力士和美光科技均已通過認證,進入高帶寬內存4(HBM4)的量產階段,全力支援英偉達Vera Rubin AI服務器平臺。首批系統計劃于2026年第三季度正式出貨。
“所有三家供應商都已通過認證并投入生產。”黃仁勛在結束Computex 2026行程后對記者表示。這一表態終結了市場長達數月的猜測,也是黃仁勛首次公開確認這三家巨頭將在同一平臺上交付HBM4。
Vera Rubin全面投產,產能下半年顯著爬坡
繼6月1日黃仁勛在GTC宣布發貨計劃后,Vera Rubin已進入全面生產階段。黃仁勛指出,2026年下半年將是主要的產能爬坡期,產量將顯著高于上半年,并為明年更大的規模做準備。這需要DRAM和HBM供應鏈之間的高度協同。
HBM4架構突破:帶寬翻倍,延遲降低
HBM4并非簡單的速度升級,而是結構性突破。根據JEDEC標準,HBM4將內存接口寬度從HBM3E的1,024位翻倍至2,048位,獨立數據通道從16個增至32個。這使得每個內存堆棧在基準規范下至少提供2 TB/s帶寬。
三星量產的HBM4采用4納米邏輯介子和12層DRAM堆疊,每引腳速度達11.7 Gbps,總帶寬高達3.3 TB/s。該架構分離命令總線與數據總線,旨在降低大規模AI訓練和推理中的延遲。每個Vera Rubin NVL72機架配備20.7 TB HBM4內存,聚合帶寬達1.6 PB/s,較Grace Blackwell系統的8 TB/s提升超過2.7倍。
制造工藝是主要瓶頸。HBM4利用硅通孔(TSV)垂直堆疊DRAM,12層堆疊要求單層硅介子厚度減薄至約50微米。三星和SK海力士正競相開發用于2027年Vera Rubin Ultra平臺的16層堆疊技術,需將厚度進一步減至約30微米,同時保持封裝高度符合標準。
專為“代理型AI”打造,能效提升十倍
Vera Rubin并非Grace Blackwell的加速版,而是專為“代理型AI”(agentic AI)構建的新類別系統,旨在處理觸發數百甚至數千個自主推理步驟的復雜任務。
每個NVL72機架整合72個Rubin GPU和36個Vera CPU,采用液冷設計。單個Rubin GPU擁有3360億個晶體管,提供50 PFLOPS的NVFP4推理性能。通過NVLink 6互聯,全對全擴展帶寬達3.6 TB/s,是Blackwell中NVLink 5的兩倍以上。英偉達數據顯示,相比Grace Blackwell,Vera Rubin每瓦推理吞吐量提高10倍,每個推理令牌成本降低10倍,訓練大型混合專家模型所需GPU數量減少四分之三。對于年電費可能超200萬美元的超大規模數據中心而言,這一效率提升至關重要。
黃仁勛確認,隨著Vera Rubin產能提升,Grace Blackwell也在成功部署,兩代產品將在供應窗口上重疊,而非簡單替代。
三方角逐:SK海力士領跑,三星技術激進
行業分析師估計,在Vera Rubin的HBM4供應中,SK海力士占據60%至70%份額,三星約占25%至30%,美光供應剩余部分。SK海力士憑借在前幾代產品中的主導地位,截至2025年中已占據整體HBM市場約62%的份額。
三星率先實現HBM4大規模生產,并于2026年2月宣布商業出貨,其3.3 TB/s的規格為目前最快。三星還首家交付了目標帶寬3.6 TB/s的HBM4E樣品。然而,三星采用的混合鍵合技術雖能降低電阻、提高信號密度,但早期面臨良率挑戰。相比之下,SK海力士采用的大規模回流模制底部填充(Mass Reflow Molded Underfill)工藝更易于規模化,這解釋了為何三星的技術優勢未完全轉化為市場份額。
美光作為關鍵的第三方供應商,承諾售盡其2026年的HBM生產能力,預計HBM年化收入運行率接近80億美元。
布局韓國:研發中心與RTX Spark亮相
黃仁勛此行還宣布啟動首爾研發中心的招聘,未來將建設實體站點,專注于物理AI和機器人研究。韓國先進的制造能力與AI結合,被視為物理AI時代的關鍵基石。英偉達的Jetson Thor機器人處理器已在現代汽車集團和LG得到應用。
在首爾期間,黃仁勛與SK集團、LG集團和Naver的高層共進晚餐,并探訪電競咖啡館T1 Base Camp,會見《英雄聯盟》傳奇選手Faker,贈送簽名的GeForce RTX 5090顯卡。此舉旨在推廣RTX Spark——英偉達新一代AI筆記本超級芯片。
RTX Spark基于臺積電3納米工藝,集成20核Grace Arm CPU和Blackwell GPU,擁有700億晶體管,提供1 PFLOPS的FP4 AI性能。通過NVLink-C2C以600 GB/s速度連接CPU和GPU,并配備128 GB統一LPDDR5X內存,消除了數據傳輸瓶頸,使筆記本能在本地運行大型AI代理。RTX Spark筆記本電腦預計將于2026年秋季上市。
【星途科訊 圖文丨鐘離尋】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.