老黃又來炸場了!就在剛剛,CES2026上,英偉達直接掏出了下一代 AI 計算平臺:Rubin。
老黃這次一口氣發布了六款核心芯片,涵蓋了GPU、CPU、DPU、NVL交換機、智能網卡、RoCE交換機,簡直是AI鏟子全家桶,主打一個我全要。
![]()
[英偉達Rubin六件套]
金鏟子六件套
1. 領軍大將:Rubin GPU
首先出場的是Rubin GPU,采用了臺積電3nm工藝,晶體管數量達到了驚人的3360 億個。
其AI推理性能是Blackwell的5倍,訓練性能也提升了3.5倍。
更夸張的是顯存,終于配上了HBM4,容量為288GB,帶寬高達22 TB/s,簡直吊炸天,就問你眼饞不眼饞。
![]()
[Robin GPU核心規格]
2、狗頭軍師:Vera CPU
接下來是Rubin的搭檔:Vera CPU。(老黃連湯也不想留給老蘇和老陳)
Olympus 核心:擁有 88個自定義高性能核心,支持176線程。
性能翻倍:數據處理和壓縮能力是前代Grace CPU的兩倍。
靈活內存:放棄了固定的焊接內存,改用模塊化的SOCAMM 顯存,帶寬翻倍達到 1.2TB/s。
![]()
[Vera CPU 架構圖]
3、高速動脈:NVlink 6交換機
為了讓這些干將組團打怪,英偉達推出了NVLink 6 交換機。
雙向帶寬翻倍干到了3.6TB/s,散熱壓力不小,這個芯片必須要上液冷。
![]()
[NVL 6 Switch芯片]
4、搬磚小卒:ConnectX-9網卡
ConnectX-9網卡提供1.6Tb/s的超高網絡帶寬,采用200G PAM4 SerDes技術。
一塊破網卡晶體管數量已經達到了230億,太頂了。
![]()
[ConnectX-9 超級網卡芯片]
5、后勤伙夫:BlueField-4 DPU
有腦子(CPU)有腿(網卡)的跨界小伙,融合了Grace CPU和ConnectX-9網卡。
DPU是這些年的新概念(雖然還是比較雞肋),其核心價值,是幫助主CPU減負,把加密、虛擬交換、流量治理、觀測與安全這些雜事都包辦了。
![]()
[BlueField-4 DPU 架構]
6、配套車夫:Spectrum-6交換機
最后是負責整體組網的Spectrum-6交換機,102.4T。
終于支持CPO技術了,雖遲但到。
![]()
[采用CPO技術的Spectrum-6 交換芯片]
![]()
![]()
[對應的液冷交換機SN6800系列]
系統級超級大鏟子
1、超級戰車:Vera Rubin NVL72
集成了72個GPU和36個Vera CPU的系統怪獸。
這回,英偉達重新設計了機架,采用全免線纜模塊化托盤,使單機架組裝時間從 Blackwell時代的100分鐘大幅縮短至6分鐘。
感覺性能上,N家已經懶得吹了。
![]()
[最新一代超節點]
![]()
![]()
[NVL72的算力模塊和連接模塊]
![]()
[NVL72是如何連接的]
2、算力鐵浮屠:DGX SuperPOD
真正意義上的超超節點,一坨能打一大坨。
由8個NVL72機架組成,總計包含576個Robin GPU,提供驚人的28.8 EFLOPS推理性能。
其實N家只把576叫做超節點,NVL72只是個”機架“。
![]()
[DGX SuperPod集群]
3. 神秘彈夾:KV緩存系統
除了硬件堆料,英偉達還發布了一個名為推理上下文內存存儲平臺的黑科技。
它就像是AI的長期記憶插件,專門存儲推理過程中的上下文數據。
以前數據太多存不下只能重算,現在存在這個專用節點里隨取隨用,推理性能和能效直接翻5倍。
對超長上下文、多智能體多步驟推理場景來講,這種高速持久KV很有用。
![]()
[上下文存儲平臺]
接下來的問題是:餅什么時候上桌
別急,好東西都要等。
其實N家已經比上一次畫餅提前了很多,今年下半年就能交付量產硬件。
屆時,AWS、Google Cloud、Azure 等云巨頭都會第一時間上線基于 Rubin 的服務。
留給友商的時間不多了。
![]()
參考文獻:
https://developer.nvidia.com/blog/inside-the-nvidia-rubin-platform-six-new-chips-one-ai-supercomputer/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.