无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

這么大,那么猛,超節點到底中用不中用?

0
分享至

在「賣盒子」領域,今年火了兩樣產品。

上半年火的是大模型一體機,下半年火的是“又大又猛”的超節點。



一眾大廠紛紛推出自家的超節點,但是,隨著超節點的發布和落地,爭議也越來越多(以下按發布順序簡列)。



今天我們就系統地講講,超節點到底中用不中用?

什么是超節點?

首先,我們要明確一點,一臺標準服務器是插不了太多GPU卡的,16卡是極限。

這主要受限于CPU的PCIe通道數以及工程因素(比如機箱空間、散熱、供電)。



所以,這類傳統服務器,以前叫GPU Server、AI服務器,現在又預裝大模型,被稱作AI一體機、大模型一體機。

今年上半年涌現的各種一體機,基本都是這種情況。



如果想要突破上面那種限制,插更多卡怎么辦呢?

就必須要在卡間互聯方面整點黑科技↓

用專門的Scale-Up網絡(高帶寬、低時延、強一致、內存語義、對等直出互聯,RoCE、IB都不行),把更多的卡連在一起,定制成一臺更大的“機器”。



一般來說,16卡以上,基于Scale-Up網絡實現GPU-GPU互聯的系統,我們就可以稱之為超節點了。



為什么需要超節點?

先講一個事實:

目前大模型的場景,沒有什么8卡機干不了的。如果一臺不夠,那就多臺組團(Scale-Out)干。

比如,即便是遇到當下參數超大的模型,基于MoE架構,需要張量并行、專家并行……,單臺8卡/16卡機遭遇顯存墻扛不動。



但仍然可以采用組團的方式,多臺機器基于IB或者RoCE網絡形成Scale-Out集群,把切割后的模型(張量并行、專家并行)分擔扛起來。



但是,這種組團是有代價的,機器間的網絡互聯帶寬和延遲都無法與一臺機內部的連接相比。

內循環和外循環的效率差距很大。



這種帶寬和延遲的巨大差距,讓每個8卡機上的顯存、內存只能獨立作戰,無法形成跨節點、統一的顯存池、內存池。

此時,遇到張量并行、專家并行這種跨卡通信開銷很大的場景,訓推效率就會打折扣。



超節點就不一樣了,由于采用了專用的Scale-Up互聯標準(NVLink或其他開放標準比如UALink),天塹變通途了。

超節點內所有的卡之間可以直接進行讀/寫/原子操作,從而形成更大的單體內存/顯存域,就好比組成了一個巨型顯卡,核心超多、顯存容量超大。



這樣,超節點各GPU之間就可以進行高頻數據交換和控制命令交互,絲滑地像一張卡。

面對超大參數的模型、復雜的張量并行或者專家并行策略,夸張的all-to-all、all-reduce通信開銷,更大的KV Cache壓力,超節點都可以輕松駕馭。



超節點越大越好嗎?

既然超節點這么牛掰,那就盡量往大里整唄?是不是單個節點越大越好呢?

先說結論,單個超節點的規模并非越大越好,千萬不能這么整。





小有小的缺點,大有大的劣勢,超節點太大,會帶來的以下弊端:

①成本:

Scale-Up的網絡成本(比如NVSwitch或者其他新生代互聯技術),本身就高于Scale-Out的網絡成本(RoCE或者IB交換機)。

而節點越大,卡間全互聯的線纜就越復雜,距離也會更大,線纜密度和距離會進一步增加成本,這種成本的增加不是線性的。



②故障率與爆炸半徑:

單個節點規模越大,內部關鍵器件和連接就越多,潛在的故障點也會隨之增多,比如大規模的光互聯。

故障風險也會隨之增大,而且為提高容錯性付出的成本也會更高。



同時,單個節點的故障域也會變大,一旦發生故障,會波及更大范圍。





③可維護性與可交付性

太大的超節點,高規格的定制機箱、散熱、供電、冗余設置,往往需要特殊的定制化,不僅增加了Capex成本,也大大增加了交付和運維的成本。

甚至,傳統機房的空間、承重、制冷和供電,要經過一番傷筋動骨的改造,才能Hold得住大尺碼超節點。



所以,超節點雖好,可不要貪大哦。

如何尋求最佳平衡點

超節點很好,但太大的超節點又有一堆麻煩事,到底多大合適呢?

有一條鐵律↓

超節點產品商業化落地的唯一考量,是每Token成本。

提升算力利用率是建設AI Infra的關鍵,而不是盲目買個大家伙擺在家里鎮場子。



前面我們說過,目前沒有什么場景是8卡機用Scale-Out方案搞不定的。

但搞得定≠搞得好,因為我們需要用每Token成本來評估好壞。



那些對節點間通信延遲敏感的場景,比如以DeepSeek為代表的大尺寸MoE模型,通信量大、時延要求苛刻。

用超節點來跑,才有機會獲得最大化收益(每Token成本更低)。



至于單個超節點多少卡合適?其實取決于主流模型的特點。

在當下國內企業級本地部署場景,DeepSeek推理仍然是應用最廣泛的,MoE架構專家并行、P/D分離部署。

需要綜合考慮互聯成本、通信開銷、互聯可靠性,再結合國產卡的性能最終得到一個甜點區。



根據目前的工程經驗,在這類場景實際落地中,單節點32卡-64卡是一個相對不錯的選擇。

比如,以典型的32卡超節點為例,32路專家并行,把大規模跨卡通信都壓縮在一個機框內。



針對這樣的Case,新華三用自家超節點UniPod S80000,給出了實際實際落地參考,實戰效果相當不錯。



確定了最佳的Scale-Up域,接下來,我們可以再根據實際需求,把多臺超節點,用RoCE網絡組成Scale-Out集群,滿足更大的并發和彈性需求。

這種架構不僅能獲得最優的每Token成本,而且運維、部署簡單,具備極佳的可擴展性和準線性性能增長。



當然,我們也應該看到,當前的大模型產品和技術正在以月甚至以周為單位高速迭代,今天的最優架構可能明天就落伍了。

未來的主流模型是否還是Transformer架構,MoE會不會永遠適用,Scaling Law還能持續多久,一切都尚無定論。

所以,8卡機與超節點之爭、小節點與大節點之戰,會長期存在,讓我們與時俱進、且戰且看吧。

簡單給本文做個總結

①、超節點能干的大模型業務,普通8卡機(Scale-Out方案)都能干;

②、只有跨卡通信開銷大的場景,超節點跑起來才有優勢;

③、超節點落地的唯一標準是算力利用率和每Token成本,不要被情緒價值(高端、大氣、上檔次)左右了你的選擇。

④、超節點的Scale-UP域并非越大越好,“大”意味著更高的額外成本、更大的爆炸半徑、更復雜的運維和部署,以及產品鎖定風險。

⑤、基于目前國內企業級場景和模型生態,32-72卡超節點是相對最優落地選擇,更高算力利用率,并綜合考慮擴展性、可維護性、故障域、國產化因素。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
這輛日本SUV在悄悄改寫“長期主義”的規則

這輛日本SUV在悄悄改寫“長期主義”的規則

像素與芯片
2026-06-21 00:31:35
楊振寧去世5個月后,49歲翁帆現狀:剪了頭發染了色,仍獨居國內

楊振寧去世5個月后,49歲翁帆現狀:剪了頭發染了色,仍獨居國內

照見古今
2026-03-26 19:06:28
50歲大爺娶40歲單親媽媽,洞房夜大媽愣了:這老爺子不簡單

50歲大爺娶40歲單親媽媽,洞房夜大媽愣了:這老爺子不簡單

千秋文化
2026-06-22 19:45:14
相比于固執的雷軍,幫閑的劉震云更讓人失望

相比于固執的雷軍,幫閑的劉震云更讓人失望

此地無言
2026-06-23 06:01:53
當年買了泰坦尼克號票的8位頂級富豪,為何開船前,卻都沒上船?

當年買了泰坦尼克號票的8位頂級富豪,為何開船前,卻都沒上船?

云霄紀史觀
2026-06-21 23:44:07
魯尼自曝執教最大遺憾:不會再回教練席了

魯尼自曝執教最大遺憾:不會再回教練席了

慢享生活集
2026-06-23 01:01:43
蔣雯麗攜91歲母親與25歲兒子三代同框逛街,溫馨畫面溢出屏幕

蔣雯麗攜91歲母親與25歲兒子三代同框逛街,溫馨畫面溢出屏幕

話娛論影
2026-06-23 09:49:33
女副處只有性別是真的

女副處只有性別是真的

曉記
2026-06-22 11:00:31
盲目追求最寬信道?你的Wi-Fi可能越調越慢

盲目追求最寬信道?你的Wi-Fi可能越調越慢

碳基打工人
2026-06-23 01:26:42
C羅梅開二度終開胡,葡萄牙5:0大勝烏茲別克斯坦

C羅梅開二度終開胡,葡萄牙5:0大勝烏茲別克斯坦

本澤體育
2026-06-24 03:00:27
票房從57.75億跌到6.2億,這一張主旋律招牌,被陳凱歌搞砸了

票房從57.75億跌到6.2億,這一張主旋律招牌,被陳凱歌搞砸了

探長讀財
2026-06-23 23:01:51
僅陪妻子伏明霞回一次娘家!梁錦松不是瞧不上娘家,實在另有原因

僅陪妻子伏明霞回一次娘家!梁錦松不是瞧不上娘家,實在另有原因

人生錄
2026-06-21 16:56:49
兒子給哈佛捐20多億,母親給麻省捐11億,家族在中國年收租百億?

兒子給哈佛捐20多億,母親給麻省捐11億,家族在中國年收租百億?

離離言幾許
2026-06-21 22:51:14
整天開會有啥必要啊?

整天開會有啥必要啊?

北京老付
2026-01-20 10:59:33
剛剛,186萬個號碼中簽!深交所史上最大IPO,你中了嗎?

剛剛,186萬個號碼中簽!深交所史上最大IPO,你中了嗎?

新浪財經
2026-06-23 20:48:33
楊瀚森回歸首秀表現一般,中國男籃險勝荷蘭隊

楊瀚森回歸首秀表現一般,中國男籃險勝荷蘭隊

北青網-北京青年報
2026-06-23 22:23:08
TVB一線花旦新發型妝容嚴重翻車!面部浮腫鼻影夸張死板!惹負評后官網緊急刪除

TVB一線花旦新發型妝容嚴重翻車!面部浮腫鼻影夸張死板!惹負評后官網緊急刪除

我愛追港劇
2026-06-24 02:36:43
永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

深度報
2026-01-21 21:25:16
四川兒媳吐槽:婆婆與公公,每晚鴛鴦浴,自己很尷尬,只得搬離!

四川兒媳吐槽:婆婆與公公,每晚鴛鴦浴,自己很尷尬,只得搬離!

川渝視覺
2026-05-20 12:50:15
世體:尤文有意皇馬5將,或助皇馬清洗

世體:尤文有意皇馬5將,或助皇馬清洗

懂球帝
2026-06-23 19:14:23
2026-06-24 03:12:49
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1197文章數 715關注度
往期回顧 全部

科技要聞

48名中國開發者聯名舉報蘋果

頭條要聞

"紙尿褲風波"第一爆料人:如果我錯了 坐牢都接受

頭條要聞

"紙尿褲風波"第一爆料人:如果我錯了 坐牢都接受

體育要聞

揚尼斯去了邁阿密:凱爾特人怎么辦?

娛樂要聞

內娛95后頂流格局發生潛移默化的變化

財經要聞

AI“算力稀缺”信仰開始動搖?

汽車要聞

施鵬澤:為什么奧迪E7X強調座艙氣味安全?

態度原創

教育
藝術
時尚
家居
本地

教育要聞

2026四川高考成績25日18:30公布!附查詢入口→

藝術要聞

高約400米!深圳灣金融中心大廈,沖出正負零

被40萬人追更的火焰魔術師,重塑古老燈工玻璃

家居要聞

綠意盎然 自然之境

本地新聞

吃一次廣東龍舟飯,才懂什么是豪華盛宴

無障礙瀏覽 進入關懷版