无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<sup id="l2vqc"><delect id="l2vqc"></delect></sup>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

這么大，那么猛，超節點到底中用不中用？

2025-12-24 15:13:43　來源: AI全球總部

北京舉報

0

分享至

在「賣盒子」領域，今年火了兩樣產品。

上半年火的是大模型一體機，下半年火的是“又大又猛”的超節點。

一眾大廠紛紛推出自家的超節點，但是，隨著超節點的發布和落地，爭議也越來越多（以下按發布順序簡列）。

今天我們就系統地講講，超節點到底中用不中用？

什么是超節點？

首先，我們要明確一點，一臺標準服務器是插不了太多GPU卡的，16卡是極限。

這主要受限于CPU的PCIe通道數以及工程因素（比如機箱空間、散熱、供電）。

所以，這類傳統服務器，以前叫GPU Server、AI服務器，現在又預裝大模型，被稱作AI一體機、大模型一體機。

今年上半年涌現的各種一體機，基本都是這種情況。

如果想要突破上面那種限制，插更多卡怎么辦呢？

就必須要在卡間互聯方面整點黑科技↓

用專門的Scale-Up網絡(高帶寬、低時延、強一致、內存語義、對等直出互聯，RoCE、IB都不行)，把更多的卡連在一起，定制成一臺更大的“機器”。

一般來說，16卡以上，基于Scale-Up網絡實現GPU-GPU互聯的系統，我們就可以稱之為超節點了。

為什么需要超節點？

先講一個事實：

目前大模型的場景，沒有什么8卡機干不了的。如果一臺不夠，那就多臺組團（Scale-Out）干。

比如，即便是遇到當下參數超大的模型，基于MoE架構，需要張量并行、專家并行……，單臺8卡/16卡機遭遇顯存墻扛不動。

但仍然可以采用組團的方式，多臺機器基于IB或者RoCE網絡形成Scale-Out集群，把切割后的模型（張量并行、專家并行）分擔扛起來。

但是，這種組團是有代價的，機器間的網絡互聯帶寬和延遲都無法與一臺機內部的連接相比。

內循環和外循環的效率差距很大。

這種帶寬和延遲的巨大差距，讓每個8卡機上的顯存、內存只能獨立作戰，無法形成跨節點、統一的顯存池、內存池。

此時，遇到張量并行、專家并行這種跨卡通信開銷很大的場景，訓推效率就會打折扣。

超節點就不一樣了，由于采用了專用的Scale-Up互聯標準（NVLink或其他開放標準比如UALink），天塹變通途了。

超節點內所有的卡之間可以直接進行讀/寫/原子操作，從而形成更大的單體內存/顯存域，就好比組成了一個巨型顯卡，核心超多、顯存容量超大。

這樣，超節點各GPU之間就可以進行高頻數據交換和控制命令交互，絲滑地像一張卡。

面對超大參數的模型、復雜的張量并行或者專家并行策略，夸張的all-to-all、all-reduce通信開銷，更大的KV Cache壓力，超節點都可以輕松駕馭。

超節點越大越好嗎？

既然超節點這么牛掰，那就盡量往大里整唄？是不是單個節點越大越好呢？

先說結論，單個超節點的規模并非越大越好，千萬不能這么整。

小有小的缺點，大有大的劣勢，超節點太大，會帶來的以下弊端：

①成本：

Scale-Up的網絡成本（比如NVSwitch或者其他新生代互聯技術），本身就高于Scale-Out的網絡成本（RoCE或者IB交換機）。

而節點越大，卡間全互聯的線纜就越復雜，距離也會更大，線纜密度和距離會進一步增加成本，這種成本的增加不是線性的。

②故障率與爆炸半徑：

單個節點規模越大，內部關鍵器件和連接就越多，潛在的故障點也會隨之增多，比如大規模的光互聯。

故障風險也會隨之增大，而且為提高容錯性付出的成本也會更高。

同時，單個節點的故障域也會變大，一旦發生故障，會波及更大范圍。

③可維護性與可交付性

太大的超節點，高規格的定制機箱、散熱、供電、冗余設置，往往需要特殊的定制化，不僅增加了Capex成本，也大大增加了交付和運維的成本。

甚至，傳統機房的空間、承重、制冷和供電，要經過一番傷筋動骨的改造，才能Hold得住大尺碼超節點。

所以，超節點雖好，可不要貪大哦。

如何尋求最佳平衡點

超節點很好，但太大的超節點又有一堆麻煩事，到底多大合適呢？

有一條鐵律↓

超節點產品商業化落地的唯一考量，是每Token成本。

提升算力利用率是建設AI Infra的關鍵，而不是盲目買個大家伙擺在家里鎮場子。

前面我們說過，目前沒有什么場景是8卡機用Scale-Out方案搞不定的。

但搞得定≠搞得好，因為我們需要用每Token成本來評估好壞。

那些對節點間通信延遲敏感的場景，比如以DeepSeek為代表的大尺寸MoE模型，通信量大、時延要求苛刻。

用超節點來跑，才有機會獲得最大化收益（每Token成本更低）。

至于單個超節點多少卡合適？其實取決于主流模型的特點。

在當下國內企業級本地部署場景，DeepSeek推理仍然是應用最廣泛的，MoE架構專家并行、P/D分離部署。

需要綜合考慮互聯成本、通信開銷、互聯可靠性，再結合國產卡的性能最終得到一個甜點區。

根據目前的工程經驗，在這類場景實際落地中，單節點32卡-64卡是一個相對不錯的選擇。

比如，以典型的32卡超節點為例，32路專家并行，把大規模跨卡通信都壓縮在一個機框內。

針對這樣的Case，新華三用自家超節點UniPod S80000，給出了實際實際落地參考，實戰效果相當不錯。

確定了最佳的Scale-Up域，接下來，我們可以再根據實際需求，把多臺超節點，用RoCE網絡組成Scale-Out集群，滿足更大的并發和彈性需求。

這種架構不僅能獲得最優的每Token成本，而且運維、部署簡單，具備極佳的可擴展性和準線性性能增長。

當然，我們也應該看到，當前的大模型產品和技術正在以月甚至以周為單位高速迭代，今天的最優架構可能明天就落伍了。

未來的主流模型是否還是Transformer架構，MoE會不會永遠適用，Scaling Law還能持續多久，一切都尚無定論。

所以，8卡機與超節點之爭、小節點與大節點之戰，會長期存在，讓我們與時俱進、且戰且看吧。

簡單給本文做個總結

①、超節點能干的大模型業務，普通8卡機（Scale-Out方案）都能干；

②、只有跨卡通信開銷大的場景，超節點跑起來才有優勢；

③、超節點落地的唯一標準是算力利用率和每Token成本，不要被情緒價值（高端、大氣、上檔次）左右了你的選擇。

④、超節點的Scale-UP域并非越大越好，“大”意味著更高的額外成本、更大的爆炸半徑、更復雜的運維和部署，以及產品鎖定風險。

⑤、基于目前國內企業級場景和模型生態，32-72卡超節點是相對最優落地選擇，更高算力利用率，并綜合考慮擴展性、可維護性、故障域、國產化因素。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

媒體：中國"兩箭齊發"反制美國不賣了也不買了

現代快報 2026-06-22 22:18:09
4854 跟貼 4854
男子16萬余元購入路虎攬勝極光L，指導價近43萬元，因成交價過低，原本1萬多元購置稅可能要翻倍；4S店：等待溝通結果

封面新聞 2026-06-23 10:34:27
16129 跟貼 16129

38℃，江蘇天氣即將反轉

微泰州 2026-06-23 19:46:41
134 跟貼 134

哈蘭德再度梅開二度，挪威3比2塞內加爾

澎湃新聞 2026-06-23 10:00:27
2561 跟貼 2561
6歲男孩被流浪狗撲倒，哥哥從二樓一躍而下護住弟弟

北青網-北京青年報 2026-06-23 20:10:24
33 跟貼 33

連扳兩球！阿爾及利亞2-1逆轉約旦

澎湃新聞 2026-06-23 13:02:28
1873 跟貼 1873

上海市2026年普通高校招生本科各批次錄取控制分數線確定

央視新聞客戶端 2026-06-23 17:47:22
1719 跟貼 1719
商家：今年吃楊梅的都賺到了！福建“泡藥楊梅”事件后，一箱浙江楊梅從138元跌到110元

第一財經資訊 2026-06-23 16:47:29
829 跟貼 829

波士頓大學回復鐘美美：歡迎加入BU大家庭，此前鐘美美發文被波士頓大學錄取

大象新聞 2026-06-23 13:02:38
754 跟貼 754
遼寧艦完成迄今時間最長遠海訓練有四大看點

澎湃新聞 2026-06-23 07:12:29
397 跟貼 397
中簽率不足0.15%！華潤新能源新股網上搖號中簽結果出爐

南方都市報 2026-06-23 20:58:11
25 跟貼 25
“壓力又給到C羅了”！葡萄牙賽前海報C羅缺席，主帥回應C羅是否首發

大象新聞 2026-06-23 21:29:02
81 跟貼 81
網友吐槽“被WPS背刺了”，公司回應

南方都市報 2026-06-23 20:17:09
589 跟貼 589
施一公又回河南了，還帶了一個老鄉

大象新聞 2026-06-23 09:45:08
81 跟貼 81
楊瀚森回歸首秀表現一般，中國男籃險勝荷蘭隊

北青網-北京青年報 2026-06-23 22:23:08
23 跟貼 23
屋頂光伏度苦夏

界面新聞 2026-06-23 15:46:15
35 跟貼 35
工人日報：游客帶20寸登機箱被告知超標，廉航“行李刺客”引質疑

澎湃新聞 2026-06-23 07:34:39
191 跟貼 191
小鵬副總裁深夜怒懟：“強制激光雷達”是徹頭徹尾的假新聞；為什么每次都因為激光雷達吵起來？

極目新聞 2026-06-23 15:42:43
190 跟貼 190
微信迎來史上最大更新

浙江之聲 2026-06-23 16:11:13
130 跟貼 130
流浪貓“模仿”人類端正坐姿，乖乖守餐桌旁等食物，攤主投喂1月

星視頻 2026-06-23 12:55:49
444 跟貼 444
95后新人海底撈包場辦婚禮，42桌宴席請305人僅花兩萬四

瀟湘晨報 2026-06-23 12:57:29
90 跟貼 90
俄白呼吁共同銘記歷史捍衛真相

新華社 2026-06-23 12:30:03
97 跟貼 97
中國海軍83艦編隊抵達俄羅斯進行友好訪問

新華社 2026-06-23 10:47:04
50 跟貼 50
端午假期第二天北京市屬公園迎客超38萬人次

北青網-北京青年報 2026-06-20 14:47:09
132 跟貼 132
高速上兩人騎摩托邊打手勢邊狂奔，目擊者稱“時速超過120”，7分鐘甩開汽車消失，多方回應：疑似闖卡上站，車速快難查

臺州交通廣播 2026-06-24 02:59:35
0 跟貼 0
721分（滿分800分），“山西挖眼案”受害男孩成為全國同專業第一名的雙學位大學生

極目新聞 2026-06-23 21:32:14
0 跟貼 0
今天澎湃新聞突然劍指賈淺淺，我必須來真誠道歉一下

人格志 2026-06-24 02:55:18
0 跟貼 0

這輛日本SUV在悄悄改寫“長期主義”的規則

這輛日本SUV在悄悄改寫“長期主義”的規則

像素與芯片

2026-06-21 00:31:35

楊振寧去世5個月后，49歲翁帆現狀：剪了頭發染了色，仍獨居國內

楊振寧去世5個月后，49歲翁帆現狀：剪了頭發染了色，仍獨居國內

照見古今

2026-03-26 19:06:28

50歲大爺娶40歲單親媽媽，洞房夜大媽愣了：這老爺子不簡單

50歲大爺娶40歲單親媽媽，洞房夜大媽愣了：這老爺子不簡單

千秋文化

2026-06-22 19:45:14

相比于固執的雷軍，幫閑的劉震云更讓人失望

相比于固執的雷軍，幫閑的劉震云更讓人失望

此地無言

2026-06-23 06:01:53

當年買了泰坦尼克號票的8位頂級富豪，為何開船前，卻都沒上船？

當年買了泰坦尼克號票的8位頂級富豪，為何開船前，卻都沒上船？

云霄紀史觀

2026-06-21 23:44:07

魯尼自曝執教最大遺憾：不會再回教練席了

魯尼自曝執教最大遺憾：不會再回教練席了

慢享生活集

2026-06-23 01:01:43

蔣雯麗攜91歲母親與25歲兒子三代同框逛街，溫馨畫面溢出屏幕

蔣雯麗攜91歲母親與25歲兒子三代同框逛街，溫馨畫面溢出屏幕

話娛論影

2026-06-23 09:49:33

女副處只有性別是真的

曉記

2026-06-22 11:00:31

盲目追求最寬信道？你的Wi-Fi可能越調越慢

盲目追求最寬信道？你的Wi-Fi可能越調越慢

碳基打工人

2026-06-23 01:26:42

C羅梅開二度終開胡，葡萄牙5：0大勝烏茲別克斯坦

C羅梅開二度終開胡，葡萄牙5：0大勝烏茲別克斯坦

本澤體育

2026-06-24 03:00:27

票房從57.75億跌到6.2億，這一張主旋律招牌，被陳凱歌搞砸了

票房從57.75億跌到6.2億，這一張主旋律招牌，被陳凱歌搞砸了

探長讀財

2026-06-23 23:01:51

僅陪妻子伏明霞回一次娘家！梁錦松不是瞧不上娘家，實在另有原因

僅陪妻子伏明霞回一次娘家！梁錦松不是瞧不上娘家，實在另有原因

人生錄

2026-06-21 16:56:49

兒子給哈佛捐20多億，母親給麻省捐11億，家族在中國年收租百億？

兒子給哈佛捐20多億，母親給麻省捐11億，家族在中國年收租百億？

離離言幾許

2026-06-21 22:51:14

整天開會有啥必要啊？

北京老付

2026-01-20 10:59:33

剛剛，186萬個號碼中簽！深交所史上最大IPO，你中了嗎？

剛剛，186萬個號碼中簽！深交所史上最大IPO，你中了嗎？

新浪財經

2026-06-23 20:48:33

楊瀚森回歸首秀表現一般，中國男籃險勝荷蘭隊

楊瀚森回歸首秀表現一般，中國男籃險勝荷蘭隊

北青網-北京青年報

2026-06-23 22:23:08

TVB一線花旦新發型妝容嚴重翻車！面部浮腫鼻影夸張死板！惹負評后官網緊急刪除

TVB一線花旦新發型妝容嚴重翻車！面部浮腫鼻影夸張死板！惹負評后官網緊急刪除

我愛追港劇

2026-06-24 02:36:43

永遠不可能被抹殺的歷史：四野部隊里的那三萬日籍士兵

永遠不可能被抹殺的歷史：四野部隊里的那三萬日籍士兵

深度報

2026-01-21 21:25:16

四川兒媳吐槽：婆婆與公公，每晚鴛鴦浴，自己很尷尬，只得搬離！

四川兒媳吐槽：婆婆與公公，每晚鴛鴦浴，自己很尷尬，只得搬離！

川渝視覺

2026-05-20 12:50:15

世體：尤文有意皇馬5將，或助皇馬清洗

世體：尤文有意皇馬5將，或助皇馬清洗

懂球帝

2026-06-23 19:14:23

全球最新、最酷AI解決方案

1197文章數 715關注度

往期回顧全部

科技要聞

48名中國開發者聯名舉報蘋果

頭條要聞

"紙尿褲風波"第一爆料人：如果我錯了坐牢都接受

頭條要聞

"紙尿褲風波"第一爆料人：如果我錯了坐牢都接受

體育要聞

揚尼斯去了邁阿密：凱爾特人怎么辦？

娛樂要聞

內娛95后頂流格局發生潛移默化的變化

財經要聞

AI“算力稀缺”信仰開始動搖？

汽車要聞

施鵬澤：為什么奧迪E7X強調座艙氣味安全?

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

藝術

時尚

家居

本地

教育要聞

2026四川高考成績25日18：30公布！附查詢入口→

藝術要聞

高約400米！深圳灣金融中心大廈，沖出正負零

被40萬人追更的火焰魔術師，重塑古老燈工玻璃

家居要聞

綠意盎然自然之境

空間微調移形換境
自由流光回溯生活真意
雅奢之序五層別墅

本地新聞

吃一次廣東龍舟飯，才懂什么是豪華盛宴

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<ins id="afcoy"><cite id="afcoy"><tr id="afcoy"></tr></cite></ins>