國產算力正從"能用"邁向"好用",超節點技術成為彌合差距的關鍵支點。
華爾街見聞提及,4月24日,DeepSeek V4預覽版發布,公司披露受限于高端算力供給,V4 Pro版本服務吞吐十分有限,預計下半年隨華為昇騰950超節點批量上市后,Pro版本價格將大幅下調。
高盛研報指出,這一表態具有雙重意涵:一是DeepSeek的成本競爭力將進一步強化;二是在芯片管制持續收緊的背景下,中國頂尖AI模型向國產算力遷移的趨勢得到頭部玩家的背書。
此前,國家發改委亦于2025年底的新聞發布會上罕見正面回應,稱"超節點等集群互聯技術發展,為國產算力趕上國際領先水平提供了良好機遇"。
在此背景下,東方證券發布電子行業深度報告,以"超節點:國產算力進攻的'矛'"為題,系統梳理超節點的技術邏輯、產業格局與投資機會,認為2026年將是國產超節點規模放量元年,交換芯片、服務器ODM、液冷、供電等全鏈條有望深度受益。
AI算力需求躍升,超節點成必然選擇
大模型參數規模的持續膨脹,正將算力基礎設施推入超節點時代。
東方證券報告指出,隨著MoE(混合專家)架構成為新趨勢,模型參數以每年約10倍的速度增長,已邁入十萬億級階段——Qwen3-Max模型總參數超過1T,文心5.0參數量達2.4T。
與此對應,算力集群規模不斷提升,萬卡集群已成訓練大模型的最低標配,十萬卡級集群成為主流趨勢。
![]()
Scaling Law的適用范圍亦從預訓練擴展至后訓練和推理全流程。
據OpenAI介紹,在開發o3時訓練計算和推理時間均增加了一個數量級,驗證了模型性能會隨思考次數持續提升。
DeepSeek則表示,對模型后訓練強化學習持續投入算力,V3.2在后訓練投入超過預訓練成本的10%,推理性能已與GPT-5-high相似。
在分布式訓練架構中,張量并行(TP)和混合專家并行(EP)對帶寬需求最為突出。
![]()
隨著MoE模型中跨服務器的All-to-All通信量急劇增長,傳統以太網已難以承受千億級模型單次梯度同步產生的TB級數據量。
超節點通過內部高速總線互連,有效打破"通信墻"與"內存墻"瓶頸,成為大規模訓練與推理的最優解。
![]()
在推理側,AI Agent的興起亦大幅拉升詞元Token消耗。據國家數據局數據,2026年3月中國日均AI Token使用量已突破140萬億,為2025年底的近四倍。
報告援引數據指出,超節點Blackwell NVL72相比H200 8卡服務器,單瓦每秒生成Token數量更高,推理性價比顯著領先。
超節點以量取勝,國產集群彎道超車
東方證券報告的核心論斷之一,是超節點架構為國產芯片提供了繞過單卡性能短板的有效路徑。
以華為CloudMatrix 384與英偉達GB200 NVL72為例:單顆昇騰910C芯片的BF16性能僅為GB200模組的約三分之一,但通過超節點集群方式,單個CloudMatrix 384集群的BF16總性能反而是NVL72的1.7倍,總內存容量為后者3.6倍,總內存帶寬為后者2.1倍。
報告指出,通過Switch tray多芯片方案,國產交換芯片帶寬代際相對落后的問題亦可得到有效彌補。
據玉淵譚天援引的數據,2025年國產AI芯片的國內市場份額已達到約41%。
模型端同樣有新進展——DeepSeek-V4模型適配昇騰芯片后,實現了高吞吐、低時延的推理部署;智譜GLM-5宣布完成與7家主流國產芯片平臺的深度適配。
東方證券指出,在互聯協議層面,國產生態布局亦在提速:
- 華為于2025年9月發布并開放靈衢(UB)2.0技術規范,支持從機柜級向數據中心級的多維度擴展;
- 中國移動牽頭、包括盛科通信等48家單位參與的OISA Gen2.0協議,支持AI芯片數量提升至1024張,帶寬突破TB/s級別;
- 海光、阿里、字節跳動亦分別發布HSL、ALS、EthLink等自研互聯協議,開放Scale up生態持續豐富。
五大變化趨勢,產業鏈受益路徑清晰
東方證券報告梳理出超節點時代的五大產業變化趨勢。
首先是,交換芯片需求量價齊升。
超節點機柜內新增Scale up域,驅動交換機及交換芯片用量大幅增加。
![]()
以Rubin NVL72為例,相比Blackwell,隨著GPU帶寬翻倍,單機柜交換芯片用量從18顆提升至36顆。
報告還指出,伴隨集群規模擴展、引入二級HBD域,交換芯片需求或將進一步倍增。
其次,液冷成為剛需,全液冷時代漸進。當單機柜總功耗達到50KW以上時,液冷成為必選方案。
![]()
GB200 NVL72單機柜功耗已達120KW,華為CloudMatrix 384和阿里磐久2.0均采用風液混合方案。
更新一代的Vera Rubin NVL72機柜將正式采用100%全液冷,交換機芯片、DPU、光模塊等全面搭配液冷散熱模組,機柜外側CDU散熱量將邁入MW級。
第三則是服務器ODM價值重估。
超節點服務器使廠商從過去L10級別的服務器組裝交付,提升至L11整機柜級甚至L12多機柜級制造交付,參與環節從Computer tray延伸至Switch tray、網絡互聯、供電與制冷系統集成,準入門檻大幅提高。
![]()
華勤技術預計2026年全年超節點項目收入將超過百億元;浪潮信息發布元腦SD200超節點,實現64路國產AI芯片高速統一互連;百度旗下昆侖芯256/512超節點將分別于2026年上下半年上市。
第四,光互連與PCB背板需求新增。
計算節點與交換節點之間的高速互聯,在64或128 XPU規模內以銅纜為首選,綜合成本約為光互聯方案的二分之一。
![]()
超出128 XPU后,正交背板方案信號損耗更低、結構穩固,適合高密架構;更大規模超節點集群則需引入OCS(光電路交換)設備,進一步支持Dragonfly+或3D Torus等拓撲擴展。
最后是供電架構重構,PSU及HVDC需求提升。
超節點采用"機房級高壓直供→機柜級母線傳輸→節點級精準降壓"的三級集中供電架構,PSU逐步從3.3KW向5.5KW、18.3KW升級,對應Powershelf提升至33KW乃至110KW。
隨著機柜功率邁入MW級,數據中心供電架構有望加速向高壓直流(HVDC)和固態變壓器(SST)轉型。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.