從領(lǐng)先到更領(lǐng)先，國產(chǎn)超節(jié)點如何問鼎全球智算集群？

2025-11-06 18:00:11　來源: 鮮棗課堂

江蘇舉報

分享至

2025年，國產(chǎn)計算集群的爆發(fā)式突破，成為全球AI技術(shù)競備下的一聲有力回響。前有華為昇騰384總算力突破300 PFlops，達到NVL72系統(tǒng)的1.7倍；近有中科曙光scaleX640超節(jié)點二次提速，以630 PFlops算力規(guī)模的翻倍式增長，反超賽道頭車多個身位。

在單卡性能落后于人、NV卡成為科技制裁工具的背景下，中國智算正以集群式創(chuàng)新重新站穩(wěn)腳跟，并從計算生態(tài)、能效、成本等方面尋得更廣闊的戰(zhàn)略縱深。

從昇騰384到曙光scaleX640，國產(chǎn)超節(jié)點跑出加速度

繼年中華為推出昇騰384以來，國產(chǎn)超節(jié)點在“遙遙領(lǐng)先英偉達”呼聲中成為熱門概念。事實證明，外界仍然低估了國產(chǎn)計算集群的爆發(fā)力。就在最近的烏鎮(zhèn)世界互聯(lián)網(wǎng)大會上，全棧國產(chǎn)化的曙光scaleX640超節(jié)點浮出水面，各項性能指標(biāo)均已完成新一輪躍遷。

根據(jù)業(yè)內(nèi)曝出的性能數(shù)據(jù)，曙光scaleX640不僅在總算力規(guī)模上實現(xiàn)倍數(shù)增幅，加速卡集成數(shù)量首次達到業(yè)內(nèi)最高的單機柜640卡，另外還從HBM、PUE值、算力密度、片間互聯(lián)總帶寬等維度，實現(xiàn)了綜合性能的全面趕超。此外，還可以通過雙scaleX640超節(jié)點組成千卡級計算單元。

以其對標(biāo)384超節(jié)點來看，scaleX640的HBM總?cè)萘繛?1.9TB，約為前者的1.7倍；HBM和片間互聯(lián)總帶寬均達到前者的1.9倍；在算力密度方面，同樣單機柜架構(gòu)下兩大超節(jié)點前后提升了驚人的20倍；此外，受益于曙光液冷技術(shù)的領(lǐng)先性，超節(jié)點能效也獲得顯著提升。

國產(chǎn)計算集群的大步快跑，對美國芯片巨頭形成了明顯的趕超壓力。依照英偉達最新戰(zhàn)略動向，黃仁勛近期再次強調(diào)了“系統(tǒng)優(yōu)先”策略，意在通過完整的AI基礎(chǔ)設(shè)施協(xié)同設(shè)計打破物理定律限制，在后摩爾時代繼續(xù)保持領(lǐng)先優(yōu)勢。

不過，盡管國產(chǎn)AI芯片單卡性能處于相對劣勢，但在集群式算力新賽道上，計算產(chǎn)業(yè)上下游涉及諸多環(huán)節(jié)，系統(tǒng)構(gòu)成極為復(fù)雜，這為中國算力換道超車提供了更多機會。

可以看到，無論是此前的昇騰384，抑或更進一步的曙光scaleX640，都在極力推進計算系統(tǒng)高效協(xié)同，并在算力集群規(guī)模和集成度上展現(xiàn)出更大潛力。這也意味著，在國產(chǎn)廠商問鼎超節(jié)點之路上，中國算力或?qū)⑾到y(tǒng)性改善全球產(chǎn)業(yè)鏈中的劣勢地位。

AI算力之爭進入長跑模式，開放式協(xié)同激活內(nèi)生動力

將視角切換至需求側(cè)，隨著AI大模型參數(shù)達到千億乃至萬億級別，大規(guī)模服務(wù)器集群訓(xùn)練成為標(biāo)配，計算產(chǎn)業(yè)鏈各個環(huán)節(jié)都將成為模型創(chuàng)新效率的“乘數(shù)基礎(chǔ)”。

僅以訓(xùn)練集群規(guī)模而言，數(shù)據(jù)并行（DP）、張量并行（TP）、流水線并行（PP）和序列并行（CP）等多種并行維度的乘積，才是計算集群算力的最終體現(xiàn)。而在更廣泛的AI應(yīng)用視角中，如算力生態(tài)的兼容度、軟件棧完善程度等，都將影響到大模型用戶開發(fā)效率和應(yīng)用成本。

有業(yè)內(nèi)人士總結(jié)稱，計算集群必須打破“通信墻”、“功耗墻”、“復(fù)雜度墻”，才能真正釋放出國產(chǎn)算力體系的市場價值。尤其近年來我國算力路線呈現(xiàn)百花齊放姿態(tài)，技術(shù)復(fù)雜性和生態(tài)復(fù)雜性較強，能否在全產(chǎn)業(yè)鏈范圍內(nèi)實現(xiàn)深度協(xié)同，將成為未來全球算力體系之爭的關(guān)鍵。

值得注意的是，大規(guī)模智算集群由算、存、網(wǎng)、電、冷諸多子系統(tǒng)構(gòu)成，組件數(shù)量繁多，系統(tǒng)耦合要求極高，整體研發(fā)周期較長。超節(jié)點玩家需要在生態(tài)建設(shè)上展開持續(xù)性投入，不斷優(yōu)化產(chǎn)業(yè)協(xié)作模式，才有望贏得這場算力長跑。

比如昇騰384超節(jié)點圍繞自身CANN架構(gòu)，極力號召開放者參與生態(tài)共建。曙光scaleX640更是徹底打開格局，基于AI計算開放架構(gòu)完成不同類型加速卡的統(tǒng)一適配，并且直接兼容主流AI計算生態(tài)，進一步支持AI模型、業(yè)務(wù)應(yīng)用快速無縫遷移與深度優(yōu)化。

某種意義上來說，相較于后者在算力集成量級上的增長，這種“以開放促協(xié)同”的模式對國產(chǎn)算力市場的影響更為深遠——

同樣錨定計算系統(tǒng)協(xié)同前提下，開放式架構(gòu)相比單一芯片路線，涉及到更多廠商、更豐富的產(chǎn)品以及更長的產(chǎn)業(yè)鏈條，同時也意味著其系統(tǒng)潛能更大，“乘數(shù)基礎(chǔ)”更強。尤其在全球算力體系化的長期比拼中，開放共贏模式內(nèi)生動力充沛，更有望摘得智算價值鏈高處的果實。

總體來看，國產(chǎn)超節(jié)點的步步趕超，一方面鞏固了國產(chǎn)算力陣營的規(guī)模體量優(yōu)勢，另一方面也在計算生態(tài)協(xié)同領(lǐng)域，加速完成著路徑驗證和模式優(yōu)化。

毋庸置疑，在AI芯片單體性能受限的高壓環(huán)境下，國產(chǎn)算力并未落入對手的節(jié)奏，而是在更宏觀的產(chǎn)業(yè)視角下內(nèi)煉外延，開墾出一片更具想象力的膏腴之地。何況中國作為全球最大的AI應(yīng)用市場之一，我們有能力為國產(chǎn)智算集群提供足夠的孵化空間。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.