2025年,國產(chǎn)計算集群的爆發(fā)式突破,成為全球AI技術(shù)競備下的一聲有力回響。前有華為昇騰384總算力突破300 PFlops,達到NVL72系統(tǒng)的1.7倍;近有中科曙光scaleX640超節(jié)點二次提速,以630 PFlops算力規(guī)模的翻倍式增長,反超賽道頭車多個身位。
在單卡性能落后于人、NV卡成為科技制裁工具的背景下,中國智算正以集群式創(chuàng)新重新站穩(wěn)腳跟,并從計算生態(tài)、能效、成本等方面尋得更廣闊的戰(zhàn)略縱深。
從昇騰384到曙光scaleX640,國產(chǎn)超節(jié)點跑出加速度
繼年中華為推出昇騰384以來,國產(chǎn)超節(jié)點在“遙遙領(lǐng)先英偉達”呼聲中成為熱門概念。事實證明,外界仍然低估了國產(chǎn)計算集群的爆發(fā)力。就在最近的烏鎮(zhèn)世界互聯(lián)網(wǎng)大會上,全棧國產(chǎn)化的曙光scaleX640超節(jié)點浮出水面,各項性能指標(biāo)均已完成新一輪躍遷。
根據(jù)業(yè)內(nèi)曝出的性能數(shù)據(jù),曙光scaleX640不僅在總算力規(guī)模上實現(xiàn)倍數(shù)增幅,加速卡集成數(shù)量首次達到業(yè)內(nèi)最高的單機柜640卡,另外還從HBM、PUE值、算力密度、片間互聯(lián)總帶寬等維度,實現(xiàn)了綜合性能的全面趕超。此外,還可以通過雙scaleX640超節(jié)點組成千卡級計算單元。
以其對標(biāo)384超節(jié)點來看,scaleX640的HBM總?cè)萘繛?1.9TB,約為前者的1.7倍;HBM和片間互聯(lián)總帶寬均達到前者的1.9倍;在算力密度方面,同樣單機柜架構(gòu)下兩大超節(jié)點前后提升了驚人的20倍;此外,受益于曙光液冷技術(shù)的領(lǐng)先性,超節(jié)點能效也獲得顯著提升。
國產(chǎn)計算集群的大步快跑,對美國芯片巨頭形成了明顯的趕超壓力。依照英偉達最新戰(zhàn)略動向,黃仁勛近期再次強調(diào)了“系統(tǒng)優(yōu)先”策略,意在通過完整的AI基礎(chǔ)設(shè)施協(xié)同設(shè)計打破物理定律限制,在后摩爾時代繼續(xù)保持領(lǐng)先優(yōu)勢。
不過,盡管國產(chǎn)AI芯片單卡性能處于相對劣勢,但在集群式算力新賽道上,計算產(chǎn)業(yè)上下游涉及諸多環(huán)節(jié),系統(tǒng)構(gòu)成極為復(fù)雜,這為中國算力換道超車提供了更多機會。
可以看到,無論是此前的昇騰384,抑或更進一步的曙光scaleX640,都在極力推進計算系統(tǒng)高效協(xié)同,并在算力集群規(guī)模和集成度上展現(xiàn)出更大潛力。這也意味著,在國產(chǎn)廠商問鼎超節(jié)點之路上,中國算力或?qū)⑾到y(tǒng)性改善全球產(chǎn)業(yè)鏈中的劣勢地位。
AI算力之爭進入長跑模式,開放式協(xié)同激活內(nèi)生動力
將視角切換至需求側(cè),隨著AI大模型參數(shù)達到千億乃至萬億級別,大規(guī)模服務(wù)器集群訓(xùn)練成為標(biāo)配,計算產(chǎn)業(yè)鏈各個環(huán)節(jié)都將成為模型創(chuàng)新效率的“乘數(shù)基礎(chǔ)”。
僅以訓(xùn)練集群規(guī)模而言,數(shù)據(jù)并行(DP)、張量并行(TP)、流水線并行(PP)和序列并行(CP)等多種并行維度的乘積,才是計算集群算力的最終體現(xiàn)。而在更廣泛的AI應(yīng)用視角中,如算力生態(tài)的兼容度、軟件棧完善程度等,都將影響到大模型用戶開發(fā)效率和應(yīng)用成本。
有業(yè)內(nèi)人士總結(jié)稱,計算集群必須打破“通信墻”、“功耗墻”、“復(fù)雜度墻”,才能真正釋放出國產(chǎn)算力體系的市場價值。尤其近年來我國算力路線呈現(xiàn)百花齊放姿態(tài),技術(shù)復(fù)雜性和生態(tài)復(fù)雜性較強,能否在全產(chǎn)業(yè)鏈范圍內(nèi)實現(xiàn)深度協(xié)同,將成為未來全球算力體系之爭的關(guān)鍵。
值得注意的是,大規(guī)模智算集群由算、存、網(wǎng)、電、冷諸多子系統(tǒng)構(gòu)成,組件數(shù)量繁多,系統(tǒng)耦合要求極高,整體研發(fā)周期較長。超節(jié)點玩家需要在生態(tài)建設(shè)上展開持續(xù)性投入,不斷優(yōu)化產(chǎn)業(yè)協(xié)作模式,才有望贏得這場算力長跑。
比如昇騰384超節(jié)點圍繞自身CANN架構(gòu),極力號召開放者參與生態(tài)共建。曙光scaleX640更是徹底打開格局,基于AI計算開放架構(gòu)完成不同類型加速卡的統(tǒng)一適配,并且直接兼容主流AI計算生態(tài),進一步支持AI模型、業(yè)務(wù)應(yīng)用快速無縫遷移與深度優(yōu)化。
某種意義上來說,相較于后者在算力集成量級上的增長,這種“以開放促協(xié)同”的模式對國產(chǎn)算力市場的影響更為深遠——
同樣錨定計算系統(tǒng)協(xié)同前提下,開放式架構(gòu)相比單一芯片路線,涉及到更多廠商、更豐富的產(chǎn)品以及更長的產(chǎn)業(yè)鏈條,同時也意味著其系統(tǒng)潛能更大,“乘數(shù)基礎(chǔ)”更強。尤其在全球算力體系化的長期比拼中,開放共贏模式內(nèi)生動力充沛,更有望摘得智算價值鏈高處的果實。
總體來看,國產(chǎn)超節(jié)點的步步趕超,一方面鞏固了國產(chǎn)算力陣營的規(guī)模體量優(yōu)勢,另一方面也在計算生態(tài)協(xié)同領(lǐng)域,加速完成著路徑驗證和模式優(yōu)化。
毋庸置疑,在AI芯片單體性能受限的高壓環(huán)境下,國產(chǎn)算力并未落入對手的節(jié)奏,而是在更宏觀的產(chǎn)業(yè)視角下內(nèi)煉外延,開墾出一片更具想象力的膏腴之地。何況中國作為全球最大的AI應(yīng)用市場之一,我們有能力為國產(chǎn)智算集群提供足夠的孵化空間。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.