如果你最近關(guān)注算力圈,鄭州這件事繞不開。
2月5日,國家超算互聯(lián)網(wǎng)核心節(jié)點在鄭州上線試運行,而且一口氣部署了3套中科曙光scaleX萬卡超集群,成為全國首個實現(xiàn)3萬卡部署、且實際投入運營的最大國產(chǎn)AI算力池。
![]()
在大模型參數(shù)規(guī)模一路往萬億級狂奔的背景下,這種“集中式、一次到位”的部署方式,本身就是一種態(tài)度。
萬卡集群為什么不再慢慢堆?
過去幾年,算力建設(shè)的主旋律是補短板,能多一臺是一臺。但當模型規(guī)模真正跨過臨界點后,問題開始變得現(xiàn)實且殘酷。
算力不集中,模型就跑不穩(wěn);
通信不確定,規(guī)模一放大就掉效率;
調(diào)度跟不上,卡再多也白搭。
國家超算互聯(lián)網(wǎng)核心節(jié)點顯然不打算走試探路線,3套scaleX萬卡超集群同步落地,直接把算力集中度拉滿。
這不是為了好看,而是為了讓大模型訓練、推理這些任務(wù),真的能長期跑下去。
背后是復雜的系統(tǒng)工程。中科曙光啃下了高速互聯(lián)網(wǎng)絡(luò)、存算傳緊耦合設(shè)計、高密供電與散熱、統(tǒng)一資源高效調(diào)度等技術(shù)“硬骨頭”,使得單套集群可實現(xiàn)10240塊AI加速卡部署。
三套協(xié)同運行,不僅僅是簡單疊加,而是軟硬一體的系統(tǒng)性升級。
國家超算互聯(lián)網(wǎng)核心節(jié)點,上來走的就是“滿配”路線
國家超算互聯(lián)網(wǎng)核心節(jié)點的定位,決定了它不能是一個普通算力池。
作為國家超算互聯(lián)網(wǎng)的重要樞紐,它既要有效聯(lián)動西部綠色算力資源,承接東部地區(qū)的算力需求外溢,也要面對跨區(qū)域調(diào)度、長期運行的國家級應用,助力形成全國一體化算力網(wǎng)。
這對算力底座有幾個硬要求:
▌第一,算力必須夠集中。
大模型訓練越來越依賴同構(gòu)資源,拼湊式算力很難支撐整機訓練。
scaleX萬卡超集群本身就是為規(guī)模化集中計算設(shè)計的,而且在架構(gòu)上預留了向十萬卡、百萬卡擴展的空間。
▌第二,能耗和散熱要扛得住。
基于全球首創(chuàng)的高密度單機柜,scaleX采用超高密度刀片、浸沒相變液冷等技術(shù),把單機柜算力密度拉高了約20倍,同時把PUE壓到1.04。
對國家級節(jié)點來說,這是長期穩(wěn)定運行的必備條件。
▌第三,生態(tài)不能太挑。
scaleX萬卡超集群兼容CUDA等主流AI生態(tài),同時支持多品牌國產(chǎn)AI加速卡的混合部署。
對用戶來說,意味著國產(chǎn)算力首次實現(xiàn)“大團結(jié)”,遷移成本可控。
萬卡的價值真只是算得快嗎?
如果只是算力規(guī)模大,那并不稀奇,真正拉開差距的是“用起來怎么樣”。
scaleX萬卡超集群已完成400多個主流大模型、世界模型的適配優(yōu)化,依托國家超算互聯(lián)網(wǎng),更可接入上千款應用,鏈接更多AI產(chǎn)業(yè)生態(tài)伙伴,實現(xiàn)“算力+應用”一體化交付。
在超大規(guī)模模型訓練場景中,scaleX已經(jīng)具備萬億參數(shù)模型的整機訓練與容錯恢復能力,這對動輒連續(xù)運行數(shù)月的任務(wù)尤為關(guān)鍵。
在高通量推理場景,scaleX已服務(wù)于多家頭部互聯(lián)網(wǎng)用戶的核心智能化業(yè)務(wù),并通過聯(lián)合深度優(yōu)化持續(xù)提升推理效能。
在AI for Science領(lǐng)域,scaleX支撐國內(nèi)某材料研發(fā)大模型登頂國際權(quán)威榜單,助力國內(nèi)頂級科研團隊將蛋白質(zhì)研究效率提升3-6個數(shù)量級等;同時搭配OneScience科學大模型一站式開發(fā)平臺,大幅降低多學科交叉研究的創(chuàng)新門檻。
這些場景背后指向技術(shù)的本質(zhì):萬卡集群從來都不是為了更大的數(shù)字,而是實實在在服務(wù)好AI產(chǎn)業(yè)的研發(fā)場景。
一個越來越清晰的趨勢
回頭看,國家超算互聯(lián)網(wǎng)核心節(jié)點真正釋放的信號,其實很明確。
國產(chǎn)算力的競爭,正在從單點性能,走向體系能力。比的不只是峰值指標,更是誰能把萬卡規(guī)模長期、穩(wěn)定、低成本地跑起來,誰能支撐真實產(chǎn)業(yè)和國家級任務(wù)。
3套scaleX萬卡超集群同步落地,本身就是一次現(xiàn)實回答。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.