這幾年,大家都在拼算力,但算力在拼到芯片極限之前,先撞上的,其實是物理極限↓
比如:電能不能跟上,熱能不能帶走,系統在極限狀態下能不能穩定運行?
不搞定這些問題,算力芯片肯定要「撞墻」。
![]()
如今,這些物理極限,正在被中國算力企業逐步突破。
4月8日,曙光數創發布全球首個MW級相變浸沒液冷整機柜及其基礎設施整體解決方案(C8000 V3.0)。
他們要打破的,就是這道極限墻。
![]()
萬卡之后,先過“電和熱”這一關
當智算集群單機柜功率從幾十kW一路抬升到數百kW,甚至逼近MW級,一系列問題會集中出現:
散熱跟不上,芯片降頻;
供電響應滯后,負載波動被放大;
機房空間吃緊,集群規模被物理條件卡死…
這個難題不解決,萬卡之后就沒有下一步。
C8000 3.0的價值,恰恰就在這里。
這是一次典型的重做底座:把散熱、供電、控制、可靠性幾件原本分散的問題,推到極限。
一、先看散熱
浸沒式相變液冷把單機柜功率直接推到超過900kW,達到MW級,散熱能力超過200W/cm2,同時依靠自研冷媒和相變機制,實現全年自然冷卻,PUE壓到1.04以下。
再疊加金剛石銅導熱材料,導熱率提升80%,帶來約10%的實測算力提升。
二、再看供電
高壓直流入柜,系統效率超過96%,支持多源輸入和毫秒級切換;
輸出電流響應速度超過2.5A/μs,可以跟上大模型訓練中劇烈的負載變化。
三、控制和穩定性重構
相變系統可以根據負載自動調節換熱狀態,在波動中維持穩定;
同時通過快速故障診斷,把風險前置消化。
四、工程能力
機電一體化設計疊加高標準密封結構,讓高密度系統在長期運行中具備可控的安全邊界。
五、硬件適配及開發
適配主流CPU、GPU芯片,支持服務器主板開發,開放系統滿足各類AI計算場景。
C8000 3.0把所有這些能力疊加在一起,要解決的就是:在既定空間和能耗約束下,算力可以繼續向上擴展,并開放賦能國產算力生態。
目前,這套系統已經搭載于中科曙光scaleX萬卡超集群,在國家超算互聯網核心節點上線試運行。
芯片之外,中國在換一種解法
接下來,我們把視角拉到更大范圍↓
在全球主流路徑里,算力基本是“芯片驅動”:靠更先進制程、更高能效,把性能往上推,基礎設施更多是配套。
但中國面對的約束不一樣。
在高端芯片仍受限制的情況下,如果完全依賴同一條路徑,很容易被卡在上游。
怎么破?一條更現實的路線開始變清晰:用基礎設施能力,去重構系統算力。
這也就是業內常說的,“以基強算”。
當散熱能力足夠強,芯片可以更長時間跑在高頻;
當供電響應足夠快,可以承接更劇烈的負載變化;
當系統密度足夠高,集群規模可以繼續往上堆。
于是,算力變成了系統工程的結果,而不再只是芯片參數的體現。
C8000 3.0給出了一個很直接的驗證:在芯片不變的情況下,性能提升約10%。
這10%,正是來自基礎設施。
算力這場大戲,基礎設施開始搶“一番”了
回頭看這幾年的變化,有一點很明顯↓
模型規模在指數級增長,芯片供給和性能提升并沒有同步跟上。
但兩者之間的缺口,正在被基礎設施填補。
![]()
誰能把散熱、供電、密度和系統穩定性做到極致,誰就能在同樣的芯片條件下,跑出更高的有效算力。
更關鍵的是,這一層能力,開始被系統化。
這次發布會期間成立的MW級浸沒相變液冷基礎設施開放實驗室,從兼容性測試到聯合攻關,再到標準制定,正在把MW級能力沉淀為一套可以復制的行業基礎。
中國過去在高鐵、電網、基建上反復驗證過一件事:一旦底層能力被做透,規模和效率就會同時出現。
現在,這套邏輯開始出現在算力上,隨著萬卡集群落地,邏輯變得更加清晰:
算力競爭,已經從芯片層,走到了基礎設施層。
而這一層,恰恰是中國最擅長的地方。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.