文/觀察者網 呂棟
6月23日下午,在德國漢堡國際超算大會(ISC2026)上,新一期全球超算TOP500榜單公布。其中全國產自主研制的“靈晟”超級計算機,以2.19EFlops(每秒10的18次方浮點運算)持續雙精度浮點性能登頂。
這不僅是世界首臺持續性能超二百億億次(2EFlops)的超算系統,也是繼2017年“神威·太湖之光”之后,中國超算時隔九年再次重返世界第一。同時,“靈晟”也是全球第五臺百億億次級超級計算機。
在本次排名中,美國勞倫斯·利弗莫爾國家實驗室的El Capitan以1.809 Exaflop/s位列第二,美國橡樹嶺國家實驗室的Frontier以1.353 Exaflop/s位列第三。
國家超級計算深圳中心發文直言,“靈晟”全面領先美歐E級超算,強勢宣告中國超算重回世界之巔。
“靈晟”最值得關注的,在于走了一條與當前主流超算不同的路。頒獎儀式上,“靈晟”超算系統總設計師、國家超算深圳中心主任、中山大學教授盧宇彤指出,超算發展已邁入超智融合新階段,“靈晟”系統首創Online Acceleration的全CPU架構,打破傳統CPU-GPU異構架構壁壘,內嵌AI矩陣加速單元,回歸計算加速的本質,實現超算智算等多種計算模式的高效協同,全面賦能科學智能計算。
從架構來看,“靈晟”共包含20480個計算節點,每個節點搭載兩顆基于ARMv9架構的LX2處理器,運行頻率1.55GHz。每顆處理器包含兩個計算芯粒,每個芯粒劃分為四個NUMA域,每個NUMA域包含38個ARMv9核心和4GB高帶寬內存。全系統共計近1400萬個CPU核心。節點之間采用國產“靈啟”互連技術,以雙平面多軌胖樹拓撲連接,每節點帶寬1.6Tb/s;系統運行麒麟操作系統。
![]()
盧宇彤分享到,“靈晟”定位為面向科學工程智能計算的國產全棧融合基礎設施:
在芯片層,自研LX2CPU創新性引入多精度與矩陣加速等能力,實現片上超算算力與智能算力深度融合,并集成了首顆國產HBM,內存帶寬相比傳統CPU提升10倍;在網絡層,自主設計的靈啟高速互連網絡可支持200萬個端口、10萬節點的超大規模組網;在存儲層,采用分層架構,兼顧高性能作業區與容量型數據區,可擴展至E級;在系統層,構建大規模超智融合框架,自研全棧軟件,將底層硬件能力以可用、可編程、可優化的方式釋放給應用,提高各領域應用性能;在節能方面,首創100%全液冷散熱計算機柜,以51GFlops/W能效比,在世界第一的持續性能之上,樹立綠色計算新標桿。
![]()
全球超算算力排名
超算是擁有極高計算速度和強大并行處理能力的計算系統,專門用于處理科學研究、氣候模擬、藥物研發、天體物理等需要大量計算的數據密集型任務,可預測天氣、模擬臺風路徑、研發新藥、篩選抗癌分子。
上一次中國超算登頂TOP500,是2017年的“神威·太湖之光”。這臺安裝于國家超級計算無錫中心的集群,以93 Petaflop/s的Linpack成績位居榜首,并保持了兩年半之久,直到2018年春季橡樹嶺國家實驗室的IBM Summit系統問世。“神威·太湖之光”采用中國自主設計的“申威”系列芯片,是全球第一臺運行速度超過10億億次/秒的超級計算機,峰值性能高達12.5億億次/秒,持續性能達到9.3億億次/秒。2019年,美國政府對華實施制裁并限制中國獲取最強大的芯片,此后中國停止了向TOP500提交Linpack測試結果。盡管中國仍在繼續建設超算,但在此后近九年的時間里,TOP500榜首一直由美國和歐洲的系統占據。
如今“靈晟”的登頂,打破了這一局面。
![]()
“靈晟”超算系統總設計師、國家超算深圳中心主任、中山大學教授盧宇彤
本次TOP500榜單中,“靈晟”登頂后,其他超算排名均順延一位。勞倫斯·利弗莫爾國家實驗室的El Capitan以1.809 Exaflop/s位列第二,橡樹嶺國家實驗室的Frontier以1.353 Exaflop/s位列第三,阿貢國家實驗室的Aurora以1.012 Exaflop/s位列第四,德國于利希超級計算中心的JUPITER Booster以1.000 Exaflop/s位列第五。前十名中有一張新面孔——意大利能源公司埃尼集團的HPC7以571.5 Petaflop/s首次亮相便躋身第六。微軟Azure云平臺的Eagle系統降至第七,意大利埃尼的HPC6位列第八,日本的Fugaku以442 Petaflop/s位列第九,瑞士的Alps以434.9 Petaflop/s位列第十。
TOP500在新聞稿中指出,超級計算領域的高端架構正呈現出顯著的多樣性。從全中國自主研發的全CPU架構的“靈晟”,到配備AMD加速器的HPE Cray集群(如El Capitan和Frontier),再到采用英偉達 Grace Hopper架構的JUPITER Booster和Alps,乃至搭載英特爾Ponte Vecchio GPU的Aurora系統,沒有哪一種架構占據絕對主導地位。微軟的Eagle集群結合了Intel Xeon處理器和Nvidia H100加速器,而日本的Fugaku則基于富士通的A64FX Arm處理器構建。“這份榜單表明,通往領先級計算領域并沒有單一的主導技術路徑。相反,廠商們正在探索各種CPU、GPU、APU和定制加速器方案,并結合不同的互連和系統設計。”
“靈晟”的登頂,不僅是性能的突破,更是一種技術路線的驗證。在AMD與英偉達GPU對華出口禁令持續生效的背景下,中國超算選擇了一條不依賴外部GPU的全CPU路徑,并在全球最權威的性能榜單上證明了這條路徑的可行性。這背后是芯片、互連、存儲、系統軟件、散熱等各個環節的全面自主突破。“靈晟”的價值最終體現在應用上——在大規模并行環境下平均擴展效率84.4%,實現了超過千萬核心的全系統高效可擴展運行。從2017年“神威·太湖之光”的93 Petaflop/s到2026年“靈晟”的2.198 Exaflop/s,中國超算在近九年的時間里完成了超過23倍的性能躍升,重新定義了全球超算的算力天花板。
本文系觀察者網獨家稿件,未經授權,不得轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.