近日,全球首個無線纜箱式超節點scaleX40問世,引起AI算力市場廣泛關注。某頭部互聯網大廠認為,當前用戶既需要巔峰算力進行前沿探索,也需要從小規模起步驗證技術路線。這款40卡超節點是基于“大算力”同架構下的中小規模方案,為用戶提供了更好的起點。
據悉,scaleX40基于系統級創新和“甜點”規格設計,不僅有效破解了高端算力部署難題,還向眾多中小企業釋放出三個關鍵詞:買得起、用得上、用得好。
所謂“買得起”,是指scaleX40成功將超節點采購成本拉至千萬級區間,并且通過無線纜正交架構與19英寸標準箱式設計,大大降低了企業部署難度,讓絕大部分用戶都能入手。
![]()
此前,傳統超節點需要復雜的機房改造、大量的線纜布設與專業運維團隊支持,部署周期較長,成本動輒過億。scaleX40的計算節點與交換節點通過背板直接對插,徹底取消了板間線纜,用戶只需將設備推入標準機柜,即可在幾小時內完成部署,確實屬于入門級超節點神器。
第二個關鍵詞“用得上”,特指此次產品創新瞄準了主流AI計算場景需求。盡管scaleX40的價格幾乎降低至傳統8卡服務器級別,但該款超節點內置40張AI加速卡,總算力超過28 PFLOPS(FP8精度),HBM總顯存超5TB,訪存帶寬超80TB/s。
客觀來看,40張卡通過一級Scale-Up全互連,支持內存語義與統一顯存編址,確實基本滿足了千億級模型的訓推需求。這在大部分企業級用戶中都達到了“夠用”標準。
重點在于第三個關鍵詞。作為一款高端算力普惠化產品,scaleX40超節點注定將在主流市場觸達很多新客群。尤其對于缺乏運維開發經驗的用戶,能不能“用得好”這款產品至關重要。
可以看出,翻過采購成本和部署難度兩道門檻后,中科曙光在scaleX40的場景化應用上進行了重點考量:
1)配套“懂AI”的存力底座:scaleX40超節點配備了ParaStor存儲系統,基于存算網三級強協同,訓推效率、帶寬、算力利用率顯著提升。智能數據管理模塊支持集群內冷熱數據無感遷移、跨集群數據流動,并且可為超節點提供專屬AI數據工廠。
2)開發/調度/運維一站式設計:基于配套的SothisAI平臺,用戶可以一站式搞定超節點運維管理和大模型&智能體開發,實現模型訓推全鏈路閉環,高效集成智能體應用,且支持自動斷點續訓、故障智能隔離、業務無感恢復等,讓用戶真正做到一鍵部署、開箱即用。
3)單Pod+雙Pod靈活擴展:針對不同用戶的業務發展需求,該產品支持縱向Scale-up擴展和橫向Scale-out擴展。用戶可以基于scaleX40單元,通過二級互連構建數百卡超節點,也能通過scaleFabric無損網絡構建萬卡集群,滿足業務全生命周期應用需求。
根據中科曙光方面的定義,scaleX40的意義不止于性能提升,更在于重構算力交付邏輯,推動算力從“工程化建設”走向“產品化供給”。尤其考慮到該廠商此前連續推出scaleX640超節點、scaleX萬卡超集群,此次新一代scaleX40明顯是其高端算力普惠戰略的重要延續。
對于潛在用戶而言,scaleX40的升級版本已經給出場景實踐參考。比如在scaleX640應用中,某頭部AI大模型廠商通過自動調優實現了優于專家的并行優化策略,從頭預訓練的Loss曲線甚至可與英偉達保持一致,擴展效率達到驚人的99.63%。
該廠商負責人透露,接下來公司計劃通過曙光超節點,實現更大規模的高效端到端訓練和推理部署,尤其在大規模高效PD分離方面,雙方將繼續深化合作,充分釋放超節點算力效能。
見微知著,從同系列終端實踐成果到新一代超節點的全棧配套能力支持,曙光超節點在“用”之一字上頗見功力。至于scaleX40能打動多少企業級用戶,就要在后續產品交付中見分曉了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.