在人工智能模型參數規模向萬億級邁進、對算力需求持續爆炸的當下,大規模GPU集群的協同效率,尤其是芯片間通信延遲,已成為制約整體算力的核心瓶頸。2026年1月,摩爾線程智能科技一項名為“第一圖形處理器、遠程通信方法、芯片、服務器及設備”的發明專利獲得授權,直指這一行業痛點。該技術通過在硬件層面實現計算與通信的并發執行,有望將多卡協同中的數據等待時間大幅壓縮,為國產高性能計算與智算集群的發展注入新動能。
![]()
傳統GPU架構在面臨遠程通信任務時,數據需經由計算核心內的存儲資源進行中轉。這一過程不僅占用本應用于計算的寶貴硬件資源,更會導致計算任務被強制中斷,產生顯著的“計算空泡”,使得集群的等效算力利用率難以提升。摩爾線程此次獲得專利的技術,其革新之處在于在數據加載引擎中開辟了獨立的專用遠程通信通路。
憑借這一設計,當需要進行跨處理器數據交換時,通信指令可直接通過該通路訪問全局存儲單元并送達目標GPU,完全繞過了計算核心。這帶來了雙重收益:計算單元得以持續專注運算而不被干擾,實現了真正的“計算-通信”并發;同時,精簡的數據路徑也直接降低了傳輸延遲與系統功耗。根據公開信息,在與合作伙伴的適配測試中,該技術已幫助實現通信延遲降低約60%的顯著效果。
這項突破并非孤立事件,而是摩爾線程系統性技術布局下的重要成果。其早在“花港”架構設計階段就已預埋異步通信引擎,并集成自研的MTLink高速互聯技術。配合此次的底層硬件通路創新,公司正構建從芯片級到集群級的完整通信優化體系。據悉,基于MTLink2.0技術,其單機8卡互聯的帶寬利用率已可接近85%,并能智能感知拓撲結構,為跨節點通信匹配最佳路徑。
![]()
當前,中國正加速建設自主可控的算力基礎設施。在此背景下,摩爾線程此項能夠直接提升大規模集群實際效能的專利技術,其戰略價值尤為突出。它解決的不僅是單卡或單機性能問題,更是面向萬卡乃至更大規模智算中心的核心可擴展性問題。隨著AI與科學計算對算力需求的復雜度不斷提升,此類底層通信技術的突破,將成為衡量國產算力平臺競爭力的關鍵指標之一。
從“花港”架構發布到持續獲得核心專利授權,摩爾線程正沿著清晰的路徑夯實其技術護城河。在國產GPU向高端領域攀登的征程中,單純追求峰值算力已遠遠不夠,系統級效率與可擴展性正成為新的競爭焦點。此項通信專利的落地,標志著國產GPU在攻克集群效能瓶頸上邁出了堅實一步,為未來更大規模的自主算力部署提供了關鍵的技術支撐。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.