網易首頁 > 網易號 > 正文申請入駐

摩爾線程上市后首秀！第五代“花港”架構重磅亮相

2025-12-20 15:34:59　來源: 問芯

北京舉報

分享至

剛剛完成上市壯舉的摩爾線程，顯然希望用硬核技術來回應資本市場的熱切關注。

今天，摩爾線程在北京中關村國際創新中心拉開了首屆 MUSA 開發者大會（MDC 2025）的帷幕。在備受矚目的主論壇上，摩爾線程創始人、董事長兼 CEO 張建中發表了上市后的首場公開演講，并正式揭曉了備受期待的新一代全功能 GPU 架構及重磅新品。

（來源：直播截圖）

摩爾線程的 GPU 架構保持每年一代的迭代速度，2022 至 2023 年，摩爾線程接連推出“蘇堤”與“春曉”兩代架構，不僅快速完成了服務器產品的布局，更憑借里程碑式的 MTT S80 一舉打破了國產顯卡“不能玩游戲”的魔咒，完成了全功能技術路線的關鍵驗證。

進入 2024 年，隨著“曲院”架構的問世，旗艦計算卡 MTT S4000 成功具備了千億參數大模型的訓練能力，標志著國產 GPU 在 AI 核心戰場取得了實質性突破。到 2025 年，最新量產的“平湖”架構更進一步，針對前沿 AI 算法需求增加了 FP8 精度支持，算力效能大幅躍升，已具備穩健支撐 DeepSeek 等頂尖大模型訓練的硬核實力。

開發者大會上，張建中首先重磅介紹了 2026 年即將量產的新一代 GPU 架構“花港”。作為本次大會的絕對主角，“花港”不僅是單純的性能升級，更是對算力密度與能效比的一次極限挑戰。

（來源：直播截圖）

據張建中介紹，得益于全新一代指令集與架構打磨，“花港”實現了算力密度提升 50%，能效比更是驚人地提升了 10 倍，直擊數據中心能耗痛點。該架構針對大模型訓練需求，集成了全精度端到端加速能力，特別優化了 FP8、FP6 及 FP4 低精度計算單元，并支持構建 10 萬卡以上規模的超大智算集群。同時，“花港”內置新一代 AGR（AI 生成式渲染）架構與第二代光線追蹤引擎，光追生成速度較上一代“平湖”提升 5-6 倍，并在底層構建了四層硬件級安全防護體系，實現了高性能、高通用與高安全的統一。

基于“花港”架構的首款旗艦產品“華山”，被定義為一款超智融合的 AI 訓推一體芯片。在核心算力指標上，“華山”的浮點計算能力已躋身國際第一梯隊，介于英偉達 Blackwell 與 Hopper 架構產品之間。芯片搭載 MT Link 4.0 高速互聯技術，單節點支持 1024 卡直接 Scale-up 互聯，精準匹配大模型算力需求。為追求極致效率，華山內置了 MT LLM Engine（大語言模型加速引擎），并引入新一代異步編程模型。

（來源：直播截圖）

面向專業設計與發燒級游戲市場，摩爾線程推出了基于“花港”架構的全新圖形芯片“廬山” 。相比廣受關注的 MTT S80，“廬山”實現了性能的跨越式暴漲：游戲性能提升 15 倍，光線追蹤性能提升 50 倍，AI 計算能力更是提升了 64 倍。

（來源：直播截圖）

值得注意的是，“廬山”擁有目前業界領先的幾何能力，較前代提升 16 倍，顯存容量擴充至 4 倍，足以應對工業軟件中海量三角形面的復雜渲染需求。此外，通過引入 UNITE（統一任務引擎），“廬山”實現了 GPU 集群算力的全并行調度，結合 AGR AI 生成式渲染技術，為 CAD/CAE 設計、影視特效及 3A 游戲提供了國產頂級的圖形處理體驗。

在大模型訓練領域，摩爾線程正式發布了夸娥（KUAE）萬卡智算集群解決方案，并具備向 10 萬卡規模演進的能力。該集群提供高達 10 ExaFLOPS 的浮點算力，模型算力利用率（MFU）突破 60%，并憑借集群守護軟件實現了故障節點的零中斷自動修復，將訓練成功率提升 30%。發布會現場展示的實測數據顯示，使用 MTT S5000 進行 DeepSeek V3 及 R1 模型的 FP8 全量訓練時，其 Loss 曲線與英偉達 Hopper 系列基本重合，且在同等數據量下的模型評測效果甚至略優于國際主流產品。

（來源：直播截圖）

針對具身智能與邊緣計算的爆發，摩爾線程發布了代號為“長江”的智能 SoC 芯片。這是一款集成度極高的芯片，單顆芯片內融合了 CPU、全功能 GPU、NPU、VPU、DPU、DSP 及 ISP 等幾乎所有核心處理單元。它被定位為機器人的“敏捷小腦”，配合專用的 MTT E300 模組，能夠高效處理本地感知與控制任務。通過與云端夸娥集群的聯動，“長江”實現了“端云一體”的算力架構，為未來數十億臺智能機器人提供了從感知到決策的完整國產算力底座。

（來源：直播截圖）

為了賦能廣大學生與開發者，摩爾線程推出了一款全新形態的硬件產品 MTT AI Book。這不僅是一臺筆記本，更是全球首款搭載“長江”芯片的便攜式“算力本”。它打破了系統壁壘，原生支持 Windows 虛擬機、Android 容器、國產操作系統，用戶可以在不同環境間自由切換。MTT AI Book 預裝了包括 PyTorch、Docker 在內的全套 AI 開發工具鏈，并內置了本地大模型推理環境，真正實現了開箱即用的 AI 開發體驗，讓每一位開發者都能隨時隨地構建自己的智能體。

在個人與家庭算力領域，摩爾線程帶來了一款極具未來感的創新產品 MTT AI Cube。這不僅僅是一個外形靈巧的小型工作站，更被張建中定義為用戶的“個人數據中心”。

針對現代家庭中海量數據分散在手機、電腦等不同設備、難以管理和檢索的痛點，MTT AI Cube 提供了一個智能化的解決方案。它能夠連接電視或大屏使用，充當家庭的數據中樞。不同于傳統的存儲設備，AI Cube 最大的亮點在于內置了數字人交互能力。用戶無需再進行繁瑣的文件檢索，只需通過自然語言對話——例如“幫我找一下去年春節爺爺奶奶的視頻”，數字人就能充當家庭管家，快速完成數據的查詢、總結與規劃。此外，摩爾線程還宣布開放 AI Cube 平臺，征集全球開發者共同打造豐富的 AI 應用，試圖將其構建為一個功能無限延展的家庭智能中樞。

為了加速國產全功能 GPU 的落地與應用，在開發者大會上，摩爾線程也展示了與多領域領軍企業的深度合作，共同構建從底層算力到上層應用的完整生態。

在大模型與 AI 推理領域，摩爾線程展現了極強的適配能力。通過與硅基流動的深度合作，利用 S5000 服務器成功優化了 DeepSeek V3/R1 等開源大模型的推理性能，實現了極致的單卡吞吐體驗；同時，聯合北京智源人工智能研究院在軟件棧上支持 FlagOS 及 Triton 框架，并將多模態世界模型 Emu3.5 內置于 MTT AI Book 中，為端側開發者提供強大的本地文生圖與視覺理解能力。

在前沿科技探索上，摩爾線程正推動經典計算與未來技術的融合。在量子計算領域，攜手玻色量子與圖靈量子打造異構計算平臺，加速量子原生 AI 模型及量子模擬算法，解決模型生成與糾錯難題。在通信領域，則聯合中關村泛聯院探索“AI for 6G”，利用 MTT S5000 賦能 6G 網絡的智能化加速，推動算力與通信算法的深度融合。

在具身智能與行業落地方面，全功能 GPU 的價值進一步釋放。摩爾線程聯合 51Sim 推出面向智能駕駛的下一代物理 AI 仿真引擎，利用 3DGS/4DGS 重建技術加速世界模型生成，支持大規模自動駕駛仿真訓練；光輪智能利用全棧資源仿真與國產 GPU 算力，在資產構建、數據生產和評測環節實現全流程國產化，將世界模型訓練周期從數月縮短至數周。

此外，MTT S3000 顯卡已在移動云上線服務企業級云桌面，而聯合國內晶圓大廠推出的 MoreLitho 解決方案，更是利用 GPU 顯著加速了計算光刻過程。

（來源：直播截圖）

在人才生態建設上，張建中在大會上宣布啟動“摩爾學院”項目，并立下了培育百萬級 MUSA 生態開發者的宏愿。目前，摩爾學院已在北京、上海、杭州、成都建立了四大培訓基地，并與清華大學、北京大學、浙江大學等 200 多所頂尖高校達成深度合作，惠及學生超過 10 萬人。

過去 5 年，摩爾線程跑出了驚人的“摩爾速度”。本次開發者大會不僅展示了“花港”架構與“華山”、“廬山”芯片的硬核實力，更向外界傳遞了一個清晰的信號：中國科技的自立自強，正在從可用走向好用。

正如張建中在演講最后所言：“我們將持續為美好世界加速。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.