无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

摩爾線程MusaCoder正式開源:國產GPU賦能全棧訓練,核心性能超越主流SOTA代碼模型

0
分享至

近日,摩爾線程正式發布并開源面向GPU底層算子生成的專用代碼大模型MusaCoder。這是業內首個基于國產GPU算力底座完成全鏈路訓練與驗證的開源代碼大模型,其完整后訓練流程均在基于MTT S5000構建的夸娥智算集群上完成。在KernelBench嚴格評測中,MusaCoder-27B-RL以Overall Pass@8 93.2%、Avg.@8 88.60%的成績,超越Claude Opus 4.7、GLM-5.1、DeepSeek-V4 Pro、Kimi K2.6等主流SOTA代碼模型,展現出在GPU原生Kernel生成任務上的領先性能。

MusaCoder:專為GPU設計的高性能算子生成模型

MusaCoder是摩爾線程面向GPU底層算子生成任務設計的專用代碼大模型,包含9B和27B兩個參數規模。該模型重點支持從PyTorch標準算子自動生成高性能CUDA/MUSA原生Kernel代碼,旨在降低開發者手寫底層GPU算子的門檻,提升GPU高性能計算場景下的代碼生成、驗證和優化效率。

傳統代碼大模型雖然具備較強的通用編程能力,但在GPU Kernel生成任務中仍面臨顯著挑戰:一方面,GPU Kernel 對并行計算、線程組織、內存訪問、索引映射和硬件執行特性要求極高;另一方面,生成代碼不僅要語法正確,還必須能夠通過編譯、數值正確性驗證、反作弊檢測,并在真實執行中獲得性能收益。

針對上述難點,MusaCoder構建了一套面向GPU原生算子(CUDA/MUSA)生成的大模型全棧后訓練方法論。該流程覆蓋數據構建、執行驗證、強化學習優化等關鍵環節,使模型能夠從基礎代碼能力逐步進化為具備底層算子生成與修復能力的專用模型。

在數據構建階段,MusaCoder 通過結構化推理過程和顯式 Shape 信息注入,增強模型對張量形狀、內存布局和索引關系的理解,解決從通用代碼能力遷移到 GPU Kernel 生成任務時的冷啟動問題。

在評測與訓練環境方面,摩爾線程構建了 MooreEval 分布式執行驗證系統。MooreEval 能夠對模型生成的代碼進行自動編譯、執行、正確性驗證、性能測試和反作弊檢測,并將結果轉化為穩定的訓練反饋信號。這使得模型不僅能學習“寫出能運行的代碼”,還能夠進一步學習“寫出正確、合法且更高效的原生 GPU Kernel”。

在強化學習階段,MusaCoder針對GPU Kernel生成任務中的多輪修復、訓練穩定性和長尾困難樣本等問題,引入了PrimeEcho、MirrorPop和BDR等機制,用于提升模型在多輪調試場景下的修復能力和訓練穩定性。通過這些方法,MusaCoder打通了從基礎代碼微調到執行反饋強化學習的完整優化閉環。

核心成果:正確率與真實加速能力雙提升

在MooreEval執行式驗證協議下,MusaCoder-27B-RL在KernelBench評測中取得了顯著領先表現。

表1:KernelBench評估結果對比。Pass@8表示8個采樣代碼中至少有一個通過驗證,而Avg.@8則衡量8個樣本的平均正確率。

s高準確率超越SOTA:從正確率來看,MusaCoder-27B-RL的Overall Pass@8達到93.2%,Avg.@8達到88.60%,均超過Claude Opus 4.7的87.2%和77.30%。在更具挑戰性的Level 3任務上,MusaCoder-27B-RL的優勢更加明顯。Level 3任務通常涉及復雜shape推導、索引映射和多算子組合,對模型的底層代碼理解能力和調試能力提出了更高要求。在該難度級別上,MusaCoder-27B-RL的Pass@8和Avg.@8分別領先Claude Opus 4.7的18個百分點和26.5個百分點。

s真實加速能力突出:在MooreEval標準下,只有同時通過正確性驗證、合法性檢查,并且相比PyTorch baseline獲得有效加速的候選實現,才會被計入 Faster Rate。MusaCoder-27B-RL的Overall Faster Rate達到15.0%(vs. PyTorch Eager)和9.2%(vs. torch.compile),分別高于Claude Opus 4.7的 11.8%和7.5%。

這表明MusaCoder不僅能夠更穩定地生成正確的GPU Kernel,也更有能力生成具備實際性能收益的原生算子代碼。

國產GPU完成全流程后訓練,驗證夸娥智算集群能力

MusaCoder模型的SFT(監督微調)、RFT(拒絕采樣微調)、RL(強化學習)、異步rollout、在線編譯執行驗證及reward計算等全棧訓練與驗證流程,均依托摩爾線程旗艦級AI訓推一體智算卡MTT S5000所構建的夸娥智算集群完成。

這一成果,充分驗證了國產GPU不僅能夠支撐大模型推理和常規微調任務,更能夠穩定承載代碼大模型后訓練全周期算力需求。尤其是在GPU Kernel生成這一類任務中,訓練系統需要頻繁進行代碼生成、編譯、執行、驗證和反饋計算,對硬件、編譯棧、運行時、調度系統和評測基礎設施都提出了更高要求。

MusaCoder的成功實踐,將一次模型訓練驗證沉淀為可復用的工程范式:不僅為AI Coding、AI Infra等基礎設施的自主可控提供了實踐范例,也展現了摩爾線程在AI軟件棧、訓練平臺、評測系統和開源模型生態方面的完整工程支撐能力。

共建開放生態,推動國產AI創新與應用

MusaCoder的正式開源,旨在為MUSA生態提供面向PyTorch到原生算子生成的基礎模型能力,幫助開發者更高效地完成GPU Kernel 的生成、驗證、修復和優化,降低底層算子開發門檻。

同時,MusaCoder也為高校、科研機構和開源社區提供了一個基于國產全功能GPU的代碼生成研究平臺,推動異構計算編程、AI編譯優化和自動化Kernel生成等方向的開放研究與技術交流。

未來,摩爾線程將持續增強MusaCoder在復雜任務上的生成與修復能力,并進一步探索與IDE插件、自動調試工具、profiling工具等開發者工具鏈的結合,逐步形成從PyTorch參考實現到MUSA原生Kernel的自動生成、驗證、修復和優化閉環,持續推動國產GPU生態建設與AI基礎設施創新。

資料顯示,摩爾線程以全功能GPU為核心,致力于向全球提供加速計算的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的AI計算支持。我們的目標是成為具備國際競爭力的GPU領軍企業,為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
人倫之亂:正在悄悄撕裂萬千中國家庭的隱形黑洞

人倫之亂:正在悄悄撕裂萬千中國家庭的隱形黑洞

大熊歡樂坊
2026-06-09 18:01:35
正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

健康科普365
2026-05-09 21:05:04
震驚!四隊身價破10億歐,世界杯歷史首次!

震驚!四隊身價破10億歐,世界杯歷史首次!

球天下資訊
2026-06-10 23:42:37
每月美元到賬!巴特爾躺贏的背后,是NBA六成球星躲不開的斬殺

每月美元到賬!巴特爾躺贏的背后,是NBA六成球星躲不開的斬殺

法老不說教
2026-06-11 17:12:33
人的一生,要闖三關。第一關,送父母終老;第三關,守好自己的命

人的一生,要闖三關。第一關,送父母終老;第三關,守好自己的命

富書
2026-05-31 21:32:50
中國公開賽戰報:中國4勝5負!世界冠軍4-6爆冷一輪游,王信伯3-6

中國公開賽戰報:中國4勝5負!世界冠軍4-6爆冷一輪游,王信伯3-6

球場沒跑道
2026-06-11 08:23:53
76歲的萬科創始人王石,最近徹底成了全網焦點。

76歲的萬科創始人王石,最近徹底成了全網焦點。

夢錄的西方史話
2026-04-23 14:36:39
美預言家朱迪再爆猛料:美日中命運已定,此島將首遭災

美預言家朱迪再爆猛料:美日中命運已定,此島將首遭災

心靈短笛
2025-05-12 10:05:25
下半場全隊30分!文班:我們停止了傳球 停止了執行戰術

下半場全隊30分!文班:我們停止了傳球 停止了執行戰術

北青網-北京青年報
2026-06-11 19:51:03
文班談兩罰全丟:你可能為此苦練很久 但歸根結底那只是一次投籃

文班談兩罰全丟:你可能為此苦練很久 但歸根結底那只是一次投籃

北青網-北京青年報
2026-06-11 19:51:04
四川盆地陣雨、雷雨明天到

四川盆地陣雨、雷雨明天到

掌上金牛
2026-06-11 09:23:26
委內瑞拉換天五個月后才發現:百姓購買力爆發,國家回血速度加快

委內瑞拉換天五個月后才發現:百姓購買力爆發,國家回血速度加快

真的好愛你
2026-06-11 08:16:55
中國大門敲不開,日本盯上了韓國,李在明若敢點頭,就是死路一條

中國大門敲不開,日本盯上了韓國,李在明若敢點頭,就是死路一條

張學昆看世界
2026-06-11 19:07:34
特朗普宣布報復,5國武裝已參戰,伊朗多地遇襲,中方擔憂正成真

特朗普宣布報復,5國武裝已參戰,伊朗多地遇襲,中方擔憂正成真

面包夾知識
2026-06-11 20:11:52
突然!西安又一家物業凌晨撤場!業主憤怒!

突然!西安又一家物業凌晨撤場!業主憤怒!

木兮聊房
2026-06-11 18:29:50
安徽兩縣(區)黨委書記調整!兩地11名干部擬任新職

安徽兩縣(區)黨委書記調整!兩地11名干部擬任新職

鳳凰網安徽
2026-06-11 16:58:26
豐巢回應“取件得先看廣告”

豐巢回應“取件得先看廣告”

南方都市報
2026-06-11 09:35:31
英媒:曼聯引援思路轉變,更看重球員加盟意愿

英媒:曼聯引援思路轉變,更看重球員加盟意愿

懂球帝
2026-06-11 18:40:09
曝詹姆斯將向湖人索要頂薪!勇士難組四巨頭?或2年5000萬留隊

曝詹姆斯將向湖人索要頂薪!勇士難組四巨頭?或2年5000萬留隊

羅說NBA
2026-06-11 06:40:26
中俄反對也沒擋住,21國要求伊朗交代濃縮鈾下落

中俄反對也沒擋住,21國要求伊朗交代濃縮鈾下落

桂系007
2026-06-10 23:42:25
2026-06-11 21:23:00
讀創 incentive-icons
讀創
讀創系深圳報業集團主辦的權威財經新媒體,聚焦財經熱點,鏈接資本市場。
27936文章數 83關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

兩名男子因參與曼谷恐襲案在泰國被判死刑 外交部表態

頭條要聞

兩名男子因參與曼谷恐襲案在泰國被判死刑 外交部表態

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

奔馳C350L純電長軸距版申報信息曝光 雙電機 軸距超3米

態度原創

手機
教育
房產
公開課
軍事航空

手機要聞

vivo回應調色盤下放“殘血版”:相關優化預計7月底起陸續推送

教育要聞

現在最大的問題是:老師已經徹底管不住學生了,班主任也是如此!

房產要聞

科城·美林學筑5月領跑崖州灣:成交價、銷售套數、轉化率三項第一

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普召開戰情室會議討論對伊朗軍事行動

無障礙瀏覽 進入關懷版