无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

老黃喝豆汁「破防」背后,國產GPU正在填上CUDA護城河

0
分享至


新智元報道


【新智元導讀】老黃在北京喝豆汁「翻車」,全網笑瘋了。但真正值得警惕的,是他背后那個正在長出來的「中國版CUDA生態」。從萬卡集群到機器狗,從SGLang主線到AI Agent自動遷移,這家公司這次不只是秀芯片,而是在重寫國產GPU的游戲規則!

這幾天,老黃喝豆汁的表情包,已經在全網刷屏了。


他穿著黑色皮衣,端著炸醬面,站在方磚廠69號門口邊拌邊吃。

有人遞過來一碗豆汁,他喝了一大口,眉頭瞬間擰成一團,周圍一片哄笑。

但他這次來北京,顯然不只是來吃面的。

老黃自己說過一句話,「不要低估中國的實力和競爭力,那是愚蠢的。」

5月18日晚,炸醬面熱搜還沒涼,摩爾線程在北京開了年度產品發布會。

但所有這些硬件背后,有一條貫穿全場的主線——MUSA生態。

CUDA最硬的地方,是開發者的肌肉記憶

CUDA統治AI算力十五年,靠的不是芯片快,靠的是生態鎖定。

幾百萬開發者的代碼、習慣、工具鏈,甚至手指敲鍵盤的肌肉記憶,都長在CUDA上面。

換平臺?重寫代碼、重學工具、重新踩坑。硬件采購只是一張訂單,工程遷移是一場組織動員。

你能造出神兵利器,但很難改變幾百萬人的生活習慣——這才是卡脖子卡得最見血的地方。

所以國產GPU的競爭,到了今天,已經從「硬件替代」推進到「生態替代」。

硬件替代解決的是有沒有卡,生態替代解決的是開發者愿不愿意來、模型能不能跑、行業敢不敢規模化采購。

如今,MUSA已經實現了芯片架構、指令集、編程模型、軟件運行庫、驅動框架和上層應用工具鏈的全面覆蓋。


從云端萬卡集群到個人算力本再到邊緣SoC模組,跑的都是同一套MUSA。大模型訓練、推理服務、智能體、機器人仿真,全部長在這同一個底座上。

這意味著他們賣的不是某一顆芯片、某一張卡,而是一整套國產全功能GPU的底層生態。

四級躍遷,MUSA開始從兼容走向自進化

具體來說,MUSA生態的進展可以拆成四個臺階。

兼容,原生,開放,自進化。

每往上一層,MUSA的角色就發生一次變化。

前兩層解決遷移和性能,第三層解決開發者入口,第四層開始改變生態建設的成本結構。

第一層是兼容:先把開發者的舊代碼吃下來

國產GPU應用最大的障礙之一,是遷移成本。

開發者已經習慣CUDA、PyTorch、cuDNN、Triton、vLLM、SGLang這一整套工具鏈。如果換一張卡就要重寫工程、重新調試、重新踩坑,再漂亮的硬件指標也很難變成采購決策。

MUSA SDK 5.1.0直接對標CUDA 12.8,驅動及運行時API兼容數干到761個。

核心數學庫Blas、Sparse、Rand、FFT,100%功能兼容。

AI算子庫muDNN覆蓋55類核心AI算子,額外擴展230多個。

PyTorch全量3194個算子,100%兼容,不是「大部分能湊合跑」,是全量。

絕大多數CUDA程序不改一行代碼,直接在摩爾線程的卡上跑通。開發者憑肌肉記憶寫出來的代碼,MUSA全吃下了。

遷移成本越低,試用意愿越強。原有代碼越能復用,組織內部推進國產算力,出錯的風險和投入的成本都會大大降低。

第二層是原生:光能跑還不夠,關鍵路徑必須跑得快

兼容解決的是「能不能遷」,原生性能解決的是「遷過來值不值」。如果關鍵路徑上性能拉胯,客戶最后還是會把你放在備用方案的位置。

MATE加速庫直接對著大模型最吃算力的幾個算子開刀。FlashAttention3、Sage Attention、DSA、GDN、DeepGEMM,全是硬骨頭。

FA3在摩爾線程GPU上效率飆到95%,熱點算子覆蓋率突破90%,Attention類算子全場景覆蓋。

大模型訓推的瓶頸從來不在「所有功能都支持」,而在Attention、GEMM、MoE通信、KV Cache這幾條高頻路徑上。這幾條路卡住,整套系統就被拖住。FA3到95%,意味著MUSA在最要命的環節上跟CUDA的差距已經是個位數。

此外,MUSA還新增了Fortran編譯器,VASP等科學計算軟件可以直接遷移。


TileLang-MUSA已經合入開源主線,GEMM類算子實現95%以上的匯編級性能效率,Attention類算子達到90%以上。

Triton-MUSA升級支持到Triton 3.6最新版本。

這些工具看起來離普通讀者很遠,但它們決定了硬核開發者愿不愿意在這個平臺上寫底層算子。

客戶不會為情懷長期付費,只會為效率、穩定性和確定性付費。MUSA如果能在關鍵路徑上持續接近原生效率,它的身份就會從「兼容層」變成「高性能開發平臺」。

第三層是開放:進主線,才算真正上桌

整場發布會里,這一層的戰略分量可能最重。

全球頂級推理引擎SGLang,已經將MUSA合入官方主線,并列入2026 Q2官方硬件支持矩陣,和GB200/GB300、AMD、TPU并列。

截至5月12日,摩爾線程在SGLang上提交47個PR,合并41個。

在vLLM那邊,MUSA同樣拿到官方后端身份。TileLang-MUSA也已經合入開源主線。


開發者在使用時,直接調用的就是框架。

框架支持誰,代碼就能跑在誰的卡上。框架不支持,芯片再猛也是孤島。

現在代碼進入SGLang和vLLM主線,開發者在官方文檔里就能看到MUSA后端。后續新模型、新工具、新推理策略的適配成本,會明顯下降。

模型適配層也是同一個邏輯。

摩爾線程MTT S5000目前已完成DeepSeek V4、GLM-5.1、Qwen3.5、MiniMax M2.7、Kimi K2.6等大語言模型的深度適配。視覺理解和多模態模型也覆蓋了Qwen3-VL-235B/8B和Wan 2.2。

重點在于Day-0。模型發布當天,MUSA算力就已經就位。

在大模型一個月一迭代的今天,客戶關心的不只是某個歷史模型能不能跑,而是下一個熱門模型出來時,自己的算力底座能不能及時變成可用服務。

Day-0適配能力,本質上是在爭奪模型時代的時間窗口。

更深一層看,中國最頭部的大模型和國產算力底座同步就位,意味著從算法到硬件的完整鏈路正在變厚。

這條內循環一旦跑起來,每一次模型迭代都會給生態添一層土,而不是把已有系統再沖散一次。

第四層是自進化:讓Agent替生態搬磚

前三層講的都是「MUSA能做什么」。這一層講的是「MUSA怎么越滾越快」。

如果生態建設一直靠工程師手工適配,摩爾線程永遠會被全球開源社區的版本節奏推著跑。CUDA的護城河本質上是十五年的時間積累,手工追趕注定辛苦,而且很難越追越輕松。

要擊穿這道時間壁壘,得改變積累速度本身。

MUSACODE是摩爾線程給出來的答案。自研AI編程工具,自然語言直接生成MUSA代碼,覆蓋Python、C++、Rust、Go,代碼完全本地運行。

30天,自動生成并測試PP庫12015個算子。基于TileLang自動調優Group GEMM算子實現60%性能提升。


Automusify Skill則是一個零人工干預的AI Agent,它的任務就是全自動代碼搬家。Top 100人工智能加速庫、Top 100科學計算加速庫,100%自動平移到MUSA上。

過去建生態靠刀耕火種,工程師熬夜一行行手寫適配。現在直接跨入工業革命,AI Agent、編譯器、自動測試、在線倉庫串成流水線,別人每多發布一個框架、一個庫、一個模型,MUSA就能更快完成遷移和優化。

這才是真正改變游戲規則的地方。生態建設不再是人海戰術,而是一臺自帶加速度的飛輪。

MUSA服務AI,AI反向加速MUSA。飛輪一旦轉起來,十幾年的時間差可以被壓到一個完全不同的量級。


從萬卡集群到機器狗

發布會后半段,MUSA開始見真章。

云端,夸娥萬卡集群商業化落地,Dense模型MFU干到60%,MoE達到40%,有效訓練時長超過90%。


根據官方介紹,S5000集群訓出來的模型精度能跟國際先進水平對齊,大模型公司不用再擔心國產集群訓練質量。


一段兩分鐘的AI短片「地球最后一朵算力花朵」在大屏幕上播出來,用Wan模型跑在夸娥上,一個人短時間搞定,臺上說以前這是好萊塢導演花大價錢才能拍的東西。

端側,AICUBE把智能體、AI PC和AI NAS塞進一個巴掌大的鋁合金立方體,6月18日京東預售。


AIBOOK預裝OpenClaw,可以同時跑12個智能體。

現場,研究員直接拉起5個數字員工,幾分鐘就交出了一整套新品企劃。

用 摩爾線程創始人、董事長兼CEO張建中 的話說就是,「任何一個年輕人創業,有一臺AIBOOK就可以開一人公司。」

壓軸的是一只叫「小飛」的機器狗,只見它一個干拔,做了個側空翻,然后穩穩落地,紋絲不動。

別小看這個跟斗——它背后藏著MUSA在具身智能場景里真正的殺手锏。

具身智能跟大模型訓推不一樣。

它需要物理仿真、圖形渲染、AI推理、端側部署同時跑。傳統方案把這些任務扔給不同硬件,數據反復搬運,延遲拉滿。

摩爾線程的全功能GPU在MT Lambda仿真平臺里,把物理引擎AlphaCore、光子引擎MT Photon、3DGS渲染和Torch-MUSA放在同一套鏈路里。

「物理+渲染+AI」三大引擎同一顆芯片,數據零拷貝。



今年3月摩爾線程開源了MuJoCo Warp MUSA,首個國產GPU加速的物理仿真后端。

和智源研究院合作的RoboBrain 2.5端到端訓練,結果跟H100集群誤差小于0.62%。機器狗訓練任務中,MT Lambda比CPU方案快40倍。

小飛身上跑的運動策略,在Lambda平臺訓好后,零調參直接下發到「長江」SoC執行。

所有這些,不管是拍短片、開一人公司,還是訓模型或機器狗,雖然跑在不同規模的硬件上,但用的是同一條技術脊柱。


當生態開始自我加固

一套從底到頂跑通了的生態,和一堆零散的兼容能力,是完全不同的東西。

前者會產生網絡效應。開發者越多,生態越厚;用得越久,遷回去的成本也越高。口子一旦撕開,就合不上了。


從100%兼容到SGLang官方合入,從Day-0模型適配到Agent自動搬家,從全功能GPU三引擎合一到機器狗零調參落地,摩爾線程這場發布會展示的是從軟件棧、開發者生態到物理世界應用的全鏈路貫通。

更關鍵的是,這套生態跑通全鏈路,依托的還是當前第四代「平湖」架構。

去年12月,摩爾線程已經發布第五代「花港」架構,算力密度再升50%,能效提升10倍,支持FP4到FP64全精度,可撐起十萬卡互聯。基于花港的AI芯片「華山」,在有序推進中。

換句話說,MUSA生態打通全鏈路時,還沒用上摩爾線程最強的那張牌。

方磚廠69號店門口,現在掛著「皮衣戰神同款套餐」的招牌。

但CUDA同款生態的招牌,已經不再是唯一選擇。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
出戰17分鐘正負值+25!尼克斯逆轉最大功臣,230萬年薪真的太值了

出戰17分鐘正負值+25!尼克斯逆轉最大功臣,230萬年薪真的太值了

籃球圈里的那些事
2026-05-20 14:04:31
瓜帥:若主帥提前宣布離隊,那在困難時刻球員就不聽你的了

瓜帥:若主帥提前宣布離隊,那在困難時刻球員就不聽你的了

懂球帝
2026-05-20 06:25:33
騎士被22分逆轉卻開心大笑!讓哈登為輸球背鍋,他才是罪魁禍首

騎士被22分逆轉卻開心大笑!讓哈登為輸球背鍋,他才是罪魁禍首

你的籃球頻道
2026-05-20 11:40:20
調查發現:老年人若經常吃香蕉,用不了多久,身體或迎來3大改變

調查發現:老年人若經常吃香蕉,用不了多久,身體或迎來3大改變

芹姐說生活
2026-05-15 15:06:08
郭鳳蓮感嘆:要是按照陳永貴書記的設想繼續發展,大寨會走向何處

郭鳳蓮感嘆:要是按照陳永貴書記的設想繼續發展,大寨會走向何處

混沌錄
2026-05-19 19:45:59
上海交大樊思睿火了:為幾千塊毀掉前程,也許她缺的從來不是錢

上海交大樊思睿火了:為幾千塊毀掉前程,也許她缺的從來不是錢

十為先生
2026-05-19 16:02:50
老板娘問我這些姿勢夠用不?我該怎么回答?

老板娘問我這些姿勢夠用不?我該怎么回答?

太急張三瘋
2026-05-20 12:08:29
26歲!曝申請交易!有望重磅聯手愛德華茲

26歲!曝申請交易!有望重磅聯手愛德華茲

籃球實戰寶典
2026-05-19 17:41:56
炸裂!捐精有多亂,雙方直接在賓館完成懷孕過程,一次八百到幾萬

炸裂!捐精有多亂,雙方直接在賓館完成懷孕過程,一次八百到幾萬

天天熱點見聞
2026-05-18 08:07:40
神舟二十三號女航天員曝光,香港女警司首飛,要太空住一年

神舟二十三號女航天員曝光,香港女警司首飛,要太空住一年

至死不渝的愛情
2026-05-20 11:09:56
突發!基德與獨行俠分道揚鑣引全網炸鍋,稱別讓弗拉格打控衛了

突發!基德與獨行俠分道揚鑣引全網炸鍋,稱別讓弗拉格打控衛了

仰臥撐FTUer
2026-05-20 09:23:08
螞蟻吃完孩子的零食當場暴斃,最可怕的不是那幾只螞蟻,而是……

螞蟻吃完孩子的零食當場暴斃,最可怕的不是那幾只螞蟻,而是……

浪子說
2026-05-20 10:27:02
人不會平白無故患糖尿病!醫生強調:得糖尿病,多半有4個通病

人不會平白無故患糖尿病!醫生強調:得糖尿病,多半有4個通病

醫學原創故事會
2026-05-18 22:54:16
1991年,趙本山為娶馬麗娟與葛淑珍離婚,如今葛淑珍過得還好嗎?

1991年,趙本山為娶馬麗娟與葛淑珍離婚,如今葛淑珍過得還好嗎?

飄飄然的娛樂匯
2026-05-19 19:20:05
主角:胡三元出獄!原來,這才是花彩香至死不和張光榮離婚的真相

主角:胡三元出獄!原來,這才是花彩香至死不和張光榮離婚的真相

慢半拍sir
2026-05-19 21:06:01
那一腳,踹飛9萬塊還搭上終身禁入,巨嬰憑啥讓全體國人買單?

那一腳,踹飛9萬塊還搭上終身禁入,巨嬰憑啥讓全體國人買單?

糖逗在娛樂
2026-05-19 15:05:35
泰國放棄購買世界杯版權!國際足聯要價3.5億遠低于中國 仍嫌太貴

泰國放棄購買世界杯版權!國際足聯要價3.5億遠低于中國 仍嫌太貴

念洲
2026-05-20 10:15:50
扒扒《監獄來的媽媽》導演的丑陋言論和行徑

扒扒《監獄來的媽媽》導演的丑陋言論和行徑

陳意小可愛
2026-05-20 05:12:18
高市早苗邀請李在明去日本泡溫泉:帶你去個美麗的地方;網友:實在丟人!絕非一國首相該有的舉止

高市早苗邀請李在明去日本泡溫泉:帶你去個美麗的地方;網友:實在丟人!絕非一國首相該有的舉止

都市快報橙柿互動
2026-05-20 14:30:15
楊秀清的困境:身體不好,兒子太小,宗族沒人,打仗靠諸侯

楊秀清的困境:身體不好,兒子太小,宗族沒人,打仗靠諸侯

浩渺青史
2026-05-20 01:01:29
2026-05-20 14:59:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15259文章數 66877關注度
往期回顧 全部

科技要聞

一文看懂谷歌I/O2026:谷歌打響智能體大戰

頭條要聞

媒體:特朗普不希望"臺獨"倚仗美 馬科斯堪稱回應得快

頭條要聞

媒體:特朗普不希望"臺獨"倚仗美 馬科斯堪稱回應得快

體育要聞

不再美麗的阿森納,終于成為英超冠軍

娛樂要聞

舒淇大方承認:卸了妝就是50 歲的模樣

財經要聞

白酒榜|汾酒營收凈利雙增 口子窖"造富"

汽車要聞

煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

態度原創

旅游
游戲
親子
公開課
軍事航空

旅游要聞

念青唐古拉倒映,棕頭鷗斜飛,雪域納木錯解凍“開湖”

《虛空潛者 逃出深淵》Steam 愿望單突破 120,000 即將亮相 BitSummit

親子要聞

2026 買前必看:駝奶粉品牌的配料表怎么看才正規?一眼識破假駝奶

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普暫緩打擊伊朗 稱系應中東三國請求

無障礙瀏覽 進入關懷版