網易首頁 > 網易號 > 正文 申請入駐

第一時間,寒武紀原生適配DeepSeek-V4!兩大國產之光再次強強聯合

0
分享至



機器之心發布

今天上午,AI 圈心心念念的國產大模型之光 —— DeepSeek-V4 終于上線了!

第一時間,寒武紀基于 vLLM 推理框架完成了對此次 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 兩個版本的 Day 0 適配,適配代碼已開源到 GitHub 社區



連同去年 DeepSeek-V3.2 的發布,寒武紀連續兩次都是第一時間發布適配的國產芯片。雙方的緊密合作,得益于寒武紀長期積累的自研 NeuWare 軟件生態與芯片設計技術,也是寒武紀對芯片與算法聯合創新持續投入的延續。DeepSeek-V4 原生運行在寒武紀芯片上,這對中國人工智能產業具有里程碑意義。此前寒武紀對 DeepSeek 系列模型開展深入的軟硬件協同性能優化,并達到了業界領先的算力利用率水平。



GitHub 項目地址:https://github.com/Cambricon/vllm-mlu?sessionid=

本次適配從 “快速模型遷移” 與 “極致性能優化”兩個維度,充分展現了寒武紀的核心技術實力。

快速完成 DeepSeek-V4 新模型適配,實現 Day 0 首發

在軟件生態層面,寒武紀 NeuWare 軟件棧全面擁抱開源社區,原生支持 PyTorch、vLLM、Diffusers 等主流 AI 框架,新模型可快速遷移至寒武紀平臺;

在國產軟件生態層面,寒武紀與眾智 FlagOS 生態持續深度合作,解耦模型與不同架構芯片之間的生態壁壘,進一步降低模型適配遷移成本;

在算子開發層面,寒武紀充分利用 Triton 良好的社區兼容性和易用性進行快速算子開發適配,進一步縮短功能適配周期;

在 AI 協同層面,寒武紀研發了代碼生成智能體 CNAgent,實現算子生成、模型遷移的全流程加速;

在硬件層面,寒武紀芯片原生支持主流低精度數據格式,無需額外轉換即可快速完成功能適配與精度驗證。通過軟硬件協同,寒武紀在模型發布當日即可實現穩定運行,真正做到 Day 0 適配

極致性能優化,釋放 DeepSeek-V4 推理潛能

針對 DeepSeek-V4 的新結構,寒武紀通過自研高性能融合算子庫 Torch-MLU-Ops,對 Compressor、mHC 等模塊進行專項加速;利用 BangC 高性能編程語言,編寫稀疏 / 壓縮 Attention、GroupGemm 等熱點算子的極致優化 Kernel,充分釋放硬件底層性能。

在推理框架優化層面,寒武紀在 vLLM 中全面支持 TP/PP/SP/DP/EP 5D 混合并行、通信計算并行、低精度量化以及 PD 分離部署等優化技術,通過策略優化,在滿足延時約束下達到最佳的詞元吞吐能力,顯著提升端到端推理效率。

硬件特性同樣被深度挖掘:利用 MLU 訪存與排序加速能力,有效加速稀疏 Attention、Indexer 等結構;高互聯帶寬與低通信延時,將 Prefill 和 Decode 兩種不同工作負載場景下的通信占比降至最低,最大化分布式推理的利用率。

正是這種軟硬件一體化的設計思路,使得寒武紀能夠在大模型部署中持續降低算力成本,提升性能上限。寒武紀將繼續深耕大模型軟硬件協同生態,為開發者與客戶提供更快、更省、更高效的大模型部署方案。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

三毛看世界
2026-04-17 16:43:17
澤連斯基威脅歐盟,再不讓加入歐盟,就把烏克蘭變成格魯吉亞

澤連斯基威脅歐盟,再不讓加入歐盟,就把烏克蘭變成格魯吉亞

霽寒飄雪
2026-04-24 14:51:52
60~75歲老人,除不爬高外,這八件事也沒做,你就是一位寶藏老人

60~75歲老人,除不爬高外,這八件事也沒做,你就是一位寶藏老人

暖風吹過竹林
2026-04-24 09:22:48
年內最牛新股!688808,最高漲超950%,中一簽賺近39萬

年內最牛新股!688808,最高漲超950%,中一簽賺近39萬

數據寶
2026-04-24 10:53:13
嘴唇是“心梗”的放大鏡?提醒:嘴唇有這5種變化,建議及時就醫

嘴唇是“心梗”的放大鏡?提醒:嘴唇有這5種變化,建議及時就醫

芹姐說生活
2026-04-23 19:14:31
西方專家驚呼:中國正在回到明朝,可怕的“朝貢體系”正在歸來!

西方專家驚呼:中國正在回到明朝,可怕的“朝貢體系”正在歸來!

牛馬搞笑
2026-04-23 11:06:00
平頂山一金店被搬空只剩架子,多人在店鋪寄存黃金,老板失聯疑似跑路,當地:警方已立案

平頂山一金店被搬空只剩架子,多人在店鋪寄存黃金,老板失聯疑似跑路,當地:警方已立案

極目新聞
2026-04-24 16:09:26
太慘了!燃油車再迎大降價:最大跌幅50%,豪華車帶頭“跳水”

太慘了!燃油車再迎大降價:最大跌幅50%,豪華車帶頭“跳水”

混沌錄
2026-04-23 16:50:14
8歲路易王子生日照:王室流量密碼的精準投放

8歲路易王子生日照:王室流量密碼的精準投放

熱搜摘要官
2026-04-24 08:08:53
“乒壇魔王”轉投哈薩克斯坦,張繼科回擊:祖國尊嚴高于一切!

“乒壇魔王”轉投哈薩克斯坦,張繼科回擊:祖國尊嚴高于一切!

林子說事
2026-04-23 16:57:05
馬來西亞向法國、土耳其和韓國下了軍火大單,采購多款導彈

馬來西亞向法國、土耳其和韓國下了軍火大單,采購多款導彈

無月可歸辛
2026-04-24 11:50:05
導彈直逼上海?中方忍無可忍,打出禁空令,覆蓋范圍超臺灣兩倍

導彈直逼上海?中方忍無可忍,打出禁空令,覆蓋范圍超臺灣兩倍

小楊侃事
2026-04-23 14:17:02
破例接機!中方強勢降臨中東,伊朗導彈下餃子,美霸權迎來終局?

破例接機!中方強勢降臨中東,伊朗導彈下餃子,美霸權迎來終局?

未來展望
2026-04-23 18:24:29
特斯拉老兵挖礦,自動駕駛卡車下周進場

特斯拉老兵挖礦,自動駕駛卡車下周進場

像素與芯片
2026-04-23 15:12:23
時刻緊盯著解放軍的美軍印太司令,突然發現了一個非常要命的問題

時刻緊盯著解放軍的美軍印太司令,突然發現了一個非常要命的問題

墨印齋
2026-04-24 16:16:36
女生長的太漂亮是什么體驗?網友:母以子貴,父以女榮

女生長的太漂亮是什么體驗?網友:母以子貴,父以女榮

另子維愛讀史
2026-03-10 22:56:08
僅24歲!美女謝垚:心梗去世,經常跑半馬,父親帶女兒照片看海!

僅24歲!美女謝垚:心梗去世,經常跑半馬,父親帶女兒照片看海!

川渝視覺
2026-04-24 12:48:24
首次!日本導彈將對艦艇開火!中國:歷史會以相似的邏輯重現!

首次!日本導彈將對艦艇開火!中國:歷史會以相似的邏輯重現!

小莜讀史
2026-04-23 17:15:02
剛剛,全線跳水!美軍,動手了!

剛剛,全線跳水!美軍,動手了!

中國基金報
2026-04-23 14:34:47
賴清德無法竄訪,盧秀燕表態后,日本也發聲了,非常不簡單

賴清德無法竄訪,盧秀燕表態后,日本也發聲了,非常不簡單

DS北風
2026-04-24 11:32:03
2026-04-24 16:59:01
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12847文章數 142635關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

男子拍下蔣介石故居對面別墅區兩廁所 兩年來無法使用

頭條要聞

男子拍下蔣介石故居對面別墅區兩廁所 兩年來無法使用

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

健康
教育
時尚
游戲
家居

干細胞如何讓燒燙傷皮膚"再生"?

教育要聞

讓孩子們多參與社會實踐,懂得勞作辛苦

水晶專場 || 一眼就淪陷的絕美水晶,百元級的快樂

PS6掌機全新爆料!索尼第一方工作室已同步信息

家居要聞

自然肌理 溫潤美學

無障礙瀏覽 進入關懷版