網易首頁 > 網易號 > 正文申請入駐

近10億融資落地！墨芯加速稀疏計算商業化閉環，年底發新一代加速卡

2026-05-28 14:11:20　來源: 智東西

北京舉報

分享至

智東西
作者程茜
編輯漠影

智東西5月28日報道，今日，國產AI芯片創企墨芯人工智能宣布近日正式完成近10億元C輪融資，這也是國產AI芯片企業最新一筆重磅融資。

本輪融資陣容多元，匯集了頭部國資創投機構深創投，以及巖山科技、大灣區共同家園、力鼎資本、蘊盛資本等產業資本與市場化機構，老股東凱旋創投、創享投資、盛景嘉成等多家機構持續跟投。

與此同時，墨芯還官宣新產品落地進展，今年年底其全新一代高性能AI通用推理卡SparsePrime將發布。

作為國內少數走差異化稀疏計算路線的創企，墨芯已經亮出多款基于自研稀疏計算芯片的AI計算卡，構建起“技術自研深耕+客戶場景落地”雙輪驅動模式。

在硬件性能側，墨芯AI加速卡在全球主流AI評測集MLPerf中兩度奪冠，墨芯S30、S40單卡以及多卡集群的算力表現，均超過英偉達A100、H100。

在商業化落地方面，墨芯已經在云端、邊緣端、算力網絡側拿下不少商業化訂單，并在全國多區域的千卡集群完成部署。

AI算力熱潮持續升溫，資本集中涌入國產AI芯片初創企業，面對國產替代、商業化落地提速的行業趨勢，墨芯已率先構建起成熟的商業化閉環體系。

在這一關鍵節點，智東西和墨芯董秘兼企業發展及資本市場部總經理王率宇、墨芯商業化副總裁尚勇進行了深入交流，試圖找到墨芯在國產差異化算力賽道突圍的背后秘籍。

一、頂級多元資方入局，新一代計算卡年底落地

算力時代紅利加速釋放，資本持續涌入國產AI芯片賽道，行業IPO節奏不斷加快。身處這一浪潮之中，墨芯在資本與產品兩端同步提速。

當下AI應用加速落地，行業算力需求結構已發生根本性轉變。據多家行業機構測算，當前國內推理算力需求已攀升至訓練算力的10～15倍，推理賽道成為算力競爭新主戰場。與此同時，作為數字經濟核心底座的算力網絡建設也全面提速。

瞄準當下的算力紅利與增量市場，墨芯的戰略布局已然明確。

王率宇透露，墨芯新一輪資金將全力投向新一代AI推理計算卡以及算力網絡部署。

一方面，墨芯將于年內推出全新一代SparsePrime計算卡。該產品定位智算中心、數據中心場景，是一款高性能AI通用推理卡，依托其自研Antoum2.0芯片架構打造，深度適配大模型及各類復雜推理任務。

墨芯新一輪資金將貫穿新一代計算卡的產品研發、量產到市場落地全環節，為后續拓展市場提供充足的資金儲備。

SparsePrime是墨芯交出的最新答卷，面對當下大模型的部署需求，其適用主流Transformer模型，支持客戶零接受成本、快速獲得稀疏加速，同時，開發者能基于PyTorch、TensorFlow的模型代碼，以及高效的vLLM等推理框架，近乎零代碼修改完成遷移并直接部署運行，并支持開發者使用Triton語言進行自定義算子開發降低使用門檻。

另一方面，墨芯已在西北、西南、華東、華北四大片區的數據中心實現部署，在多個行業場景和領域實現規模化應用。未來1～2年內，墨芯完成覆蓋國內東、中、西全域更為廣泛的算力網絡布局。

此次融資與新一代計算卡即將落地，是墨芯階段性成果的集中體現。

與此同時，墨芯也在構建稀疏化生態、加強產學研合作、打造開發者社區等，為其產品擴展鋪路。

云端基模、垂類客戶、算力網絡三管齊下的布局，墨芯穩居算力賽道核心位置。

二、AI加速卡性能超主流GPU，已跑通真實場景驗證、落地閉環

放眼整個行業，AI算力體系正加速分化迭代。未來AI芯片的核心比拼，不再是算力、功耗的簡單疊加，算力利用率才是真正的核心壁壘。

作為通過底層技術創新發力國產AI芯片突圍的代表玩家，墨芯自研的雙稀疏計算技術，已打破算力瓶頸，打造出高算力、低功耗、高性價比的算力解決方案。

稀疏計算的原理可以類比人腦，人在處理不同任務時，會激活大腦皮層的相應區域，無需調用整個神經網絡，類比到芯片上，就是在不同的任務上進行稀疏激活。簡單來說，稀疏計算就是通過底層創新、軟硬協同設計，讓神經網絡模型消減冗余，以提高計算效率。

墨芯的差異化壁壘在于，其不是在算法層面簡單剪枝，而是從軟硬協同的角度，將稀疏計算融入芯片計算核中，使其性能達到最優。

這使得墨芯AI加速卡的性能已經超過主流GPU。墨芯AI加速卡在全球權威AI測評MLPerf中連續三次奪冠，其S40在特定場景下峰值吞吐量性能相對A100有2.9倍的性能提升，相對H100也有1.4 倍的領先，單卡性能領先。多卡算力表現中，4卡S30比4卡H100高出1.8倍，甚至比8卡A100集群性能高出1.2倍。

如今，墨芯從芯片、計算卡到行業解決方案已實現全鏈條自研，這也成為其給客戶帶來差異化價值的根基。

然而，技術攻關只是第一步，更難的是深入場景。尚勇提到，墨芯走的這條路不是純技術難題，還需要在各類業務場景中反復驗證、試錯，因此其本質是復雜的工程落地難題。

他舉了一個例子，去年墨芯參與的算力集群項目中，其客戶是非AI領域的制造業企業，企業的核心關注點很直接——在有限預算內拿到能效比較優的算力解決方案。墨芯研究人員通過分析其集群打造的整體解決方案，相對市面上的方案能降低30%～50%的成本，且能滿足該企業的細分場景需求。

這樣的技術深耕與場景打磨，才能讓算力的價值被充分釋放出來。

尚勇將墨芯的策略重點概括為“兩條腿并行”，技術端，依靠獨家稀疏計算架構突破算力瓶頸，大幅提升算力利用效率與硬件密度；市場端，聚焦AI推理黃金賽道，依托推理業務與產業應用場景的強關聯性，協同客戶完成芯片定制化落地、規模化商用，實現技術與場景的深度綁定。

如今的墨芯，已形成S4-S40等的梯度化算力布局，能滿足從傳統小模型到小尺寸大模型，再到超大規模模型迭代的算力需求，其今年推出的新產品就是為下一個3年甚至5年的超大規模模型潛在算力需求而打造。

由此可以看出，真正能夠重構算力成本、突破性能上限的，應是建立在底層架構級計算范式革新之上的。

三、瞄準AI降本剛需，墨芯已拿下多領域商業化訂單

隨著AI產業從技術嘗鮮走向產業普及，降本、增效、適配、盈利成為檢驗AI芯片價值的重要標準，而與這一趨勢一脈相承的墨芯，已經具備可規模化、可盈利、可復制的商業化落地能力。

拆解來看，增效已經從墨芯計算卡在主流測試中兩次奪冠體現出來。降本方面，當下的重點便聚焦于單token使用成本。

國家數據局的數據顯示，今年3月底我國日均Token調用量突破140萬億，和2024年初的日均調用量相比增長超千倍。面對龐大的調用需求，稀疏計算可在保障模型精度不變的前提下精簡計算線程。落地到實際業務場景中，墨芯解決方案的單token運行成本遠低于主流GPU產品，在部分特定場景更有優勢。

基于此，王率宇透露，墨芯已經在云端、邊緣端及算力網絡側拿下不少商業化訂單，并預期明后年能實現盈虧平衡。

墨芯的快速成長，本質是契合了AI產業的核心變革趨勢，在行業變化與不變中堅守稀疏計算核心路線，搶占萬億級市場紅利。

一方面，墨芯堅持不變的稀疏計算技術價值正在釋放。AI應用落地的必要條件是邊際成本逐漸下降，而這與墨芯計算路線不謀而合，他們堅持的正是通過技術創新不斷降低應用成本，沒有盲目追逐其他的領先技術。

另一方面，AI產業的發展瞬息萬變，墨芯就需要加速產品形態迭代，打造通用化產品體系兼容各類客戶、各類場景的差異化需求。當下各類模型層出不窮，沒有一家企業能精準預測其發展趨勢，因此，在尚勇看來，墨芯就是始終以客戶為出發點，保證產品在設計階段就能滿足其需求。

放眼到整個AI領域，模型廠商的商業化模型基本成型，降本成為全行業剛需，再加上GPU霸權逐步松動，國內多路徑AI芯片迎來商業化爆發期，墨芯所處賽道的紅利正持續釋放。

結語：AI推理需求爆發，稀疏計算乘風而起

AI推理市場正迎來爆發風口。去年9月，英偉達創始人、CEO黃仁勛在接受外媒采訪時直言，AI推理的增長，不是100倍、1000倍，而是100億倍。

瞄準這一行業大勢，墨芯布局的稀疏計算技術具有先天優勢。該技術天然適配推理場景的增效、降本需求，再加上墨芯以此為核心構建了軟硬協同、場景驗證、生態完善的差異化壁壘。

可以確認的是，伴隨推理需求井噴，稀疏計算賽道也正式迎來爆發窗口期。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.