![]()
智東西
作者 程茜
編輯 漠影
智東西5月28日報道,今日,國產AI芯片創企墨芯人工智能宣布近日正式完成近10億元C輪融資,這也是國產AI芯片企業最新一筆重磅融資。
本輪融資陣容多元,匯集了頭部國資創投機構深創投,以及巖山科技、大灣區共同家園、力鼎資本、蘊盛資本等產業資本與市場化機構,老股東凱旋創投、創享投資、盛景嘉成等多家機構持續跟投。
與此同時,墨芯還官宣新產品落地進展,今年年底其全新一代高性能AI通用推理卡SparsePrime將發布。
作為國內少數走差異化稀疏計算路線的創企,墨芯已經亮出多款基于自研稀疏計算芯片的AI計算卡,構建起“技術自研深耕+客戶場景落地”雙輪驅動模式。
在硬件性能側,墨芯AI加速卡在全球主流AI評測集MLPerf中兩度奪冠,墨芯S30、S40單卡以及多卡集群的算力表現,均超過英偉達A100、H100。
在商業化落地方面,墨芯已經在云端、邊緣端、算力網絡側拿下不少商業化訂單,并在全國多區域的千卡集群完成部署。
AI算力熱潮持續升溫,資本集中涌入國產AI芯片初創企業,面對國產替代、商業化落地提速的行業趨勢,墨芯已率先構建起成熟的商業化閉環體系。
在這一關鍵節點,智東西和墨芯董秘兼企業發展及資本市場部總經理王率宇、墨芯商業化副總裁尚勇進行了深入交流,試圖找到墨芯在國產差異化算力賽道突圍的背后秘籍。
一、頂級多元資方入局,新一代計算卡年底落地
算力時代紅利加速釋放,資本持續涌入國產AI芯片賽道,行業IPO節奏不斷加快。身處這一浪潮之中,墨芯在資本與產品兩端同步提速。
當下AI應用加速落地,行業算力需求結構已發生根本性轉變。據多家行業機構測算,當前國內推理算力需求已攀升至訓練算力的10~15倍,推理賽道成為算力競爭新主戰場。與此同時,作為數字經濟核心底座的算力網絡建設也全面提速。
瞄準當下的算力紅利與增量市場,墨芯的戰略布局已然明確。
王率宇透露,墨芯新一輪資金將全力投向新一代AI推理計算卡以及算力網絡部署。
一方面,墨芯將于年內推出全新一代SparsePrime計算卡。該產品定位智算中心、數據中心場景,是一款高性能AI通用推理卡,依托其自研Antoum2.0芯片架構打造,深度適配大模型及各類復雜推理任務。
墨芯新一輪資金將貫穿新一代計算卡的產品研發、量產到市場落地全環節,為后續拓展市場提供充足的資金儲備。
SparsePrime是墨芯交出的最新答卷,面對當下大模型的部署需求,其適用主流Transformer模型,支持客戶零接受成本、快速獲得稀疏加速,同時,開發者能基于PyTorch、TensorFlow的模型代碼,以及高效的vLLM等推理框架,近乎零代碼修改完成遷移并直接部署運行,并支持開發者使用Triton語言進行自定義算子開發降低使用門檻。
另一方面,墨芯已在西北、西南、華東、華北四大片區的數據中心實現部署,在多個行業場景和領域實現規模化應用。未來1~2年內,墨芯完成覆蓋國內東、中、西全域更為廣泛的算力網絡布局。
此次融資與新一代計算卡即將落地,是墨芯階段性成果的集中體現。
與此同時,墨芯也在構建稀疏化生態、加強產學研合作、打造開發者社區等,為其產品擴展鋪路。
云端基模、垂類客戶、算力網絡三管齊下的布局,墨芯穩居算力賽道核心位置。
二、AI加速卡性能超主流GPU,已跑通真實場景驗證、落地閉環
放眼整個行業,AI算力體系正加速分化迭代。未來AI芯片的核心比拼,不再是算力、功耗的簡單疊加,算力利用率才是真正的核心壁壘。
作為通過底層技術創新發力國產AI芯片突圍的代表玩家,墨芯自研的雙稀疏計算技術,已打破算力瓶頸,打造出高算力、低功耗、高性價比的算力解決方案。
稀疏計算的原理可以類比人腦,人在處理不同任務時,會激活大腦皮層的相應區域,無需調用整個神經網絡,類比到芯片上,就是在不同的任務上進行稀疏激活。簡單來說,稀疏計算就是通過底層創新、軟硬協同設計,讓神經網絡模型消減冗余,以提高計算效率。
墨芯的差異化壁壘在于,其不是在算法層面簡單剪枝,而是從軟硬協同的角度,將稀疏計算融入芯片計算核中,使其性能達到最優。
這使得墨芯AI加速卡的性能已經超過主流GPU。墨芯AI加速卡在全球權威AI測評MLPerf中連續三次奪冠,其S40在特定場景下峰值吞吐量性能相對A100有2.9倍的性能提升,相對H100也有1.4 倍的領先,單卡性能領先。多卡算力表現中,4卡S30比4卡H100高出1.8倍,甚至比8卡A100集群性能高出1.2倍。
![]()
如今,墨芯從芯片、計算卡到行業解決方案已實現全鏈條自研,這也成為其給客戶帶來差異化價值的根基。
然而,技術攻關只是第一步,更難的是深入場景。尚勇提到,墨芯走的這條路不是純技術難題,還需要在各類業務場景中反復驗證、試錯,因此其本質是復雜的工程落地難題。
他舉了一個例子,去年墨芯參與的算力集群項目中,其客戶是非AI領域的制造業企業,企業的核心關注點很直接——在有限預算內拿到能效比較優的算力解決方案。墨芯研究人員通過分析其集群打造的整體解決方案,相對市面上的方案能降低30%~50%的成本,且能滿足該企業的細分場景需求。
這樣的技術深耕與場景打磨,才能讓算力的價值被充分釋放出來。
尚勇將墨芯的策略重點概括為“兩條腿并行”,技術端,依靠獨家稀疏計算架構突破算力瓶頸,大幅提升算力利用效率與硬件密度;市場端,聚焦AI推理黃金賽道,依托推理業務與產業應用場景的強關聯性,協同客戶完成芯片定制化落地、規模化商用,實現技術與場景的深度綁定。
如今的墨芯,已形成S4-S40等的梯度化算力布局,能滿足從傳統小模型到小尺寸大模型,再到超大規模模型迭代的算力需求,其今年推出的新產品就是為下一個3年甚至5年的超大規模模型潛在算力需求而打造。
![]()
由此可以看出,真正能夠重構算力成本、突破性能上限的,應是建立在底層架構級計算范式革新之上的。
三、瞄準AI降本剛需,墨芯已拿下多領域商業化訂單
隨著AI產業從技術嘗鮮走向產業普及,降本、增效、適配、盈利成為檢驗AI芯片價值的重要標準,而與這一趨勢一脈相承的墨芯,已經具備可規模化、可盈利、可復制的商業化落地能力。
拆解來看,增效已經從墨芯計算卡在主流測試中兩次奪冠體現出來。降本方面,當下的重點便聚焦于單token使用成本。
國家數據局的數據顯示,今年3月底我國日均Token調用量突破140萬億,和2024年初的日均調用量相比增長超千倍。面對龐大的調用需求,稀疏計算可在保障模型精度不變的前提下精簡計算線程。落地到實際業務場景中,墨芯解決方案的單token運行成本遠低于主流GPU產品,在部分特定場景更有優勢。
基于此,王率宇透露,墨芯已經在云端、邊緣端及算力網絡側拿下不少商業化訂單,并預期明后年能實現盈虧平衡。
墨芯的快速成長,本質是契合了AI產業的核心變革趨勢,在行業變化與不變中堅守稀疏計算核心路線,搶占萬億級市場紅利。
一方面,墨芯堅持不變的稀疏計算技術價值正在釋放。AI應用落地的必要條件是邊際成本逐漸下降,而這與墨芯計算路線不謀而合,他們堅持的正是通過技術創新不斷降低應用成本,沒有盲目追逐其他的領先技術。
另一方面,AI產業的發展瞬息萬變,墨芯就需要加速產品形態迭代,打造通用化產品體系兼容各類客戶、各類場景的差異化需求。當下各類模型層出不窮,沒有一家企業能精準預測其發展趨勢,因此,在尚勇看來,墨芯就是始終以客戶為出發點,保證產品在設計階段就能滿足其需求。
放眼到整個AI領域,模型廠商的商業化模型基本成型,降本成為全行業剛需,再加上GPU霸權逐步松動,國內多路徑AI芯片迎來商業化爆發期,墨芯所處賽道的紅利正持續釋放。
結語:AI推理需求爆發,稀疏計算乘風而起
AI推理市場正迎來爆發風口。去年9月,英偉達創始人、CEO黃仁勛在接受外媒采訪時直言,AI推理的增長,不是100倍、1000倍,而是100億倍。
瞄準這一行業大勢,墨芯布局的稀疏計算技術具有先天優勢。該技術天然適配推理場景的增效、降本需求,再加上墨芯以此為核心構建了軟硬協同、場景驗證、生態完善的差異化壁壘。
可以確認的是,伴隨推理需求井噴,稀疏計算賽道也正式迎來爆發窗口期。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.