![]()
![]()
深圳市邁特芯科技有限公司亮相2026第十屆集微大會端側AI峰會,正式發布面向詞元循環經濟的3D-LPU技術路線圖,率先提出“低韜高詞元”端側推理新范式,以3D分布式TPU架構突破行業“功耗-算力-內存墻”三重瓶頸。
行業背景:推理需求十年萬倍,詞元循環經濟崛起
當前AI推理需求正在迎來爆發式增長,預計未來推理需求將是今天的10,000倍。整個行業正經歷支持詞元循環(詞元生成及詞元消費)的范式轉移——詞元不僅需要被高效生成,更需要在云、邊、端各層級被持續消費與閉環調度。
![]()
詞元循環經濟
然而,受限于云端的高延遲與數據隱私問題,真正支持智能體自主運行的本地終端算力始終是短板。邁特芯創始人、南科大教授余浩在本次峰會上指出:
「低韜(低延遲)、高詞元效率」的端側AI是詞元循環經濟的核心基礎設施,也是下一代AI生態的競爭制高點。
云·邊·端三層協同:構建詞元循環生態
圍繞多層級詞元生態,邁特芯正式公布云、邊、端三層協同布局:
![]()
多層級詞元生態協同
云端 OPC 級「詞元推理機」:支持700B超大規模模型,面向數據中心與行業旗艦應用;
邊側企業級「詞元推理卡」:面向70B模型,適配AI-NAS盒子、AI工作站等企業級場景;
端側家庭級「詞元推理芯」:針對7B模型,賦能AI手機、AI學習本、AI醫療本及具身終端。
三層架構打通了從數據中心到個人終端的算力鏈路,實現詞元的高效生成與持續流通,真正建立起可運轉的詞元循環經濟。
核心技術:3D-LPU 重構端側推理架構
針對端側大模型芯片(LPU)現有方案的三大痛點——“功耗-算力-成本”的不可能三角、內存墻瓶頸、場景適配矛盾——邁特芯發布基于3D-DRAM近存計算的3D分布式TPU(3D-LPU)技術路線,從架構層面提出根本性解決方案。
![]()
3D-LPU架構簡圖
關鍵技術突破
立方脈動計算(Cubic Systolic):相比Google Atomic Systolic,能效提升1.24倍,面積減少20%,動態功耗降低42%;
3D分布式IO直連:計算單元與內存垂直直通,帶寬高達600 GBps,帶寬利用率達80%(傳統2D NoC僅10–50%);
極低能耗傳輸:能效比從7.0–9.5 pJ/bit提升至0.8–1.5 pJ/bit,總功耗從33.6–45.6W降至3.8–7.2W,互連延遲從20–40ns縮短至5ns以內。
核心性能指標
平均功耗 ~5W | 帶寬 600 GBps | 帶寬利用率 ~80% | 推理速度 80–100 tokens/s | 詞元能效比領先競品10倍
技術路線圖:從驗證到量產四步跨越
依托全棧自研的核心優勢,邁特芯正加速推進“芯-端-云”一體化布局,通過以下四個關鍵節點,穩步實現從實驗室驗證到終端生態落地的四階段躍遷路徑:
2023年:完成TPU IP驗證,立方脈動架構全面超越標量脈動基準指標;
2024年:完成分布式LLM-TPU FPGA驗證(VCU128平臺),實現75 tokens/s推理、帶寬利用率75%,優于A100 GPU方案;
2025年:推進3D分布式LLM-TPU流片(MetaChip,全國產供應鏈),于2026年初正式流片;
2026年:推出LPU終端AIOS——MetaClaw(大麥機器人),正式進入規模化產品落地階段。
產品矩陣:從單芯到推理卡,覆蓋全場景
邁特芯基于3D-LPU技術路線推出覆蓋多算力層級的產品矩陣:
MC_mega_188(Base系列):3D DRAM 2.5GB,適配0.5B–3B模型,超低功耗,針對消費電子終端(AI手機、可穿戴);
MC_mega_288/488(Pro系列):3D DRAM 5GB/10GB,適配4B–9B模型,面向AI平板、AI-PC及具身智能終端;
4芯MC_mega_488(Pro+系列)推理卡:3D DRAM 40GB,支持27B/35B模型,針對AI-NAS盒子與邊緣計算場景;
8芯MC_mega_488(Pro Max系列)推理卡:3D DRAM 80GB,支持122B超大模型,面向行業級token工廠。
近期規劃產品中,35B-MOE推理卡(功耗約40W,算力約40 TOPS)可實現80 tokens/s,120B-MOE推理卡(功耗約80W,算力約80 TOPS)可實現40 tokens/s,均已完成Qwen、GLM、MiniCPM等主流開源大模型的適配驗證。
MetaClaw 大麥機器人:端側AI智能體落地標桿
邁特芯同步發布旗艦家庭AIOS方案MetaClaw(大麥機器人),以LPU為算力底座,構建軟硬一體化的端側智能體生態:
南向生態:深度兼容千問Qwen、面壁MiniCPM、谷歌Gemma等主流大模型;
北向應用:自研數十種Skill技能包,通過飛書、QQ、釘釘等分身實現遠程調度與本地執行;
MetaBook 本地知識庫:支持PDF/Word/PPT/視頻等多格式本地知識管理,個人數據全程不出設備;
多蝦協同:單Agent到多Agent協作,實現「觀察-決策-執行」全自治閉環;
具身智能:聯動IoT與四足機器人(龍蝦狗)、機械臂(龍蝦臂),將AI算力延伸至物理世界。
MetaClaw 正式落地「龍蝦終端」產品生態,涵蓋龍蝦盒子、龍蝦平板、AI-NAS、AI學習本、AI醫療本及具身機器人等多條產品線,形成完整的家庭AI生態閉環。
市場前景:千億賽道,國產替代加速
2025年被業界公認為「端側AI元年」。據測算,全球端側AI市場將從2025年的3219億元增長至2029年的1.2萬億元,復合年增長率高達39.6%。預計到2028年,全球GenAI智能手機、AI PC及可穿戴設備出貨量將達40億臺。
在國產替代浪潮下,邁特芯3D-LPU全國產供應鏈的路線具有天然戰略優勢。公司已與國內頭部大廠在終端、數通、具身等領域展開聯合業務開發,并與麒麟軟件、全志科技等合作伙伴構建產業生態聯盟。公司將持續以自主研發的低功耗大模型推理芯片(LPU)為核心,推動 AI 算力從云端走向本地,賦能智能終端從“感知”向“決策-執行”閉環進化。
2026年底目標:樣片量產 | 2027年:大規模規模化落地 | 持續迭代 14nm/7nm 工藝,詞元能效比持續提升
關于邁特芯
深圳市邁特芯科技有限公司于2023年在深圳成立,專注于端側大模型AI協處理器芯片研發。公司以「讓每個設備成為懂你的個人智能體」為愿景,致力于成為全球端側大模型芯片領軍企業。
公司由國家特聘專家、萬人領軍人才、3DIC國際最佳論文獲得者余浩教授領銜,核心團隊匯聚國家領軍人才、吳文俊人工智能獎得主,以及來自華為、中興、大疆、微軟等行業大廠的資深專家,具備豐富的芯片量產及產業化落地經驗。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.