你我都知道,在AI的趨勢(shì)下,所有芯片都在瘋狂漲價(jià)。在AI狂野發(fā)展的過程中,無疑有著巨大的算力缺口,英偉達(dá)也成了當(dāng)下最賺錢的公司。不過,隨著地緣政治摩擦日益加重,很多人關(guān)注AI芯片的發(fā)展。
數(shù)據(jù)顯示,我國(guó)AI芯片,將在2028年進(jìn)入萬億市場(chǎng)規(guī)模時(shí)代,約占全球市場(chǎng)的30%。可以說,面對(duì)旺盛的市場(chǎng)需求,提供自主可控的高質(zhì)量AI算力,已成為我國(guó)搶占AI發(fā)展先機(jī)、賦能千行百業(yè)轉(zhuǎn)型升級(jí)的重要基礎(chǔ)。
近期,多家國(guó)產(chǎn)廠商接連宣布AI芯片的消息,我國(guó)AI芯片正在以驚人的速度高速發(fā)展。
![]()
阿里:自研芯片亮相
早前,央視《新聞聯(lián)播》中就曾預(yù)告,阿里即將自研PPU芯片,不過,很長(zhǎng)時(shí)間以來,這款芯片都很神秘。
1月29日上午,平頭哥官網(wǎng)悄然上線一款名為“真武810E”的高端AI芯片,這是通義實(shí)驗(yàn)室、阿里云和平頭哥組成的阿里巴巴AI黃金三角“通云哥”首次浮出水面。
“真武”PPU采用全棧自研架構(gòu),配備96G HBM2e內(nèi)存及700 GB/s片間互聯(lián)帶寬,適用于AI訓(xùn)練、推理及自動(dòng)駕駛。目前,該芯片已大規(guī)模用于千問大模型的訓(xùn)練與推理,并通過阿里云AI軟件棧深度優(yōu)化,為客戶提供一體化服務(wù)。
“真武”PPU已在阿里云實(shí)現(xiàn)多個(gè)萬卡集群部署,服務(wù)了國(guó)家電網(wǎng)、中科院、小鵬汽車、新浪微博等400多家客戶。
![]()
據(jù)業(yè)內(nèi)分析,“真武”PPU整體性能超越英偉達(dá)A800及主流國(guó)產(chǎn)GPU,與英偉達(dá)H20相當(dāng)。市場(chǎng)反饋顯示,該芯片性能穩(wěn)定、性價(jià)比高,處于供不應(yīng)求狀態(tài)。
阿里自2009年起布局云服務(wù),2018年成立平頭哥,2019年啟動(dòng)大模型研究,歷經(jīng)17年垂直整合,現(xiàn)已形成覆蓋芯片、云平臺(tái)與大模型的“通云哥”全棧AI的完整布局。目前,阿里與谷歌是全球僅有的同時(shí)在大模型、云服務(wù)與芯片三大領(lǐng)域具備頂尖實(shí)力的科技公司。
當(dāng)然,阿里的未來也值得關(guān)注,據(jù)外媒最新報(bào)道,升級(jí)版“真武”PPU的性能強(qiáng)于英偉達(dá)A100。
![]()
奕行智能:首款RISC-V AI算力芯片
1月29日,國(guó)內(nèi)AI芯片創(chuàng)企奕行智能表示,其研發(fā)的國(guó)內(nèi)業(yè)界首款RISC-V AI算力芯片Epoch正在大規(guī)模量產(chǎn)出貨中。該芯片在業(yè)界率先采用RISC-V + RVV指令集架構(gòu),結(jié)合自研的VISA技術(shù),兼顧了AI計(jì)算的通用性與專用性。
奕行智能是類TPU的AI芯片。根據(jù)其分享,區(qū)別于單純追求CUDA兼容的傳統(tǒng)GPGPU路徑。隨著谷歌TPU等ASIC芯片在生態(tài)適配上的突破,以及英偉達(dá)在GPU中持續(xù)增強(qiáng)DSA特性,該方向正成為AI算力發(fā)展的重要趨勢(shì)。
從性能上來看,其在運(yùn)行ResNet-50、BERT、Llama 2等模型時(shí),Epoch性能較競(jìng)品高出25%~52%;在FlashAttention-3等關(guān)鍵算子中算力利用率優(yōu)勢(shì)明顯。
![]()
技術(shù)上,有三個(gè)關(guān)鍵點(diǎn):一是率先采用RISC-V + RVV指令集構(gòu)建AI芯片,保障通用計(jì)算能力的同時(shí),支持定制AI指令,契合張量計(jì)算與稀疏計(jì)算需求,借助RISC-V全球生態(tài),兼容主流編譯器與AI框架;二是VISA虛擬指令架構(gòu),在軟件與硬件間建立中間抽象層,隔離硬件迭代對(duì)上層軟件的影響,提升編譯效率,降低算子開發(fā)難度,兼顧計(jì)算的通用性與執(zhí)行效率;三是Tile級(jí)動(dòng)態(tài)調(diào)度架構(gòu),基于數(shù)據(jù)分塊(Tile)編程范式,提供更友好的編程界面,通過硬件調(diào)度與編譯器協(xié)同,實(shí)現(xiàn)動(dòng)態(tài)資源調(diào)度,充分挖掘并行潛力,提升算力利用率。
生態(tài)肯定會(huì)是走這樣一條路線必須考慮的問題。根據(jù)其分享,公司將持續(xù)完善軟件棧,兼容主流AI框架,并通過與開源社區(qū)合作,推動(dòng)RISC-V DSA生態(tài)建設(shè)。基于類TPU的能效優(yōu)勢(shì)與自主技術(shù)創(chuàng)新,奕行智能有望在AI算力競(jìng)爭(zhēng)中實(shí)現(xiàn)差異化突破。
![]()
![]()
天數(shù):公布四代AI芯片路線圖
1月26日,國(guó)產(chǎn)GPU企業(yè)天數(shù)智芯在合作伙伴大會(huì)上發(fā)布四代架構(gòu)路線圖,可以看出這家公司的野心很大。
路線圖顯示,其計(jì)劃在2025年推出的“天樞”架構(gòu)將超越英偉達(dá)Hopper;2026年的“天璇”架構(gòu)對(duì)標(biāo)Blackwell,同年的“天璣”架構(gòu)將實(shí)現(xiàn)超越;2027年的“天權(quán)”架構(gòu)目標(biāo)超越Rubin;2027年后將轉(zhuǎn)向突破性計(jì)算芯片設(shè)計(jì)。
![]()
天數(shù)智芯介紹了四代架構(gòu)的關(guān)鍵細(xì)節(jié):
天樞架構(gòu):支持從高精度科學(xué)計(jì)算到AI精度計(jì)算,在執(zhí)行注意力機(jī)制時(shí)算力有效利用率超過90%;
天璇架構(gòu):新增ixFP4精度支持;
天璣架構(gòu):實(shí)現(xiàn)全場(chǎng)景AI與加速計(jì)算覆蓋;
天權(quán)架構(gòu):融入更多精度支持與創(chuàng)新設(shè)計(jì)。
針對(duì)天樞架構(gòu),其通過三項(xiàng)核心技術(shù)創(chuàng)新顯著提升了效率:
TPC廣播機(jī)制:通過數(shù)據(jù)廣播減少重復(fù)訪存,等效提升帶寬并降低功耗;
多指令并行處理系統(tǒng):支持多類型指令并行處理,增強(qiáng)復(fù)雜任務(wù)處理能力;
動(dòng)態(tài)線程組調(diào)度系統(tǒng):通過動(dòng)態(tài)調(diào)度避免資源爭(zhēng)搶,提升計(jì)算資源利用率。
這些創(chuàng)新使天樞架構(gòu)的效率較行業(yè)平均水平提升60%,在DeepSeek V3場(chǎng)景中的平均性能比英偉達(dá)Hopper架構(gòu)高出約20%。
![]()
![]()
曦望:公布三年產(chǎn)品路線圖
曦望(Sunrise)這家公司可能你沒有聽說過,但商湯你一定聽說過,這家公司的前身便是商湯大芯片部門,2024年底分拆獨(dú)立運(yùn)營(yíng)。這家公司在1月28日,也公布了自己的產(chǎn)品路線。
根據(jù)其路線圖,國(guó)內(nèi)首款采用LPDDR6的GPGPU芯片的啟望S3今年上市,高性能推理GPU芯片啟望S4將于2027年上市,安全可控推理GPU芯片啟望S5將于2028年上市。
其前兩代產(chǎn)品,2018年研發(fā)的S1(視覺推理芯片)已實(shí)現(xiàn)IP授權(quán)予索尼、小米,2020年實(shí)現(xiàn)上萬片量產(chǎn);2021年流片的S2(高性能GPGPU)則在主流大模型推理性能上達(dá)到國(guó)際巨頭80%水平,軟件棧CUDA兼容性達(dá)95%。
![]()
啟望S3是本次發(fā)布的重點(diǎn),核心設(shè)計(jì)理念是追求真實(shí)業(yè)務(wù)場(chǎng)景下的單位token成本、能耗與穩(wěn)定性最優(yōu),而非單純追求峰值算力。相比上一代產(chǎn)品,單芯片推理性能提升5倍,單位token推理成本下降約90%。
技術(shù)亮點(diǎn)上,S3支持FP16至FP4多精度靈活切換,契合MoE、長(zhǎng)上下文等模型推理需求;國(guó)內(nèi)首款采用LPDDR6的GPGPU推理芯片,顯存帶寬、容量顯著提升;遵循大模型“算力訪存比”黃金原則,實(shí)現(xiàn)資源高效利用;采用先進(jìn)工藝節(jié)點(diǎn)與第三方高速接口IP。
圍繞S3,曦望推出寰望SC3超節(jié)點(diǎn)解決方案,面向千億/萬億參數(shù)模型的推理部署,支持單域256卡一級(jí)互聯(lián),適配大專家并行(EP)等復(fù)雜場(chǎng)景。在大EP部署下,吞吐率可提升20~25倍。采用全液冷設(shè)計(jì),支持模塊化快速部署。在同等算力下,可將系統(tǒng)整體交付成本從“億元級(jí)”降至“千萬元級(jí)”。
軟件兼容性上構(gòu)建了高度兼容CUDA的基礎(chǔ)軟件體系,支持驅(qū)動(dòng)、算子庫、通信庫等,已適配國(guó)內(nèi)外百余種主流大模型。推理云平臺(tái)上,通過與商湯、范式等伙伴合作,構(gòu)建以MaaS(模型即服務(wù))為核心的推理云平臺(tái)。
![]()
遂原:即將IPO
1月22日,上海AI芯片公司燧原科技的科創(chuàng)板IPO申請(qǐng)獲上交所受理。該公司成立于2018年3月,已自主研發(fā)并迭代了四代架構(gòu)、共五款云端AI芯片。
根據(jù)產(chǎn)品規(guī)劃,燧原科技計(jì)劃在2025年發(fā)布第四代AI推理卡及ESL32/64超節(jié)點(diǎn)集群,2027年推出第五代云端AI芯片及相關(guān)訓(xùn)推產(chǎn)品,并于2029年發(fā)布第六代系列芯片。目前,公司已構(gòu)建涵蓋AI芯片、加速卡及模組、智算系統(tǒng)與集群,以及AI計(jì)算軟件平臺(tái)的完整產(chǎn)品體系。
![]()
國(guó)產(chǎn)AI芯片大爆發(fā)
自美國(guó)實(shí)施AI芯片限制后,中國(guó)自主AI芯片產(chǎn)業(yè)加速發(fā)展。目前,國(guó)內(nèi)AI芯片主要分為GPU與非GPU兩大技術(shù)路線,近期均呈現(xiàn)快速發(fā)展態(tài)勢(shì)。
國(guó)內(nèi)GPU企業(yè)近期迎來上市熱潮,并依據(jù)團(tuán)隊(duì)背景形成不同派系:
NVIDIA系:代表企業(yè)有摩爾線程、天數(shù)智芯,這些企業(yè)創(chuàng)始人和核心人員都有NVIDIA基因,打法是優(yōu)先兼容CUDA生態(tài)切入市場(chǎng),再通過自研架構(gòu)不斷發(fā)展;
AMD系:代表企業(yè)有壁仞、沐曦,創(chuàng)始人和核心人員都有AMD基因,AMD作為英偉達(dá)挑戰(zhàn)者,一直以差異化為競(jìng)爭(zhēng)核心,這些流派玩家打法和AMD類似;
國(guó)家隊(duì):比如景嘉微創(chuàng)始人及核心團(tuán)隊(duì)均來自國(guó)防科技大學(xué),通過軍用圖形顯控起步穩(wěn)扎穩(wěn)打進(jìn)入信創(chuàng)市場(chǎng),并不斷拓展至AI計(jì)算領(lǐng)域,再比如海光、龍芯、兆芯研究集成GPU與CPU配合;
拆分系:商湯作為AI公司,2024年底也拆分獨(dú)立了曦望Sunrise公司,此前公司剛完成近10億元融資,主要圍繞自己AI產(chǎn)品進(jìn)行開發(fā)產(chǎn)品。
![]()
國(guó)產(chǎn)GPU不完全盤點(diǎn),制表丨EEWorld
非GPU路徑呈現(xiàn)多元化發(fā)展,不同企業(yè)選擇不同架構(gòu)以實(shí)現(xiàn)差異化競(jìng)爭(zhēng):
![]()
國(guó)產(chǎn)非GPU AI芯片不完全盤點(diǎn),制表丨EEWorld
當(dāng)前,國(guó)產(chǎn)AI芯片正通過 “兼容追趕” 與 “創(chuàng)新超越” 雙軌并行的策略快速發(fā)展:GPU路線直面生態(tài)挑戰(zhàn),通過資本市場(chǎng)支持持續(xù)投入,力圖在主流賽道上實(shí)現(xiàn)突破;非GPU路線(如CGRA、TPU、ASIC等)則通過架構(gòu)創(chuàng)新,在能效、成本或特定場(chǎng)景上建立優(yōu)勢(shì),開辟新賽道。
隨著AI芯片這條路線的入局玩家增加,國(guó)產(chǎn)AI芯片的市場(chǎng)更加熱鬧了。
參考文獻(xiàn)
[1]科技日?qǐng)?bào):https://mp.weixin.qq.com/s/F-yF3XgIe_KILUEIT75LtA
[2]科創(chuàng)板日?qǐng)?bào):https://mp.weixin.qq.com/s/hXcSpsydv5G6w3np7r5RVg
[3]奕行智能 EVAS:https://mp.weixin.qq.com/s/LH4n_dmVpA2IMZsplChfkw
[4]芯東西:https://mp.weixin.qq.com/s/ZejmS6pfo1LXRv_55sZFbA
[5]芯東西:https://mp.weixin.qq.com/s/ygzYSuWUesU5gLvOqyFv3w
請(qǐng)將我們?cè)O(shè)為“星標(biāo)”,這樣就會(huì)第一時(shí)間收到推送消息。
歡迎關(guān)注EEWorld旗下訂閱號(hào):“機(jī)器人開發(fā)圈”
掃碼添加小助手回復(fù)“機(jī)器人”
進(jìn)群和電子工程師們面對(duì)面交流經(jīng)驗(yàn)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.