現(xiàn)如今的國(guó)產(chǎn)科技正在瘋狂的崛起,但想真正的崛起,絕不是一家手機(jī)廠商可以做到的,而是大家聯(lián)合起來(lái)一起發(fā)力。
比如近期有消息稱(chēng)DeepSeek V4優(yōu)先適配華為芯片,并放棄英偉達(dá),這對(duì)于科技市場(chǎng)來(lái)說(shuō),真的是非常少見(jiàn)。
因?yàn)槿缃袢虼竽P凸具€在為搶購(gòu)英偉達(dá)H100焦頭爛額,然而DeepSeek卻將完全運(yùn)行在華為昇騰芯片上。
所以從這個(gè)角度來(lái)說(shuō),意味著國(guó)產(chǎn)科技正在崛起的過(guò)程中,那么讓我們長(zhǎng)話(huà)短說(shuō),一起來(lái)聊一聊具體的信息吧。
![]()
據(jù)《The Information》等多家外媒報(bào)道,DeepSeek新一代大語(yǔ)言模型V4,已基于包括華為在內(nèi)的最新國(guó)產(chǎn)AI芯片完成深度優(yōu)化。
而且為確保V4在國(guó)產(chǎn)硬件上高效運(yùn)行,DeepSeek過(guò)去數(shù)月與華為及寒武紀(jì)密切合作,對(duì)模型底層程序進(jìn)行了調(diào)整與重寫(xiě),并同步開(kāi)展測(cè)試驗(yàn)證。
最為關(guān)鍵的是,DeepSeek此次未向美國(guó)AI芯片供應(yīng)商開(kāi)放測(cè)試,而是將國(guó)產(chǎn)芯片廠商置于優(yōu)先位置。
不僅如此,DeepSeek還同步開(kāi)發(fā)了兩款針對(duì)不同應(yīng)用場(chǎng)景優(yōu)化的V4衍生版本,同樣基于中國(guó)芯片設(shè)計(jì)。
![]()
與此同時(shí),為應(yīng)對(duì)基于V4的云服務(wù)上線需求,阿里巴巴、字節(jié)跳動(dòng)和騰訊等科技巨頭已提前下單華為新一代AI芯片,訂單規(guī)模達(dá)數(shù)十萬(wàn)顆。
這意味著,中國(guó)AI大模型正在逐步擺脫對(duì)英偉達(dá)CUDA生態(tài)的依賴(lài),開(kāi)啟全棧國(guó)產(chǎn)化的新階段,自然是非常好的消息。
而為什么是華為芯片,筆者覺(jué)得昇騰950系列芯片的實(shí)力是非常夠用的,并且將分階段推出版本和大家見(jiàn)面。
其中昇騰950PR芯片已率先在2026年第一季度發(fā)布,該芯片采用華為自研的高帶寬內(nèi)存,主要面向推理Prefill階段和推薦業(yè)務(wù)場(chǎng)景。
![]()
而昇騰950DT芯片則計(jì)劃于2026年第四季度推出,更注重推理Decode階段和訓(xùn)練場(chǎng)景,兩款芯片的微架構(gòu)將升級(jí)為SIMD/SIMT,算力分別達(dá)到1PFLOPS和2PFLOPS。
關(guān)鍵在2026年3月的華為中國(guó)合作伙伴大會(huì)上,搭載昇騰950PR處理器的AI訓(xùn)練推理加速卡Atlas 350已正式發(fā)布,并進(jìn)入商用階段。
據(jù)華為官方介紹,Atlas 350單卡FP4精度算力達(dá)1.56P,帶寬達(dá)1.4TB/s,F(xiàn)P4算力為英偉達(dá)H20的2.87倍,HBM容量112GB(為H20的1.16倍),多模態(tài)生成速度提升60%。
此外,Atlas 350是目前國(guó)內(nèi)唯一支持FP4低精度的推理產(chǎn)品,且昇騰950PR芯片還支持FP32、FP16、BF16、FP8、MXFP8、FP4等多種數(shù)據(jù)格式,互聯(lián)帶寬2TB/s,內(nèi)存容量128GB、帶寬1.6TB/s。
![]()
不過(guò)華為副董事長(zhǎng)徐直軍此前曾公開(kāi)表示,由于美國(guó)制裁,華為無(wú)法到臺(tái)積電投片,單顆芯片的算力相比英偉達(dá)存在差距。
但華為在超節(jié)點(diǎn)互聯(lián)技術(shù)上實(shí)現(xiàn)突破,能夠做到萬(wàn)卡級(jí)的超節(jié)點(diǎn)集群,通過(guò)計(jì)算、互聯(lián)和生態(tài)的協(xié)同優(yōu)化,昇騰正逐步縮小與國(guó)際頂尖水平的差距。
再加上IDC此前發(fā)布的報(bào)告顯示2025年中國(guó)AI加速服務(wù)器市場(chǎng)中,本土芯片廠商的市占率已攀升至約41%,其中以華為占據(jù)國(guó)產(chǎn)芯片總出貨量近半。
所以隨著昇騰950系列芯片的推出,華為在國(guó)產(chǎn)AI芯片市場(chǎng)的領(lǐng)先地位將進(jìn)一步鞏固,或許這也是DeepSeek V4進(jìn)行采用的原因之一。
![]()
另外據(jù)路透社報(bào)道,DeepSeek未向英偉達(dá)開(kāi)放V4的性能優(yōu)化測(cè)試,僅向華為等國(guó)內(nèi)芯片廠商提供了模型早期訪問(wèn)權(quán)限。
而且最終適配效果超預(yù)期,V4在昇騰芯片上推理速度提升35倍,能耗降低40%,完全滿(mǎn)足商用標(biāo)準(zhǔn),結(jié)合政務(wù)、金融等領(lǐng)域已開(kāi)啟大規(guī)模測(cè)試,標(biāo)志著國(guó)產(chǎn)AI算力具備大規(guī)模商用能力。
這一決策引發(fā)市場(chǎng)連鎖反應(yīng),阿里、字節(jié)、騰訊已提前下單數(shù)十萬(wàn)顆華為昇騰950PR芯片,推動(dòng)該芯片價(jià)格近幾周上漲20%,本月已啟動(dòng)大規(guī)模量產(chǎn)。
同時(shí)科大訊飛等國(guó)內(nèi)廠商也宣布將新一代大模型與昇騰算力深度適配,據(jù)悉V4預(yù)計(jì)4月發(fā)布,其全棧國(guó)產(chǎn)方案已震撼全球AI界。
![]()
總之,DeepSeek V4放棄英偉達(dá)、優(yōu)先適配華為芯片,標(biāo)志著中國(guó)AI大模型開(kāi)始真正擺脫對(duì)國(guó)外算力的依賴(lài)。
所以大家對(duì)此有什么想表達(dá)的嗎?歡迎回復(fù)討論。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.