4月24日,DeepSeek-V4預(yù)覽版正式發(fā)布。DeepSeek自V3起便以高頻迭代著稱,V4的到來(lái)只是節(jié)奏延續(xù)。
但真正引發(fā)行業(yè)震動(dòng)的是:華為昇騰、寒武紀(jì)、海光信息、摩爾線程、沐曦股份、百度昆侖芯、阿里平頭哥、天數(shù)智芯等八家國(guó)產(chǎn)AI芯片廠商,在模型發(fā)布的同一天,集體完成了全鏈路適配與性能優(yōu)化。
![]()
(圖源:DeepSeek)
![]()
Day 0 意味著什么
Day 0適配,是指在大模型正式發(fā)布當(dāng)天,算力側(cè)已完成全鏈路兼容驗(yàn)證、性能調(diào)優(yōu)與穩(wěn)定性測(cè)試,開(kāi)發(fā)者開(kāi)箱即用,無(wú)需等待適配窗口。這個(gè)概念之所以稀缺,是因?yàn)樗淼牟皇悄骋粋€(gè)技術(shù)環(huán)節(jié)的突破,而是整個(gè)軟硬件協(xié)同體系的成熟度驗(yàn)證,拗口芯片微架構(gòu)、固件層、驅(qū)動(dòng)、編譯器、推理框架、算子優(yōu)化等,每一層都必須提前完成對(duì)接,任何一個(gè)環(huán)節(jié)存在短板,Day 0都不可能實(shí)現(xiàn)。
放眼全球,真正掌握這一能力的,唯有英偉達(dá)。憑借CUDA生態(tài)和cuDNN、TensorRT等完善的底層庫(kù),英偉達(dá)與大模型發(fā)布方之間形成了高度默契的協(xié)同節(jié)奏。模型上線之日,也是GPU最優(yōu)路徑打通之時(shí)。對(duì)開(kāi)發(fā)者而言,這意味著零摩擦的部署體驗(yàn),是英偉達(dá)生態(tài)最具粘性的護(hù)城河之一。
DeepSeek-V4發(fā)布的這一天,這一局面被打破了。
![]()
八家廠商Day 0適配
在這批Day 0適配名單中,華為昇騰的覆蓋范圍廣、技術(shù)縱深較深。昇騰A2、A3、950全系列同步完成適配,Pro與Flash兩個(gè)版本均獲支持。技術(shù)路徑上,昇騰通過(guò)融合kernel與多流并行技術(shù)針對(duì)性優(yōu)化Attention計(jì)算的訪存開(kāi)銷,結(jié)合多種量化算法實(shí)現(xiàn)高吞吐、低時(shí)延的推理部署。昇騰超節(jié)點(diǎn)同步釋出了訓(xùn)練參考實(shí)現(xiàn),適配不只覆蓋推理,還延伸到了模型微調(diào)環(huán)節(jié),覆蓋了從部署到訓(xùn)練的全流程。
![]()
寒武紀(jì)的適配策略則呈現(xiàn)出另一種姿態(tài):基于vLLM推理框架完成適配后,寒武紀(jì)將適配代碼開(kāi)源至GitHub社區(qū),供開(kāi)發(fā)者自由取用。
海光信息的打法強(qiáng)調(diào)“閉環(huán)”。海光DCU完成Day 0適配的同時(shí),對(duì)模型進(jìn)行了深度調(diào)優(yōu),形成“模型發(fā)布—芯片適配—產(chǎn)業(yè)落地”的完整鏈條。海光強(qiáng)調(diào)了“即取即用的部署方案”,面向的是有實(shí)際落地需求的行業(yè)用戶,而非技術(shù)驗(yàn)證場(chǎng)景。
摩爾線程基于旗艦級(jí)AI訓(xùn)推一體智算卡MTT S5000與FlagOS全棧軟件體系完成推理適配。
沐曦股份采取了雙線并進(jìn)的適配策略:一方面攜手智源研究院的FlagOS開(kāi)源軟件棧,實(shí)現(xiàn)了在沐曦GPU上的全量適配與推理部署;另一方面聯(lián)合上海人工智能實(shí)驗(yàn)室的KernelSwift智能算子遷移系統(tǒng)。
昆侖芯已在發(fā)布當(dāng)天完成了模型兼容性驗(yàn)證與部署鏈路打通,開(kāi)發(fā)者可以在昆侖芯平臺(tái)上開(kāi)箱使用DeepSeek-V4-Flash模型。
平頭哥憑借FlagGems全算子替代、獨(dú)立張量并行策略以及FP4到BF16精度路徑轉(zhuǎn)換等三項(xiàng)關(guān)鍵技術(shù)突破,真武AI芯片在模型發(fā)布當(dāng)日即完成了對(duì)DeepSeek-V4-Flash的推理部署,實(shí)現(xiàn)了國(guó)產(chǎn)芯片與頂尖開(kāi)源大模型的同步適配。
天數(shù)智芯AI芯片已完成DeepSeek-V4-Flash模型的全量算子適配與推理部署驗(yàn)證。
這八家廠商構(gòu)成了我國(guó)AI芯片產(chǎn)業(yè)的一次集體亮相。從通用算力到專用推理,從自主研發(fā)到開(kāi)源生態(tài),這張適配圖譜的完整性,本身就是一種有力的行業(yè)表達(dá)。
值得注意的是,這一批Day 0適配的實(shí)現(xiàn),背后有一個(gè)關(guān)鍵平臺(tái)——北京智源人工智能研究院研發(fā)的FlagOS開(kāi)源軟件棧。正是FlagOS提前完成了對(duì)DeepSeek-V4的算子兼容、張量并行策略和混合精度轉(zhuǎn)換,才使得這些國(guó)產(chǎn)芯片能夠在同一天完成全量適配與推理部署。
![]()
DeepSeek做對(duì)了什么
如果只看芯片廠商的行動(dòng),很容易忽略一個(gè)關(guān)鍵變量:為什么是DeepSeek,而不是其他模型公司?
答案藏在DeepSeek的戰(zhàn)略選擇里。
從V3開(kāi)始,DeepSeek就選擇了主動(dòng)適配多家國(guó)產(chǎn)芯片,而非讓各家廠商被動(dòng)跟進(jìn)。這種“中立適配”的姿態(tài),在商業(yè)邏輯上并不顯而易見(jiàn),它在模型發(fā)布前便與各芯片廠商建立協(xié)同機(jī)制,開(kāi)放底層接口,提供性能基準(zhǔn),讓芯片廠商有足夠的時(shí)間窗口完成準(zhǔn)備工作。
這不是單方面的技術(shù)服務(wù),而是模型公司與芯片廠商之間的雙向選擇。DeepSeek需要算力多元化來(lái)對(duì)沖單點(diǎn)風(fēng)險(xiǎn),芯片廠商需要DeepSeek的高頻迭代來(lái)吸引開(kāi)發(fā)者。兩者在戰(zhàn)略層面形成了相互依存的關(guān)系。
對(duì)于芯片廠商而言,DeepSeek的開(kāi)源屬性提供了標(biāo)準(zhǔn)化的基準(zhǔn)。以往各家芯片廠商適配不同的開(kāi)源模型,工作量大且難以復(fù)用。DeepSeek的統(tǒng)一架構(gòu)讓適配經(jīng)驗(yàn)可以在不同場(chǎng)景中遷移,降低了每代模型迭代的軟件工程成本。換句話說(shuō),DeepSeek既是適配目標(biāo),也是適配標(biāo)準(zhǔn)。
這也是Day 0能夠批量發(fā)生的根本原因:不是某一家芯片廠商突然變強(qiáng)了,而是模型層給了整個(gè)產(chǎn)業(yè)一個(gè)可以共同站立的臺(tái)階。
![]()
真正的競(jìng)爭(zhēng)才剛開(kāi)始
Day 0是起點(diǎn),不是終點(diǎn)。
適配完成意味著“能用”,但“好用”取決于后續(xù)的性能優(yōu)化深度、工具鏈豐富度與開(kāi)發(fā)者社區(qū)活躍度。英偉達(dá)的護(hù)城河從來(lái)不只是硬件性能,而是CUDA生態(tài)積累下來(lái)的數(shù)十年工程經(jīng)驗(yàn)與開(kāi)發(fā)者習(xí)慣。
從已披露的技術(shù)路徑來(lái)看,各家芯片廠商正在形成差異化的競(jìng)爭(zhēng)方向:昇騰強(qiáng)調(diào)高吞吐與低時(shí)延的極致性能,寒武紀(jì)走開(kāi)源社區(qū)共建的開(kāi)放路線,海光側(cè)重軟硬件深度協(xié)同的端到端體驗(yàn),摩爾線程押注全棧自主的軟件棧。這種分化說(shuō)明,Day 0之后,芯片廠商之間的競(jìng)爭(zhēng)正在從硬件指標(biāo)的比拼,轉(zhuǎn)向軟件生態(tài)完整度的較量。
![]()
此外,如果DeepSeek保持高頻迭代,芯片廠商能否持續(xù)跟進(jìn)?Day 0代表著提前布局,也是持續(xù)的工程投入。這場(chǎng)比拼,更像是一場(chǎng)曠日持久的馬拉松。
但無(wú)論如何,4月24日這一天,已經(jīng)在國(guó)產(chǎn)AI芯片的發(fā)展史上留下了一個(gè)注腳。這不是某一家廠商的突破,也不是一次偶發(fā)的協(xié)同,這是中國(guó)AI芯片產(chǎn)業(yè)鏈第一次在發(fā)布端實(shí)現(xiàn)如此規(guī)模的共振。
本文資料源自公開(kāi)信息,不構(gòu)成任何投資建議,如有任何問(wèn)題,敬請(qǐng)讀者與我們聯(lián)系(微信號(hào):global360iot01)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.