![]()
5月14日,英偉達(dá)CEO黃仁勛在離開人民大會(huì)堂期間回應(yīng)記者的提問(wèn)時(shí),他豎起拇指,表示會(huì)談進(jìn)展順利。
5月14日晚間,英偉達(dá)大漲4%,再創(chuàng)歷史新高,截至發(fā)稿時(shí)市值已高達(dá)5.7萬(wàn)億美元。這與H200獲批進(jìn)入中國(guó)市場(chǎng)這則市場(chǎng)傳聞直接相關(guān)。
![]()
該新聞首先由路透獨(dú)家報(bào)道,“美方已批準(zhǔn)約10家中國(guó)公司購(gòu)買H200、單一客戶上限7.5萬(wàn)顆”。目前,包括觀察者網(wǎng)在內(nèi)的多家中國(guó)媒體亦對(duì)此全面跟進(jìn)。
截至目前,H200在中國(guó)市場(chǎng)尚未出現(xiàn)任何交付或銷售記錄。 但是,這并不等于獲批后仍然交付無(wú)望。更何況,自今年初開始,H200對(duì)華交易已經(jīng)出現(xiàn)過(guò)多次推進(jìn)信號(hào)。
更何況,自今年初開始,H200 對(duì)華交易已經(jīng)出現(xiàn)過(guò)多次推進(jìn)信號(hào),包括英偉達(dá)要求中國(guó)客戶以全額預(yù)付、不可取消、不予退款的嚴(yán)苛條款鎖定訂單。
本次H200 獲批發(fā)生在中美領(lǐng)導(dǎo)人會(huì)晤之后,雙方就經(jīng)貿(mào)、科技等領(lǐng)域達(dá)成多項(xiàng)共識(shí),釋放出 "穩(wěn)定預(yù)期、管控分歧" 的積極信號(hào)。在這一背景下,H200的討論已經(jīng)超出單純的進(jìn)出口范疇,它不僅關(guān)系到國(guó)內(nèi)云廠商的擴(kuò)容節(jié)奏、智算中心的上架計(jì)劃,更深刻影響著國(guó)產(chǎn)GPU的發(fā)展路徑與中美算力競(jìng)爭(zhēng)的格局。
深算派通過(guò)下表來(lái)簡(jiǎn)單梳理下H200的時(shí)間線。
![]()
01
H200的代際差
要準(zhǔn)確理解H200獲批的產(chǎn)業(yè)意義,首先需要厘清它在英偉達(dá)產(chǎn)品譜系中的位置。
H200并非英偉達(dá)最新一代架構(gòu)的芯片,而是Hopper架構(gòu)H系列的強(qiáng)化型號(hào),于2023年11月正式發(fā)布。其核心升級(jí)全部集中在顯存與帶寬兩個(gè)維度,這也是當(dāng)前大模型推理場(chǎng)景最核心的瓶頸。
根據(jù)英偉達(dá)官網(wǎng)公開數(shù)據(jù),H200搭載 141GB HBM3e顯存,顯存帶寬達(dá)到 4.8TB/s,較 H100 的 80GB HBM3 顯存和 3.35TB/s 帶寬,分別提升了 76% 和 43%NVIDIA。在計(jì)算性能方面,H200 與 H100 基本保持一致,F(xiàn)P8 算力為 4000 TFLOPS,F(xiàn)P16 算力為 2000 TFLOPS。這意味著 H200本質(zhì)上是 H100 的"顯存增強(qiáng)版",專門針對(duì)大模型推理和長(zhǎng)上下文任務(wù)進(jìn)行了優(yōu)化。
英偉達(dá)的GPU產(chǎn)品迭代遵循"架構(gòu)代際+型號(hào)升級(jí)"的雙軌制。目前,英偉達(dá)已經(jīng)形成了完整的三代產(chǎn)品體系:Hopper架構(gòu)的H系列、Blackwell架構(gòu)的B系列以及未來(lái)的Vera Rubin架構(gòu)的R系列。這三代產(chǎn)品在定位、性能和工程實(shí)現(xiàn)上存在顯著差異。
![]()
從代際關(guān)系來(lái)看,H200與H100 同屬 Hopper 架構(gòu),二者之間不存在架構(gòu)代際的斷裂。這意味著H200完全兼容H100的軟件棧、服務(wù)器平臺(tái)和運(yùn)維體系。對(duì)于已經(jīng)部署了H系列集群的云廠商和智算中心來(lái)說(shuō),升級(jí)到H200幾乎不需要改造現(xiàn)有基礎(chǔ)設(shè)施,可以實(shí)現(xiàn) "即插即用",快速轉(zhuǎn)化為可用產(chǎn)能。
相比之下,Blackwell架構(gòu)的B系列則是一次徹底的架構(gòu)換代。B200不僅在計(jì)算性能和顯存帶寬上有顯著提升,更重要的是它采用了全新的系統(tǒng)級(jí)設(shè)計(jì),對(duì)整機(jī)形態(tài)、互聯(lián)方案、機(jī)柜級(jí)集成提出了更高要求。B200的TDP高達(dá)1000W,遠(yuǎn)高于H200的700W,需要全新的電源和散熱系統(tǒng)支持。這意味著部署B(yǎng)系列,需要對(duì)數(shù)據(jù)中心進(jìn)行大規(guī)模改造,部署周期顯著拉長(zhǎng)。
更遠(yuǎn)期的Rubin平臺(tái),無(wú)疑是最先進(jìn)的,代表了英偉達(dá)的未來(lái)戰(zhàn)略方向。它不再是單一的GPU芯片,而是一個(gè)完整的AI 工廠平臺(tái),集成了CPU、GPU、NVLink 交換、網(wǎng)卡、DPU、以太網(wǎng)交換等一整套組件。
Rubin平臺(tái)的目標(biāo)是實(shí)現(xiàn)從芯片到機(jī)柜再到數(shù)據(jù)中心的全棧優(yōu)化,將競(jìng)爭(zhēng)門檻從單卡性能提升到了平臺(tái)級(jí)生態(tài)綁定。
02
中國(guó)AIDC,為什么更適合H系列?
當(dāng)前,國(guó)內(nèi)智算中心在GPU選型上,普遍更傾向于H系列而非B系列。這一選擇并非因?yàn)镠系列性能更先進(jìn),而是基于交付確定性、部署成本和工程可行性的綜合考量。
首先,H系列的交付確定性遠(yuǎn)高于B系列。
自2022年美國(guó)出臺(tái)先進(jìn)計(jì)算芯片出口管制規(guī)則以來(lái),英偉達(dá)的高端GPU對(duì)華出口一直受到嚴(yán)格限制。B系列作為英偉達(dá)最新一代架構(gòu)的產(chǎn)品,技術(shù)含量更高,戰(zhàn)略意義更強(qiáng),因此受到的出口管制也更為嚴(yán)格。截至目前,B系列尚未獲得任何對(duì)華出口許可,短期內(nèi)也看不到放開的跡象。而H系列作為上一代產(chǎn)品,管制相對(duì)寬松,本次H200 獲批就是一個(gè)明證。
其次,H系列的部署成本更低,周期更短。
如前所述,H200完全兼容H100的服務(wù)器平臺(tái)和運(yùn)維體系。國(guó)內(nèi)已經(jīng)有大量的H100和H20服務(wù)器在運(yùn)行,相關(guān)的工程團(tuán)隊(duì)、運(yùn)維經(jīng)驗(yàn)和軟件生態(tài)都已經(jīng)非常成熟。部署H200 只需要替換GPU 芯片,不需要改造機(jī)柜、電源、散熱和網(wǎng)絡(luò)系統(tǒng),部署周期可以控制在1-2個(gè)月內(nèi)。而部署B(yǎng)系列則需要全新的服務(wù)器設(shè)計(jì)、機(jī)柜改造和系統(tǒng)調(diào)優(yōu),部署周期至少需要6個(gè)月以上,成本也會(huì)增加30%-50%。
第三,H系列更適合當(dāng)前國(guó)內(nèi)的主流應(yīng)用場(chǎng)景。
當(dāng)前國(guó)內(nèi)AI產(chǎn)業(yè)已經(jīng)從訓(xùn)練階段全面轉(zhuǎn)向部署階段,推理業(yè)務(wù)成為算力消耗的絕對(duì)主力。根據(jù)中國(guó)信通院的數(shù)據(jù),2025年國(guó)內(nèi)AI算力中推理算力的占比已經(jīng)達(dá)到68%,預(yù)計(jì)2026年將進(jìn)一步提升至75%。H200 的核心優(yōu)勢(shì)正是在于推理性能,其141GB的大顯存和4.8TB/s的高帶寬,完美適配長(zhǎng)上下文對(duì)話、RAG 檢索增強(qiáng)、多模態(tài)交互等主流推理場(chǎng)景。而B系列雖然在訓(xùn)練性能上更具優(yōu)勢(shì),但在推理場(chǎng)景下的性價(jià)比并不比H200高多少。
第四,H系列的供應(yīng)鏈更加穩(wěn)定。
英偉達(dá)的H系列芯片已經(jīng)量產(chǎn)多年,產(chǎn)能充足,供應(yīng)鏈成熟。而B系列芯片剛剛進(jìn)入量產(chǎn)階段,產(chǎn)能有限,主要供應(yīng)北美和歐洲市場(chǎng)。即使未來(lái)B系列獲得對(duì)華出口許可,國(guó)內(nèi)企業(yè)也很難拿到足夠的配額。
綜合以上因素,對(duì)于國(guó)內(nèi)智算中心來(lái)說(shuō),H 系列是當(dāng)前最現(xiàn)實(shí)、最經(jīng)濟(jì)、最可靠的選擇。
B系列雖然性能更先進(jìn),但在可獲得性、部署成本和周期上都存在明顯劣勢(shì)。在出口管制和供應(yīng)鏈不確定的背景下,能上線遠(yuǎn)比追求最先進(jìn)更為重要。
不過(guò),這里仍要說(shuō)明一下,英偉達(dá)B系列(Blackwell)并不像有人說(shuō)的是過(guò)渡性產(chǎn)品,而是英偉達(dá)從單卡算力轉(zhuǎn)向系統(tǒng)級(jí)算力的核心主力平臺(tái),生命周期約 2年(2024-2026),是全球首個(gè)專為推理優(yōu)化的架構(gòu),首次將競(jìng)爭(zhēng)維度從單卡提升到機(jī)柜級(jí)集成。B200/B300是2025-2026年全球高端算力的絕對(duì)主力,出貨量將遠(yuǎn)超H系列。
03
推理時(shí)代的到來(lái),以及國(guó)產(chǎn)替代的真實(shí)進(jìn)展
AI產(chǎn)業(yè)正在經(jīng)歷一場(chǎng)深刻的范式轉(zhuǎn)變:過(guò)去的重心是模型訓(xùn)練,而當(dāng)下和未來(lái),推理將成為絕對(duì)的主角。這一轉(zhuǎn)變對(duì)國(guó)產(chǎn)算力產(chǎn)業(yè)的發(fā)展具有深遠(yuǎn)影響。
訓(xùn)練階段的核心目標(biāo)是打造出能力強(qiáng)大的模型,它對(duì)硬件的要求是極致的性能和生態(tài)的一致性。訓(xùn)練任務(wù)通常需要數(shù)千甚至數(shù)萬(wàn)張GPU卡協(xié)同工作(萬(wàn)卡集群),對(duì)卡之間的互聯(lián)帶寬和延遲要求極高。同時(shí),訓(xùn)練任務(wù)高度依賴CUDA 生態(tài),軟件棧的成熟度直接影響訓(xùn)練效率。這也是為什么在訓(xùn)練階段,英偉達(dá)的GPU幾乎處于壟斷地位。
而推理階段則完全不同。
推理的核心目標(biāo)是以最低的成本、最高的效率為用戶提供穩(wěn)定的服務(wù)。它對(duì)硬件的要求不再是單一的峰值性能,而是單位token成本、吞吐與時(shí)延的綜合表現(xiàn)。推理階段的工程手段更加豐富,量化、并行策略、KV Cache管理、推理引擎優(yōu)化、算子融合、調(diào)度與通信優(yōu)化等,都可以在不改變模型結(jié)構(gòu)的情況下顯著提升性能。這為國(guó)產(chǎn)GPU提供了彎道超車的機(jī)會(huì)。
在推理時(shí)代,國(guó)產(chǎn)GPU已經(jīng)取得了顯著的進(jìn)展,形成了以華為昇騰為龍頭,寒武紀(jì)、海光信息、摩爾線程等多強(qiáng)并立的格局。
華為昇騰是國(guó)產(chǎn)GPU的絕對(duì)領(lǐng)導(dǎo)者。2026年4 月,華為正式啟動(dòng)昇騰950PR 的大規(guī)模量產(chǎn)。根據(jù)公開信息,昇騰950PR搭載112GB自研HiBL 顯存,F(xiàn)P4 算力達(dá)1.56P FLOPS,在DeepSeek V4模型8K輸入長(zhǎng)度的標(biāo)準(zhǔn)測(cè)試場(chǎng)景下,單卡推理性能是英偉達(dá)H20 的2.87 倍。
華為還推出了 CloudMatrix384 超節(jié)點(diǎn)系統(tǒng),將384顆昇騰910C與192顆鯤鵬CPU通過(guò)高帶寬互聯(lián)實(shí)現(xiàn)全互聯(lián)與資源池化,并圍繞MoE 并行、KV Cache 訪問(wèn)等推理負(fù)載做了系統(tǒng)級(jí)優(yōu)化。這一系統(tǒng)在eepSeek V4 模型上的表現(xiàn)已經(jīng)接近英偉達(dá)的同類產(chǎn)品。
寒武紀(jì)是國(guó)內(nèi)領(lǐng)先的 AI 芯片設(shè)計(jì)公司。2026年一季度,寒武紀(jì)實(shí)現(xiàn)營(yíng)收 28.85億元,同比增長(zhǎng)159.56%;歸母凈利 10.13億元,同比增長(zhǎng)185.04%;經(jīng)營(yíng)現(xiàn)金流轉(zhuǎn)正至8.34 億元,為上市以來(lái)首次季度現(xiàn)金流為正。支撐這一業(yè)績(jī)的核心是思元590芯片的大規(guī)模出貨。思元590采用7nm Chiple封裝,F(xiàn)P16 算力 256TFLOPS,INT8 算力 512TOPS,96GB HBM2e,綜合性能接近英偉達(dá)A100的80%。目前,思元590已經(jīng)在字節(jié)跳動(dòng)、百度、阿里巴巴等頭部互聯(lián)網(wǎng)企業(yè)實(shí)現(xiàn)大規(guī)模部署。
海光信息堅(jiān)持CPU+DCU雙輪驅(qū)動(dòng)戰(zhàn)略。2026年一季度,海光信息實(shí)現(xiàn)營(yíng)收 40.34億元,同比增 68.06%;歸母凈利潤(rùn)6.87 億元,同比增長(zhǎng)35.82%。海光的DCU產(chǎn)品已經(jīng)廣泛應(yīng)用于超算中心、金融、能源等領(lǐng)域,在科學(xué)計(jì)算和 AI 訓(xùn)練方面表現(xiàn)出色。
盡管國(guó)產(chǎn)GPU取得了顯著進(jìn)展,但我們必須清醒地認(rèn)識(shí)到,國(guó)產(chǎn)替代仍然處于初級(jí)階段。在高端訓(xùn)練芯片領(lǐng)域,國(guó)產(chǎn)GPU與英偉達(dá)的差距仍然較大。即使在推理領(lǐng)域,雖然國(guó)產(chǎn)GPU已經(jīng)能夠滿足大部分應(yīng)用需求,但在生態(tài)成熟度、軟件工具鏈和大規(guī)模集群穩(wěn)定性方面,與英偉達(dá)仍有不小的差距。
04
國(guó)產(chǎn)GPU與英偉達(dá)的差距正在加大?
這幾乎是一個(gè)關(guān)乎中國(guó)算力戰(zhàn)略成敗的核心問(wèn)題。
市場(chǎng)上存在兩種截然不同的觀點(diǎn):一種觀點(diǎn)認(rèn)為,隨著國(guó)產(chǎn)GPU性能的快速提升和生態(tài)的不斷完善,差距正在逐步縮小;另一種觀點(diǎn)則認(rèn)為,英偉達(dá)的迭代速度太快,平臺(tái)化優(yōu)勢(shì)太明顯,差距實(shí)際上在不斷加大。
深算派認(rèn)為,從單卡性能的角度來(lái)看,國(guó)產(chǎn)GPU 與英偉達(dá)的差距確實(shí)在逐步縮小;但從平臺(tái)化和生態(tài)的角度來(lái)看,差距正在不斷加大。
從單卡性能來(lái)看,國(guó)產(chǎn)GPU的進(jìn)步有目共睹。華為昇騰950PR的推理性能已經(jīng)超過(guò)了英偉達(dá)的H20,接近H100的水平。寒武紀(jì)的思元590綜合性能也達(dá)到了 A100的80%左右。按照這個(gè)速度,國(guó)產(chǎn)GPU望在未來(lái)2-3年內(nèi),在單卡性能上追平英偉達(dá)的上一代產(chǎn)品。
但從平臺(tái)化和生態(tài)的角度來(lái)看,差距正在不斷拉大。
英偉達(dá)已經(jīng)從單一的GPU芯片供應(yīng)商,轉(zhuǎn)變?yōu)橥暾腁I計(jì)算平臺(tái)提供商。其 Blackwell架構(gòu)和未來(lái)的Rubin 平臺(tái),不再是簡(jiǎn)單的芯片升級(jí),而是系統(tǒng)級(jí)和平臺(tái)級(jí)的革新。英偉達(dá)通過(guò)DGX系統(tǒng)、HGX模組、NVLink互聯(lián)、CUDA軟件棧、TensorRT推理引擎等一整套產(chǎn)品和技術(shù),構(gòu)建了一個(gè)封閉但高效的生態(tài)系統(tǒng)。這個(gè)生態(tài)系統(tǒng)的壁壘極高,后來(lái)者很難突破。
更重要的是,英偉達(dá)的迭代速度正在不斷加快。
過(guò)去,英偉達(dá)的GPU架構(gòu)迭代周期是2年;現(xiàn)在,已經(jīng)縮短到了18個(gè)月。而且,每一代架構(gòu)的提升幅度都是指數(shù)級(jí)的。Blackwell架構(gòu)相比Hopper架構(gòu),推理性能就提升了4 倍,能效提升了 25倍。按照這個(gè)速度,國(guó)產(chǎn)GPU 即使在單卡性能上追平了英偉達(dá)的上一代產(chǎn)品,英偉達(dá)的下一代產(chǎn)品又已經(jīng)推出了,差距似乎永遠(yuǎn)存在。
此外,出口管制的不斷升級(jí)也在拉大差距。
美國(guó)不僅限制高端GPU對(duì)華出口,還限制先進(jìn)制造設(shè)備、EDA軟件、IP核等關(guān)鍵技術(shù)的出口。這使得國(guó)產(chǎn)GPU在制程工藝、先進(jìn)封裝、HBM顯存等方面面臨巨大的瓶頸。例如,HBM顯存目前幾乎被三星、SK海力士和美光三家壟斷,國(guó)產(chǎn)HBM顯存剛剛進(jìn)入量產(chǎn)階段,性能和產(chǎn)能都與國(guó)際先進(jìn)水平有較大差距。
綜合來(lái)看,討論國(guó)產(chǎn)GPU與英偉達(dá)的差距,是一個(gè)復(fù)雜的問(wèn)題,不能簡(jiǎn)單地用 加大或縮小來(lái)概括。在單卡性能和特定應(yīng)用場(chǎng)景上,差距正在縮小;但在平臺(tái)化、生態(tài)和整體技術(shù)實(shí)力上,差距正在加大。這就要求我們的算力戰(zhàn)略必須更加務(wù)實(shí),不能盲目追求全面超越,而應(yīng)該聚焦重點(diǎn)領(lǐng)域,發(fā)揮比較優(yōu)勢(shì),走差異化發(fā)展道路。
05
放H200進(jìn)來(lái)的利與弊
放H200進(jìn)來(lái),其實(shí)是一把雙刃劍。
它既可以緩解國(guó)內(nèi)高端算力的緊張局面,為國(guó)產(chǎn)GPU提供對(duì)標(biāo)基準(zhǔn);也可能擠壓國(guó)產(chǎn)GPU的市場(chǎng)空間,延緩國(guó)產(chǎn)替代的進(jìn)程。如何在 "算力即國(guó)力" 與 "自主可控" 之間找到平衡,是當(dāng)前我國(guó)算力戰(zhàn)略面臨的核心挑戰(zhàn)。
放H200進(jìn)來(lái)的好處是顯而易見的。
首先,它可以快速緩解國(guó)內(nèi)高端算力的緊張局面。
當(dāng)前,國(guó)內(nèi)AI產(chǎn)業(yè)正處于快速發(fā)展期,對(duì)高端算力的需求呈爆發(fā)式增長(zhǎng)。
根據(jù)中國(guó)信通院的數(shù)據(jù),2025年國(guó)內(nèi)AI算力需求達(dá)到了350EFLOPS,同比增長(zhǎng)78%;預(yù)計(jì)2026年將達(dá)到600EFLOPS,同比增長(zhǎng)71%。而國(guó)產(chǎn)GPU的產(chǎn)能遠(yuǎn)遠(yuǎn)無(wú)法滿足這一需求。
2026年國(guó)內(nèi)高端AI芯片總需求約450萬(wàn)顆,國(guó)產(chǎn)供給約220-240萬(wàn)顆,自給率約50%,其中昇騰950PR 計(jì)劃出貨75萬(wàn)顆。
缺口主要靠三類方式填補(bǔ):一是合規(guī)進(jìn)口英偉達(dá)H20/H200(H200 獲批后配額落地);二是大廠出海部署,在東南亞、中東采購(gòu)英偉達(dá)芯片建集群;三是存量復(fù)用+算力調(diào)度優(yōu)化,通過(guò)低負(fù)載業(yè)務(wù)遷移、集群池化提升利用率,同時(shí)用寒武紀(jì)、海光等國(guó)產(chǎn)中低端芯片分流非核心需求。
其次,它可以為國(guó)產(chǎn)GPU提供明確的對(duì)標(biāo)基準(zhǔn)。
有了 H200 這個(gè)參照物,國(guó)產(chǎn) GPU 廠商可以更清晰地找到自身的差距與不足,從而更有針對(duì)性地加大研發(fā)投入,提升產(chǎn)品性能與生態(tài)成熟度。同時(shí),H200 的進(jìn)入也會(huì)給國(guó)產(chǎn) GPU 帶來(lái)競(jìng)爭(zhēng)壓力,倒逼它們加快技術(shù)創(chuàng)新和產(chǎn)品迭代的速度。
第三,它可以為國(guó)內(nèi)企業(yè)爭(zhēng)取寶貴的時(shí)間窗口。
AI產(chǎn)業(yè)的競(jìng)爭(zhēng)是一場(chǎng)速度的競(jìng)賽。誰(shuí)能先把產(chǎn)品推向市場(chǎng),誰(shuí)就能占據(jù)先機(jī)。放H200進(jìn)來(lái),可以讓國(guó)內(nèi)企業(yè)在短期內(nèi)獲得足夠的算力支持,加快產(chǎn)品研發(fā)和商業(yè)化進(jìn)程,在全球AI競(jìng)爭(zhēng)中占據(jù)有利位置。同時(shí),也為國(guó)產(chǎn)GPU的發(fā)展?fàn)幦×藢氋F的時(shí)間。
當(dāng)然,放H200 進(jìn)來(lái)也存在明顯的風(fēng)險(xiǎn)。
最主要的風(fēng)險(xiǎn)是可能擠壓國(guó)產(chǎn)GPU的市場(chǎng)空間。
如果國(guó)內(nèi)企業(yè)可以輕松獲得 H200,它們可能會(huì)更傾向于使用成熟的英偉達(dá)產(chǎn)品,而不愿意冒險(xiǎn)使用國(guó)產(chǎn) GPU。這會(huì)導(dǎo)致國(guó)產(chǎn)GPU失去寶貴的市場(chǎng)機(jī)會(huì)和真實(shí)負(fù)載,從而延緩生態(tài)成熟和技術(shù)進(jìn)步的速度。
其次,它可能會(huì)增強(qiáng)國(guó)內(nèi)企業(yè)對(duì)英偉達(dá)的依賴。
英偉達(dá)的生態(tài)系統(tǒng)非常強(qiáng)大,一旦國(guó)內(nèi)企業(yè)深度融入這個(gè)生態(tài)系統(tǒng),就很難再脫離出來(lái)。這會(huì)使得中國(guó)的AI產(chǎn)業(yè)在核心技術(shù)上受制于人,存在巨大的安全風(fēng)險(xiǎn)。
第三,它可能會(huì)影響國(guó)產(chǎn)GPU產(chǎn)業(yè)鏈的發(fā)展。
如果國(guó)產(chǎn)GPU的市場(chǎng)需求不足,相關(guān)的上游企業(yè),如芯片設(shè)計(jì)、制造、封裝、測(cè)試等,也會(huì)缺乏發(fā)展的動(dòng)力。這會(huì)使得整個(gè)國(guó)產(chǎn)GPU產(chǎn)業(yè)鏈陷入惡性循環(huán)。
如何平衡這些利弊,找到一條適合中國(guó)國(guó)情的算力發(fā)展道路?主流企業(yè)、官方和學(xué)者普遍認(rèn)為,應(yīng)該采取"分層使用、場(chǎng)景切割、比例管理"的策略。
具體來(lái)說(shuō),就是將算力需求分為不同的層次和場(chǎng)景:
對(duì)于關(guān)鍵在線推理業(yè)務(wù),對(duì)時(shí)延和穩(wěn)定性要求極高,可以允許使用一定比例的進(jìn)口高端GPU;
對(duì)于政企核心業(yè)務(wù)、關(guān)鍵基礎(chǔ)設(shè)施、以及可控范圍內(nèi)的行業(yè)模型,必須使用國(guó)產(chǎn)GPU;
對(duì)于科研和教育等非敏感領(lǐng)域,可以靈活使用進(jìn)口和國(guó)產(chǎn)GPU。同時(shí),通過(guò)政策引導(dǎo)和市場(chǎng)機(jī)制,確保國(guó)產(chǎn)GPU獲得足夠的市場(chǎng)空間和真實(shí)負(fù)載。
這種策略的核心思想是:既能保證國(guó)內(nèi)AI 產(chǎn)業(yè)的發(fā)展速度,不要因?yàn)樽非笞灾骺煽囟鵂奚l(fā)展機(jī)遇;也要堅(jiān)持自主可控的戰(zhàn)略方向,不能因?yàn)槎唐诘谋憷艞夐L(zhǎng)期的安全。通過(guò)兩條腿走路,實(shí)現(xiàn)發(fā)展與安全的有機(jī)統(tǒng)一。
06
H200放行對(duì)產(chǎn)業(yè)鏈的影響,以及A股的機(jī)會(huì)
H200放行的影響,將沿著"芯片→服務(wù)器→數(shù)據(jù)中心→應(yīng)用" 的產(chǎn)業(yè)鏈條逐層傳導(dǎo)。從A 股投資的角度來(lái)看,以下幾個(gè)環(huán)節(jié)的受益最為直接且確定性最高。
(一)頭部互聯(lián)網(wǎng)企業(yè):推理產(chǎn)能邊際改善,競(jìng)爭(zhēng)力顯著提升
H200放行的最大受益者,無(wú)疑是國(guó)內(nèi)的頭部互聯(lián)網(wǎng)企業(yè),尤其是字節(jié)跳動(dòng)、阿里巴巴和騰訊。這三家公司是本次獲批采購(gòu)H200的主要主體,也是國(guó)內(nèi)AI算力需求最大的企業(yè)。
字節(jié)跳動(dòng)作為國(guó)內(nèi)AI應(yīng)用的領(lǐng)軍者,其抖音、今日頭條、豆包等產(chǎn)品對(duì)推理算力的需求極其巨大。H200的引入將顯著提升字節(jié)跳動(dòng)的推理集群吞吐能力,降低單位token成本,改善用戶體驗(yàn)。同時(shí),也將加快字節(jié)跳動(dòng)在多模態(tài)、AGI 等前沿領(lǐng)域的研發(fā)進(jìn)度。
根據(jù)公開信息,字節(jié)跳動(dòng)2026年的AI資本開支已從1600億元上調(diào)至2000億元,其中60%-70%將投向AIDC領(lǐng)域。
阿里巴巴和騰訊也將從H200放行中顯著受益。阿里云和騰訊云是國(guó)內(nèi)最大的兩家云服務(wù)商,擁有大量的AI 客戶。H200的引入將提升它們的云服務(wù)競(jìng)爭(zhēng)力,吸引更多的AI客戶。同時(shí),也將支持它們自身的AI業(yè)務(wù)發(fā)展,如阿里的通義千問(wèn)、騰訊的混元大模型等。
(二)AIDC 基礎(chǔ)設(shè)施服務(wù)商:高功率機(jī)柜需求爆發(fā),龍頭企業(yè)率先受益
H200進(jìn)入國(guó)內(nèi)后,頭部互聯(lián)網(wǎng)公司將加速推進(jìn)AI算力集群的擴(kuò)容計(jì)劃,這將直接帶動(dòng)高功率智算中心(AIDC)的需求。那些深度綁定頭部客戶、擁有充足高功率機(jī)柜儲(chǔ)備、且掌握成熟液冷技術(shù)的 AIDC 龍頭,將成為本次利好最直接的受益者。
潤(rùn)澤科技(300442.SZ)是本次H200 獲批最具確定性的A股受益者。
根據(jù)潤(rùn)澤科技 2025 年年報(bào)披露口徑,H200 獲批的利好邏輯可從四個(gè)維度精準(zhǔn)落地:
一是業(yè)務(wù)結(jié)構(gòu)高度匹配。2025年公司AIDC業(yè)務(wù)實(shí)現(xiàn)營(yíng)收25.10億元,同比大增 72.97%,占總營(yíng)收比例升至44.24%,毛利率達(dá)48.50%,已超越傳統(tǒng) IDC 成為核心增長(zhǎng)引擎。H200等高功耗GPU的部署需求,將直接拉動(dòng)公司高毛利 AIDC業(yè)務(wù)的加速放量。
二是客戶綁定深度足夠。年報(bào)明確公司"深度覆蓋國(guó)內(nèi)前三大互聯(lián)網(wǎng)企業(yè)、頭部云廠商及核心 AI 企業(yè)",其中字節(jié)跳動(dòng)為第一大客戶,貢獻(xiàn)約60%收入,承接了字節(jié)2025年新增算力需求的50%。本次字節(jié)為H200主要獲批主體,其算力擴(kuò)容節(jié)奏加快將直接傳導(dǎo)至公司業(yè)績(jī)。
三是技術(shù)能力完全適配。2025年公司自研冷板式液冷技術(shù)全面應(yīng)用,實(shí)現(xiàn)單機(jī)柜45kW以上高密度部署,PUE低至1.08-1.15,可穩(wěn)定承載H200單卡700W 的高功耗需求。全年新增交付算力220MW,交付規(guī)模超此前十六年累計(jì)總量的 40%,產(chǎn)能儲(chǔ)備充足。
四是業(yè)績(jī)確定性極強(qiáng)。公司與頭部客戶簽訂10-15年長(zhǎng)單。H200 獲批后,字節(jié) 2026年上調(diào)至2000億元的AI資本開支中,預(yù)計(jì)將有200-280億元轉(zhuǎn)化為潤(rùn)澤的增量訂單,直接提升公司高功率機(jī)柜上架率與單卡ARPU。
萬(wàn)國(guó)數(shù)據(jù)(GDS.US/09698.HK)是國(guó)內(nèi)領(lǐng)先的第三方IDC 服務(wù)商,深度綁定阿里、騰訊等頭部客戶。截至2025年底,萬(wàn)國(guó)數(shù)據(jù)擁有約15萬(wàn)架機(jī)柜,是國(guó)內(nèi)規(guī)模最大的第三方 IDC 服務(wù)商。H200 獲批后,阿里和騰訊的算力擴(kuò)容計(jì)劃將加速推進(jìn),萬(wàn)國(guó)數(shù)據(jù)將從中顯著受益。
數(shù)據(jù)港(603881.SH) 是阿里云的核心合作伙伴,在長(zhǎng)三角地區(qū)擁有豐富的高功率機(jī)柜資源。公司與阿里云簽訂了長(zhǎng)期合作協(xié)議,承接了阿里云大量的 AI 算力需求。H200 獲批后,阿里云的算力擴(kuò)容將帶動(dòng)數(shù)據(jù)港的業(yè)務(wù)增長(zhǎng)。
光環(huán)新網(wǎng)(300383.SZ)是AWS 中國(guó)區(qū)的核心運(yùn)營(yíng)商,同時(shí)也服務(wù)字節(jié)跳動(dòng)、騰訊等客戶。公司在京津冀、長(zhǎng)三角等核心區(qū)域擁有多個(gè)數(shù)據(jù)中心,高功率機(jī)柜儲(chǔ)備充足。
07
字節(jié)出海,能否從根本上解決GPU卡點(diǎn)?
面對(duì)國(guó)內(nèi)GPU供給的緊張局面,很多企業(yè)選擇了出海的方式,在海外建設(shè)數(shù)據(jù)中心,采購(gòu)英偉達(dá)的高端GPU。那么,出海能否從根本上解決GPU卡點(diǎn)問(wèn)題呢?
深算派認(rèn)為,出海可以在一定程度上緩解GPU供給的緊張局面,但無(wú)法從根本上解決問(wèn)題。
首先,出海可以規(guī)避部分出口管制的限制。
美國(guó)的出口管制主要針對(duì)中國(guó)境內(nèi)的企業(yè)和實(shí)體,對(duì)于中國(guó)企業(yè)在海外設(shè)立的子公司,管制相對(duì)寬松。因此,中國(guó)企業(yè)可以通過(guò)在海外設(shè)立子公司的方式,采購(gòu)英偉達(dá)的高端GPU,建設(shè)數(shù)據(jù)中心,為全球用戶提供服務(wù)。
其次,出海可以利用海外的能源和土地資源。
建設(shè)大型智算中心需要消耗大量的電力和土地資源。海外很多國(guó)家和地區(qū)擁有豐富的能源和廉價(jià)的土地,建設(shè)成本相對(duì)較低。例如,北歐國(guó)家擁有豐富的水電資源,氣候寒冷,非常適合建設(shè)數(shù)據(jù)中心。
但是,出海也面臨著諸多挑戰(zhàn)和風(fēng)險(xiǎn)。
第一,出口管制的風(fēng)險(xiǎn)仍然存在。
美國(guó)的出口管制政策是不斷變化的,未來(lái)有可能將中國(guó)企業(yè)在海外的子公司也納入管制范圍。例如,2025年美國(guó)就曾出臺(tái)政策,限制中國(guó)企業(yè)通過(guò)海外子公司采購(gòu)高端GPU。因此,出海并不能完全規(guī)避出口管制的風(fēng)險(xiǎn)。
第二,數(shù)據(jù)合規(guī)的風(fēng)險(xiǎn)。
不同國(guó)家和地區(qū)有不同的數(shù)據(jù)保護(hù)法規(guī),如歐盟的GDPR、美國(guó)的CCPA 等。中國(guó)企業(yè)在海外建設(shè)數(shù)據(jù)中心,處理用戶數(shù)據(jù),必須遵守當(dāng)?shù)氐臄?shù)據(jù)保護(hù)法規(guī)。如果違反這些法規(guī),可能會(huì)面臨巨額罰款和業(yè)務(wù)暫停的風(fēng)險(xiǎn)。
第三,時(shí)延和成本的問(wèn)題。
將數(shù)據(jù)中心建在海外,會(huì)增加國(guó)內(nèi)用戶的訪問(wèn)時(shí)延,影響用戶體驗(yàn)。同時(shí),出海建設(shè)數(shù)據(jù)中心還需要面臨匯率波動(dòng)、政治風(fēng)險(xiǎn)、文化差異等諸多問(wèn)題,運(yùn)營(yíng)成本和風(fēng)險(xiǎn)都顯著高于國(guó)內(nèi)。
第四,無(wú)法解決國(guó)內(nèi)業(yè)務(wù)的需求。
很多中國(guó)企業(yè)的主要市場(chǎng)在國(guó)內(nèi),它們需要為國(guó)內(nèi)用戶提供服務(wù)。根據(jù)中國(guó)的數(shù)據(jù)安全法,關(guān)鍵信息基礎(chǔ)設(shè)施運(yùn)營(yíng)者在境內(nèi)運(yùn)營(yíng)中收集和產(chǎn)生的個(gè)人信息和重要數(shù)據(jù),應(yīng)當(dāng)在境內(nèi)存儲(chǔ)。因此,這些企業(yè)無(wú)法將核心業(yè)務(wù)轉(zhuǎn)移到海外,出海只能解決部分海外業(yè)務(wù)的需求。
對(duì)于AIDC 企業(yè)來(lái)說(shuō),出海同樣面臨著機(jī)遇與挑戰(zhàn)。潤(rùn)澤科技、萬(wàn)國(guó)數(shù)據(jù)等國(guó)內(nèi)領(lǐng)先的AIDC企業(yè)已經(jīng)開始布局海外市場(chǎng)。例如,萬(wàn)國(guó)數(shù)據(jù)在新加坡、馬來(lái)西亞等地建設(shè)了數(shù)據(jù)中心;潤(rùn)澤科技也在規(guī)劃海外數(shù)據(jù)中心項(xiàng)目。出海可以幫助這些企業(yè)拓展市場(chǎng)空間,分散經(jīng)營(yíng)風(fēng)險(xiǎn)。但同時(shí),它們也需要面對(duì)當(dāng)?shù)厥袌?chǎng)的競(jìng)爭(zhēng)、政策法規(guī)的差異、文化沖突等諸多挑戰(zhàn)。
08
H200與華為昇騰950PR能否互補(bǔ)?
為了更直觀地了解H200與國(guó)產(chǎn)高端GPU之間的差距,我們將H200 與華為昇騰 950PR進(jìn)行了詳細(xì)的對(duì)比。
![]()
從上表中可以看出,H200在單卡性能、顯存帶寬和生態(tài)成熟度方面具有明顯優(yōu)勢(shì);而昇騰950PR則在價(jià)格、自主可控和系統(tǒng)級(jí)優(yōu)化方面具有優(yōu)勢(shì)。
另外,華為昇騰950PR的產(chǎn)能雖然已經(jīng)翻了幾倍,但每年75萬(wàn)顆的產(chǎn)量,還是不能完全滿足市場(chǎng)需求。根據(jù)行業(yè)估算,2026年國(guó)內(nèi)高端AI芯片的需求約為 250萬(wàn)顆,其中推理芯片需求約為180 萬(wàn)顆,訓(xùn)練芯片需求約為70 萬(wàn)顆。華為昇騰 950PR 的75萬(wàn)顆產(chǎn)量,加上其他國(guó)產(chǎn)廠商的約 30 萬(wàn)顆產(chǎn)量,國(guó)產(chǎn)芯片的總供給量約為 105 萬(wàn)顆,只能滿足約 42% 的市場(chǎng)需求。
在這種情況下,放H200進(jìn)來(lái),不僅可以填補(bǔ)市場(chǎng)需求的缺口,還有利于我國(guó)算力產(chǎn)業(yè)的整體進(jìn)步。H200 與國(guó)產(chǎn)GPU可以形成互補(bǔ)關(guān)系,H200用于關(guān)鍵在線推理業(yè)務(wù),國(guó)產(chǎn)GPU用于政企和行業(yè)應(yīng)用,共同構(gòu)建一個(gè)多元化、多層次的算力供給體系。
后 記
H200獲批是中美算力博弈進(jìn)程中的一個(gè)重要里程碑,它為國(guó)內(nèi)AI產(chǎn)業(yè)的發(fā)展提供了寶貴的緩沖期。短期來(lái)看,它將有效緩解國(guó)內(nèi)高端算力的緊張局面,帶動(dòng) AIDC、光模塊、服務(wù)器等產(chǎn)業(yè)鏈環(huán)節(jié)的業(yè)績(jī)?cè)鲩L(zhǎng)。長(zhǎng)期來(lái)看,它不會(huì)改變國(guó)產(chǎn)替代的大趨勢(shì),反而會(huì)刺激國(guó)產(chǎn)算力產(chǎn)業(yè)加速追趕。
中國(guó)的算力產(chǎn)業(yè)正處于一個(gè)關(guān)鍵的發(fā)展階段。我們既要充分利用國(guó)際先進(jìn)技術(shù)和資源,加快產(chǎn)業(yè)發(fā)展;也要堅(jiān)定不移地推進(jìn)自主可控戰(zhàn)略,掌握核心技術(shù)。只有這樣,我們才能在全球 AI 競(jìng)爭(zhēng)中占據(jù)有利位置,實(shí)現(xiàn) "算力即國(guó)力" 的戰(zhàn)略目標(biāo)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.