2025年 7月,英偉達 CEO 黃仁勛在北京一場行業峰會上公開承認:“中國已具備足夠算力基礎,持續技術限制只會加速本土替代進程。” 這番表態背后,是美國對華 AI 芯片管制政策反復帶來的市場變局 —— 從 4 月叫停 H20 芯片出口導致英偉達單季度減記 55 億美元,到 7 月恢復銷售卻面臨國產芯片搶占近三成市場份額的現實,短短三個月間,中國 AI 產業格局正在發生結構性重塑。在這場變革中,DeepSeek 通過技術創新突破算力桎梏、中科曙光構建開放生態打破壟斷、信創芯片加速迭代實現性能追趕,共同編織出一條自主可控的智能計算發展路徑。
英偉達在華困境與國產替代加速
“一天一個價,現款現貨還要排隊。”2025 年 4 月初,北京某 AI 服務器經銷商這樣描述英偉達 H20 芯片的市場行情。當時,美國政府突然要求 H20 芯片出口需單獨申請許可證,引發市場恐慌性搶購,單臺配置 8 顆 H20 的服務器價格從 100萬元飆升至 140 萬元。但好景不長,據英偉達 8-K 文件披露,截至 4 月 27 日,公司因 H20 相關庫存和采購承諾減記 55 億美元,兩季度累計損失達 135 億美元。中國區營收占比從 2024 年的 12.5%(171 億美元)驟降至 2025 年二季度的 8.3%,市場份額被國產芯片快速侵蝕。
字節跳動的采購策略變化頗具代表性。2025 年該公司計劃投入 400 億元采購 AI 芯片,其中國產芯片占比達 60%(240 億元),遠超英偉達特供版的 160 億元。這種轉向背后,是國產芯片性能的快速提升 —— 華為昇騰 910B 推理效率已接近 H20,而價格僅為后者的 70%;寒武紀思元 590 在圖像識別任務中處理速度超越 H20 15%。更深遠的影響在于生態層面,截至 2025 年 7 月,華為昇騰云已適配 160 多個大模型,開發者數量突破 80 萬,形成與英偉達 CUDA 生態分庭抗禮的態勢。黃仁勛在 CNN 采訪中無奈承認:“限制政策反而幫助中國建立了自主的 AI 生態,這是我們不愿看到的結果。”
雪上加霜的是,英偉達還面臨反壟斷調查的壓力。2024年 12 月,中國市場監管總局因涉嫌違反《反壟斷法》及2020 年收購邁絡思時的限制性條件,對英偉達立案調查。根據 2020 年的監管決定,英偉達不得對 GPU 與網絡設備進行捆綁銷售,需保證與第三方產品的互操作性。但調查發現,部分中國企業反映英偉達在軟件更新、技術支持等方面歧視使用國產網絡設備的客戶。與此同時,法國、歐盟等監管機構也在調查英偉達的反競爭行為,全球范圍內的監管壓力進一步削弱其市場主導地位。
盡管美國政府在 7 月批準 H20 恢復出口,英偉達也同步推出 RTX Pro 等新款特供芯片,但市場環境已今非昔比。中國《“十四五” 數字經濟發展規劃》明確要求,2026年數據中心國產芯片使用率需達到 40%,政策驅動下的替代進程不可逆轉。某云服務廠商采購負責人表示:“我們現在采用‘國產為主、進口為輔’的策略,新建集群中國產芯片占比超過 50%,既能規避地緣風險,又能降低成本。” 這種理性選擇,標志著中國 AI 產業正在從 “被動應對” 轉向 “主動布局”。
DeepSeek的精度革命與國產芯片適配潮
2025年 8月 25 日,DeepSeek 在官方公眾號發布 V3.1 版本大模型時,用置頂評論特別強調:“UE8M0 FP8 精度架構專為下一代國產芯片設計。” 這一細節揭開了國產大模型與芯片協同進化的新篇章。不同于英偉達 GPU 采用的 E4M3/E5M2 標準 FP8 格式,UE8M0 采用 “無符號位 + 8 位指數 + 0 位尾數” 的創新編碼方式,通過犧牲部分小數精度換取更大的數值動態范圍,完美適配國產芯片普遍強于整數運算、弱于浮點計算的硬件特性。民生電子研究院測算顯示,這種定制化格式可使國產芯片的推理效率平均提升 40%,顯存占用降低 50%,徹底改變了此前國產芯片運行主流大模型時 “算力跑不滿、顯存不夠用” 的尷尬局面。
UE8M0格式的落地并非孤例。早在 2025 年 2 月,龍芯中科就聯合太初元碁完成 DeepSeek-R1 7B 模型的適配工作,僅用 2 小時便在太初 T100 加速卡上實現本地化部署。搭載龍芯 3A6000 處理器的終端設備,可脫離云端完成文檔處理、數據分析等 AI 任務,平均響應速度比依賴云端服務提升 3 倍。截至 8 月,已有 18 家國產 AI 芯片企業宣布支持 DeepSeek 系列模型,形成涵蓋華為昇騰、寒武紀、海光信息等頭部企業,以及沐曦、壁仞科技等獨角獸的完整適配矩陣。其中,浙東南智算中心采用寒武紀思元 590 芯片,成功部署 DeepSeek V3/R1 6710 億參數滿血版推理服務,實測性能達到英偉達 H20 芯片的 85%,而硬件采購成本僅為后者的 60%。
金融領域的實踐更凸顯這種適配價值。某頭部城商行在智能文檔處理系統中,采用 “海光 DCU+DeepSeek 模型”的聯合方案,實現 OCR 識別準確率 99.2% 的行業新高。壓力測試顯示,單張海光 DCU 卡在高負載下內存峰值僅 5.7GB,顯存占用 10.8GB,穩定性優于同場景下的英偉達 A100。該銀行技術負責人在《金融信創 AI 生態實踐白皮書 (2025)》中指出:“國產算力與大模型的深度協同,使我們擺脫了對進口芯片的依賴,系統年維護成本降低 42%。” 這種 “軟件定義硬件” 的創新模式,正在成為國產 AI 生態突破技術封鎖的關鍵路徑。
從單點突破到體系創新
國產算力的崛起并非簡單的替代效應,而是建立在核心技術持續突破基礎上的體系化創新。在芯片領域,華為昇騰 910C 采用中芯國際 7nm(N+2)制程工藝,擁有 530 億顆晶體管,單卡半精度浮點(FP16)性能達 1200Tflops,實測運行 6710 億參數大模型時,推理延遲僅比英偉達 H100 落后 0.03 毫秒,而單位功耗(0.52 TFLOPS/W)卻比 H100(0.37 TFLOPS/W)高出 40%,一年可節省電費約 5 萬元。寒武紀思元 590 同樣采用7nm 制程,支持 FP16、BF16 等主流數據格式,兼容 PyTorch、TensorFlow 框架,在邊緣計算場景的算力密度較前代提升 300%。
算法與模型層面的突破更為亮眼。幻方量化旗下的 DEEPSEEK 公司發布的開源模型 DeepSeek-V3,采用混合專家(Mixture-of-Experts)架構,擁有 6710 億參數,每個詞元激活 370 億參數,在代碼生成、數學推理等基準測試中超越多個海外開源模型,性能接近GPT-4。該模型的訓練效率尤為突出,在 14.8 萬億詞元的數據集上完成預訓練僅用 266.4 萬 GPU 小時,較同類模型減少 30% 的計算資源消耗。商業化應用也在快速推進,某法律科技公司使用DeepSeek-V3 處理海量法律文檔,信息提取效率提升 4 倍;某科技企業的智能客服系統通過該模型優化,客戶滿意度提高 28 個百分點。
更具戰略意義的是算力基礎設施的開放生態建設。2025 年 9 月,中科曙光在智博會上聯合華為、中興、浪潮信息、科大訊飛等 20 余家產業鏈伙伴,發布國內首個 AI 計算開放架構,涵蓋硬件接口規范、軟件適配標準、算力調度協議三大核心模塊。該架構支持多廠商芯片兼容,單集群可容納數萬顆 AI 加速芯片協同工作,峰值算力達每秒 10 的 22 次方次運算,能滿足千億級參數大模型的訓練需求。中科曙光總裁歷軍在發布會上強調:"AI計算的未來在于開放與協同。傳統封閉架構不僅限制了技術創新的速度,也推高了企業的應用成本。" 這種開放模式已初見成效,依托該架構建設的 "AI 計算開放架構聯合實驗室",已在金融風控領域實現跨機構數據協作效率提升 40%,模型準確率突破 95%。
結 語
站在 2025 年的時間節點回望,中國 AI 產業已走過 “卡脖子” 的焦慮期,進入 “體系化創新” 的新階段。
但挑戰依然存在。國家集成電路封測產業鏈技術創新戰略聯盟副理事長于燮康指出:“中國先進制程與國際領先水平仍有 3-5 年差距,高端芯片制造能力不足仍是短板。” 如何在保持開放協作的同時,突破核心制造技術,將是下一階段的關鍵任務。值得期待的是,隨著 AI 計算開放架構聯合實驗室等平臺的運作,以及產學研用協同創新機制的完善,國產 AI 產業正從 “單點突破” 轉向 “系統突破”,逐步形成可持續的技術創新能力。
英偉達的經歷則成為全球化時代技術競爭的經典案例 —— 試圖通過技術封鎖維持壟斷地位,最終卻加速了替代者的崛起。黃仁勛的警告猶在耳邊:“永久失去中國市場的風險真實存在。”
DeepSeek的UE8M0 格式證明,通過軟件算法創新可彌補硬件性能差距;中科曙光的開放架構表明,生態協同能打破壟斷格局;而信創芯片的加速迭代則顯示,產業鏈自主可控已具備現實基礎。這三大支柱相互支撐,正在構建一個 “模型 - 芯片 - 系統” 三位一體的國產 AI 生態體系。
一場靜悄悄的產業革命正在中國上演。這場革命的最終目標,不僅是擺脫對單一技術來源的依賴,更是要建立一種新的產業發展范式 —— 以創新驅動發展,以開放促進協同,以生態贏得未來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.