![]()
作者 | 山竹
出品 | 鋅產業
在飛機經停阿拉斯加加油間隙,拿到了”通行證“的黃仁勛終于匆匆趕到,成了這次中國之旅最后一位登機的乘客。
對于中國市場,英偉達掌舵者黃仁勛有著一肚子的期待和憂慮。
就在前不久的一檔播客節目中,黃仁勛曾公開表示,如果DeepSeek這一中國領先的大模型率先在華為芯片上完成優化并高效運行,將是“對我們國家而言可怕的結果”。
黃仁勛這里提到的“我們國家”指的是美國,在此之前,美國已經禁止英偉達向中國出售“先進的人工智能芯片”,而在黃仁勛給出上述論斷之前,已經有媒體爆出DeepSeek這代旗艦模型V4將全面遷移至華為昇騰950PR。
DeepSeek模型與華為芯片的深度適配正在加速中國本土算力棧的成熟,也在削弱英偉達長期構建起的生態優勢。
這是老黃最不想看到的。
實際上,早在去年黃仁勛就曾多次公開表示,受美國禁令影響,英偉達在中國AI加速器市場的份額已經從約95%驟降至0%,“我們已經100%退出了中國市場。”
與此同時,黃仁勛也一再強調,中國AI的發展“無論有沒有英偉達都會前進”。
從英偉達“退出”中國市場之后,中國AI市場的表現來看,也確實證實了黃仁勛的判斷。
不過,作為全球AI雙主線之一,中國AI市場是英偉達無法放棄的那個市場。
而深知中國AI市場重要性的黃仁勛,也就更需要這次破冰之旅。
01 AI之戰,改變算力格局
在這場全球AI競賽中,中美雙線主戰場格局已經悄然確立。
美國擁有OpenAI、Anthropic等在基礎模型上有先發技術優勢的公司,中國憑借全球最活躍的用戶基礎、海量的數據和最具潛力的應用市場,形成了獨特的后發競爭力。
在用戶、市場、創業團隊三重驅動下,中國大模型迅速崛起,字節跳動豆包、阿里通義千問、DeepSeek,以及中國大模型“四小龍”、“六小虎”共同將國內大模型的熱情具象化。
這其中,2025年初問世的DeepSeek,是中國大模型的一個轉折點,也是全球人工智能技術發展的一個轉折點。
![]()
如果說在此之前,全球大模型團隊信奉的是Scaling Law,是暴力美學和大力出奇跡,那么,在DeepSeek問世后,大家開始意識到,原來大模型訓練還有其他路徑。
初代DeepSeek通過重新設計訓練流程、以少量的SFT數據外加多輪強化學習,在提高模型準確性的同時,顯著降低了內存占用和計算開銷,從而極大地降低了大模型的使用成本。
如果說ChatGPT是大模型來臨在西方的一個劃時代標志,那么,DeepSeek則是大模型落地在東方的工程實踐開端。
在此之后,我們能夠看到的是,全球大模型生態像是被加入了一勺“老干媽”,開始興奮起來,智能體在B端開始得到推廣應用,甚至催生出了大模型一體機這樣一類獨特的時代產物。
C端也相繼出現了一些智能體應用,其中成為爆款產品的,一個是由中國團隊孕育而出的Manus,另一個是由美國開發者開發的OpenClaw。
![]()
大模型的戰事升級,尤其是大模型從基模訓練到應用落地的轉變,也在悄悄影響著全球算力生態結構。
首先是在大模型傳播鏈路中,相當一部分算力需求從訓練開始向推理開始轉移,市場需要的不再僅僅是高性能的GPU,異構算力成為主流趨勢,這也讓CPU芯片巨頭英特爾迎來了新的轉機;
其次是大模型在國內大型國央企的推廣應用,催生了對國產算力的需求,而英偉達在一紙禁令之下,更是加大了國產算力的需求,華為、寒武紀、中芯國際等在過去兩年里的產能需求不斷攀升,就連國內幾家互聯網巨頭,也在一邊真金白銀在投資國產GPU四小龍,一邊在自研AI芯片。
![]()
一場自云計算“去IOE”之后的又一場國產化戰役就此浮出水面,這其中尤以DeepSeek V4遷移至華為昇騰950PR影響最為深遠。
英國路透社在4月底的一篇報道中就曾指出,在DeepSeek V4遷移至華為昇騰950PR消息一經公布后,國內包括字節、阿里、騰訊在內的互聯網巨頭都開始與華為接洽,商談芯片訂單事宜。
這時,距離黃仁勛公開表示英偉達已經(被迫)全面退出中國市場,僅僅只有幾個月。
這樣的替代進程,尤其是開發者與模型廠商逐步轉向本土技術棧,讓英偉達原本基于CUDA建立起的技術護城河,面臨著前所未有的危機。
![]()
更重要的是,想要取代英偉達,成為下一個英偉達的,不只有華為,國產GPU四小龍的崛起,無一不是以蠶食英偉達市場份額、乃至取代英偉達為終極目標,這些“中國版英偉達”也將成為英偉達再次回到中國市場的直接競爭對手。
也是英偉達曾經在中國AI芯片市場獨占95%市場份額時,不曾覺得會是威脅的競爭對手。
而在這個英偉達無法進入的全球第二大AI市場,正在構建著一個與英偉達無關的AI生態,這是如今的英偉達無法接受的。
02 英偉達,無法再一家獨大
英偉達,依然是AI算力領域的絕對頭部,甚至沒有之一。
即便是DeepSeek V4用上的華為昇騰950PR,雖然性能已經是英偉達H20的2.87倍,但仍不及英偉達H200。
這也是英偉達曾經能在中國AI市場占據超95%份額的主要原因。
不過,也正是由于英偉達過于強大,甚至比當年的英特爾更甚(英特爾當年尚有AMD“制衡”),尤其是CUDA生態的強大,讓全球科技巨頭對它是又愛又怕。
愛它帶來的算力強大,又怕它一家獨大,自己的命運被這家公司握在手中。
![]()
因而,在國外,肉眼可見的是,無論是谷歌、亞馬遜等科技巨頭,還是OpenAI、Anthropic這些AI獨角獸,這些算力應用大戶,或在自研芯片,或在找英偉達之外的供應商進行合作。
不將自己綁定在一家供應商身上,哪怕這家供應商能夠提供全球最好的產品,這似乎成了進入全球產業大分工時代后一個不成文的規定。
尤其是,在算力成本越來越成為頭部科技公司的一項巨額開支時,自研芯片項目提上日程也就順理成章。
例如,谷歌早在2013年就啟動了自研TPU項目,在前不久的Cloud Next大會上,第八代TPU也正是亮相。
值得注意的是,同樣是意識到了智能體規模化應用帶來的推理需求暴增,谷歌在第八代TPU中首次分拆出兩條獨立產品線——用于模型訓練的TPU 8t,以及用于實時推理的TPU 8i。
![]()
摩根大通在研報中給出的分析是:
TPU 8t采用Virgo Network fabric將集群擴展到單集群百萬芯片以上,峰值性能約為上一代Ironwood的3倍,旨在壓縮萬億參數級大模型的訓練時間;
TPU 8i采用boardfly網絡拓撲,片上SRAM提升約3倍,核心目標是突破智能體推理在規模化時遭遇的延遲與內存瓶頸。
至于另外一家科技巨頭、也是云計算巨頭,亞馬遜自研芯片始于2018年,隨后幾年發展迅猛,從2025年底AWS CEO Matt Garman在re:Invent 2025上公布的數據來看,AWS已經部署了超100萬顆Trainium系列自研芯片,這項業務每年為AWS帶來了數十億美元的營收。
![]()
在2026年4月底新一季的電話會議上,亞馬遜CEO Andy Jassy更是直言稱,亞馬遜自研芯片業務在數據中心領域已經達到全球前三,如果獨立運營,年營收將會達到500億美元。
再看全球AI獨角獸,OpenAI早在2023年就啟動了自研芯片項目,Anthropic則在前不久對外宣布,承諾未來五年向谷歌云支付約2000億美元,用于采購5GW的TPU算力和云服務。
在此之前,風頭已經蓋過OpenAI的Anthropic,分別拿了谷歌、英偉達、亞馬遜的投資,并與三者均保持著AI芯片采購關系。
這樣看來,我們不得不說,當年英特爾能夠容忍AMD的存在,除了可以避免觸及美國反壟斷法律外,某種意義上而言,也為英特爾后來在全球持續擴張自己商業帝國,避免了不少麻煩。
03 英偉達,如何重新匹配中國市場?
再次來到北京,黃仁勛心情極好,在南鑼古巷一路吃了炸醬面、喝了蜜雪冰城,甚至還品了老北京豆汁兒,網上一時間還傳出了黃仁勛南鑼古巷復刻路線。
黃仁勛之所以能有如此好的心情,與他此次作為美國總統中國之行隨行人員取得的成果不無關系。
據路透社援引知情人士消息稱,美國商務部已批準阿里、字節、騰訊、京東、聯想等約10家中國企業購買英偉達H200芯片,每家最高可購買7.5萬顆H200芯片。
對于英偉達而言,這無疑是一個天大的好消息。
![]()
我們在前文中提到過,即便是現在,英偉達H200依然是一顆很能打的芯片,也是國內不少科技巨頭曾經夢寐以求的芯片。
然而,這時這顆芯片在補齊進入國內市場的手續后,國內科技巨頭或許要面臨另一個頭疼的問題。
能買到H200,要不要買?
當然要買。
但買來后,該如何使用呢?
我們在前文中也提到過,為了降本增效,國外科技巨頭都在自研芯片,如果再看國內市場,在經歷過芯片禁令后,國內科技巨頭自研芯片的動力更甚。
百度自研芯片早在2011年就已經開始,當時同樣是為了降低芯片使用成本,阿里自研芯片則是從2018年開始,如今在國內AI算力熱潮中,兩家公司不約而同將AI芯片業務分離出來,其中,百度的昆侖芯也即將在港股上市。
![]()
那么,國內科技巨頭自研芯片布局,會對英偉達帶來怎樣的影響呢?
如今的模型與AI芯片的優化是雙向的,大模型的訓練與推理需要與具體芯片架構深度磨合,模型開發者會針對芯片的內存帶寬、Tensor Core、互聯拓撲、量化支持等特性進行優化,包括算子融合、并行策略、混合精度等。
這反過來也會推動芯片架構針對主流模型負載進行迭代,形成正向循環。
英偉達CUDA的成功,正是因為它與全球領先模型共同演化,積累了海量優化庫和最佳實踐。
更進一步的是,芯片研發路徑有時會出現“模型驅動定制”的獨特模式——針對特定大模型或負載場景,開發專用優化甚至定制芯片能極大提升能效和性能,谷歌在第八代TPU中拆分出針對訓練和推理場景的芯片也是類似的原因。
![]()
正因如此,如果英偉達長期缺席中國市場,必將無法參與中國領先模型的聯合打磨,無法在這一全球最大應用市場積累針對性優化,這將導致其芯片在未來中國場景下的競爭力下降。
優秀的模型也能反向驅動芯片架構演進,而本土模型-芯片的閉環迭代或將催生出更適應中國數據和應用的新路徑。
這一路徑背后的邏輯是:
中國擁有全球約一半的AI研究人員、龐大的終端消費者和產業場景,應用創新速度極快,DeepSeek等模型的低成本高性能路徑,進一步降低了AI落地門檻,讓更多中小企業和行業參與了進來,算力需求隨之從集中訓練擴展到分布式、邊緣與智能體持續運行,這要求芯片不僅性能強大,還需成本可控、易部署和生態友好,國產算力方案正是圍繞這些需求在演進。
實際上,諸如DeepSeek V4率先在華為昇騰950PR上實現生態適配這樣的國產模型率先在國產芯片上適配的模式,未來或將不是個例。
在這樣的局面之下,英偉達如何在國內繼續保持自己的生態優勢,成了一個值得黃仁勛思考的問題。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.