![]()
文|錢眼君
來源|博望財經
歲末年初,中國資本市場的聚光燈前所未有地聚焦于黃浦江畔。一場聲勢浩大的“GPU旋風”正席卷而來:在不到一個月的時間里,沐曦股份、壁仞科技、天數智芯三家扎根上海的GPU企業密集登陸資本市場,而與其并稱“上海GPU四小龍”的燧原科技,也已完成IPO輔導,即將為這場盛宴落下最后一塊拼圖。
從科創板首日暴漲692.95%的造富神話,到港交所超2300倍的驚人認購紀錄;從百億級的IPO募資規模到千億市值俱樂部的批量誕生,國產GPU企業正以其凌厲的資本攻勢,宣告著國產算力產業一個新時代的來臨。
這并非偶然的資本狂歡。沐曦股份憑借在手訂單14.3億元及"千卡集群"的商業化落地,上市首日市值即突破3000億元,創下多項紀錄;壁仞科技作為"港股國產GPU第一股",獲得23家基石投資者力挺;天數智芯則以首家實現國產7nm訓練推理通用GPU量產的身份,攜覆蓋20多個行業的業績登陸港交所。
然而,光環之下亦有隱憂:天數智芯三年半累計虧損超28億元,壁仞科技同期虧損超63億元,揭示出這個高投入、高風險行業在搶占窗口期時的"流血沖鋒"本質。
這是一場關乎智能未來的產業競速賽:一邊是國際巨頭以"黃氏定律"般的速度壘高技術壁壘,一邊是中國本土力量在資本與政策的雙重加持下集體破局。而要理解這場競賽的深層邏輯,我們必須回溯GPU從游戲配件到算力核心的蛻變之路。
01
定義核心:從圖形助手到算力引擎的蛻變
在探討這場席卷全球的算力革命之前,我們先來厘清一個核心概念——GPU。GPU全稱Graphics Processing Unit,圖形處理器。我們常聽說的CPU(Central Processing Unit)是指中央處理器,它與GPU的核心差異在于架構設計:CPU通常擁有少數幾個強大的核心,擅長處理復雜的通用串行任務,如同一位能解奧數題的中學生;而GPU則集成數千個相對簡單的核心,專為處理海量同質化的并行任務而生,好比幾百個小學生協作完成數萬道加減法。
![]()
圖:GPU在計算機中的位置,公開資料整理。
如果說CPU是計算機的"大腦",負責決策與控制,那么GPU則是專精于"大規模重復勞動"的"肌肉",其并行計算的天性,使其在圖形渲染和高效能矩陣運算(人工智能的核心)中的效率遠超CPU。
隨著5G與人工智能時代的到來,數據中心內機器學習等AI計算已占據總計算量的四分之一到三分之一,大數據處理的重任正從CPU向算力更強的GPU轉移。GPU的應用早已超越傳統的個人電腦圖形顯示,其形態按接入方式可分為獨立與集成;其疆域已擴展至移動設備、數據中心服務器與個人電腦等多個場景。尤其在AI與云計算浪潮下,GPU憑借其與生俱來的并行計算優勢,成為了數據處理的核心引擎,開辟出一個規模空前的增長市場。盡管FPGA和ASIC等更為專用的計算芯片也在特定領域嶄露頭角,但行業共識在于,GPU憑借其卓越的通用性、成熟的軟件生態(尤其是英偉達的CUDA)及強大的綜合算力表現,仍是當前AI計算領域無可爭議的霸主與主導架構。
這一定位,是理解其萬億級產業價值的邏輯起點。
02
GPU從哪來:一部從游戲顯卡到AI基石的創業史
GPU產業的崛起,是一部典型的硅谷技術創業史詩,而其主角無疑是英偉達(NVIDIA)。故事的開端可追溯至1989年——幾位工程師共同勾勒了一款新圖形加速器的藍圖。1993年,英偉達正式成立,開始的創業之路充滿坎坷,至1995年,公司面臨設計出芯片卻無資金建廠制造的困境。創始人黃仁勛致信臺積電創始人張忠謀求助,并成功獲得支持。
這段合作被黃仁勛本人視為關鍵轉折:"如果當初我自己建廠生產GPU芯片,我現在可能就是一個守著幾千萬美元的公司的安逸的CEO。"臺積電的代工模式讓英偉達得以輕資產運營,聚焦設計與創新,從而快速迭代產品,搶占市場。
1999年,英偉達做出了兩個定義行業的舉動:一是徹底轉型專注于顯卡芯片,二是首次在全球提出"GPU"這一革命性概念(但在提出這個概念以后的相當一段時間內,GPU還僅僅用于圖形處理,遠不像現在這般如雷貫耳)。同年,公司在納斯達克上市,市值達6.26億美元,開啟了長達二十余年的高速增長傳奇。
然而,硬件性能的領先并非其構筑護城河的終極武器。真正的"神來之筆"發生在2006年,英偉達在推出新一代GPU的同時,發布了具有劃時代意義的CUDA計算平臺。CUDA即Compute Unified Device Architecture,統一計算架構,本質上是一套軟件工具,它讓開發者能夠以前所未有的便捷性,調用GPU的強大算力進行通用計算(GPGPU),這為后來深度學習的爆發埋下了伏筆。
起初,CUDA的商業價值并未被市場立刻接受。但英偉達展現出了驚人的戰略耐心與遠見:向全球高校和研究所免費開放并設立研發中心;以資金扶持創業公司使用;持續開源核心軟件庫;甚至確保廉價的消費級游戲顯卡也支持CUDA,將開發門檻降至千元級別。
經過十余年不計短期回報的持續灌溉,CUDA逐漸從一款開發工具,演進為高端計算與圖形領域的事實標準,構筑了堪比操作系統般的深厚生態壁壘。即便競爭對手的GPU硬件性能參數相近,但在AI開發社區的受歡迎程度卻有天壤之別,核心差距就在于CUDA所帶來的開發效率與計算效能倍增。
![]()
圖:關于CUDA的描述,來自英偉達官網
直到2014年前后,英偉達將CUDA與AI計算完美融合,英偉達的騰飛才真正開始。如今,CUDA連接了全球數百萬開發者,使英偉達GPU成為AI時代事實上的"計算貨幣",其護城河之深,已難以用單純的晶體管數量或浮點算力來衡量。這也能說明為何國產GPU公司很難實現快速超車。
03
技術爭鋒:HBM、架構迭代與性能軍備競賽
驅動GPU產業以"黃氏定律"速度(顯示芯片性能每6個月提升1倍,AI算力在8年內實現千倍增長)前進的,是持續不斷的技術創新與白熱化的性能軍備競賽。筆者梳理發現,當前的技術角逐主要集中在3個關鍵維度:
1、存儲技術的躍遷
算力的爆炸式增長,不僅需要強大的"引擎"(GPU核心),更依賴于能夠實時"喂飽"引擎數據的"高速糧道"。自2017年起,英偉達便在高端AIGPU(如A100、H100)中率先采用HBM(高頻寬存儲器)技術。
這與傳統的GDDR(Graphics Double Data Rate)內存有本質不同:GDDR作為傳統的內存技術,提供了平衡的性能和成本,適用于廣泛的圖形應用,而HBM則更專注于提供高性能、高帶寬以及更能效的解決方案,適用于對數據傳輸速度和能效要求更高的領域。在結構上,GDDR是一種傳統的圖形內存,通常以單個芯片的形式存在,它的設計比較扁平,內存芯片以并行方式連接到圖形處理單元(GPU)。HBM通過3D堆疊、硅通孔(TSV)等尖端封裝工藝,將多層DRAM芯片像蓋樓一樣垂直堆疊,并與GPU邏輯芯片通過硅中介層緊密集成。這種設計帶來了革命性優勢:HBM擁有數倍于GDDR的帶寬和更低的功耗,但代價是結構極度復雜、成本高昂。
![]()
圖:H200,英偉達官網
以英偉達2023年底發布的H200 GPU為例,它首次搭載HBM3e,顯存帶寬高達4.8TB/秒,用于700億參數大模型推理時,速度是前代H100的1.9倍,能耗卻降低一半。這清晰表明,突破"內存墻"是算力持續進化的生死線。
2、架構平臺的高速代際飛躍
GPU行業中,很多企業把英偉達當成終極目標,但筆者看來,一個殘酷的事實是,這個終極目標并非原地不動等待超越,而是仍在向前狂奔,保持著約兩年一次架構升級的殘酷節奏。其下一代平臺"Rubin"已提上日程,計劃于2026年量產。Rubin不再僅僅是單一的GPU芯片,而是一個整合了Rubin GPU、專為AI推理設計的Vera CPU、新一代NV Link交換機芯片、高速網卡的龐大計算系統。其中,Rubin GPU的關鍵指標呈現跨代躍升:FP4推理性能預計達到當前Blackwell架構的5倍。這場競爭已從單一的"芯片對決"升級為"系統平臺戰爭",比拼的是從芯片到集群的全棧優化能力。
3、圖形與計算的雙重挑戰
盡管AI計算是當前最大的風口,但圖形顯示功能本身的技術壁壘實際上更為森嚴。硬件結構上,一顆完整的GPU需要集成光柵化、紋理貼圖、光線追蹤等為圖形專門優化的硬件單元,其復雜程度遠超專注于矩陣計算的AI芯片;算法上,圖形處理涉及計算機圖形學,需要融合物理模擬、光學渲染等多學科知識,算法難度極高。
因此,能夠同時駕馭高性能圖形渲染與通用AI計算的"全功能GPU",代表了芯片設計領域的皇冠明珠,這也是諸多國產GPU廠商將"全功能"作為核心戰略方向的原因。
當國際巨頭在技術前沿高歌猛進,用一代代產品定義著算力標準時,一個關鍵問題擺在全球產業面前:在這條被巨頭劃定的賽道上,后來者還有機會嗎?中國的答案,正在上海張江的實驗室里、在資本市場的鑼聲中、在一張張累計虧損數十億的財務報表背后,悄然書寫。從技術追隨到生態破局,國產GPU的征途,遠比想象中更加艱難,也更加波瀾壯闊,我們下篇繼續分析。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.