![]()
硅谷的科技巨頭們,正在為一份極不尋常的賬單買單。
每一次新品發(fā)布會(huì),PPT上反復(fù)強(qiáng)調(diào):晶體管數(shù)量又翻了多少倍、算力飆升了多少。所有人都在為這顆“大腦”的聰明程度歡呼。
但仔細(xì)翻開這筆算力賬單,你會(huì)發(fā)現(xiàn)一個(gè)值得警惕的錯(cuò)位:全行業(yè)的總開銷翻了一倍多,但給“大腦”的預(yù)算占比卻幾乎沒有增長(zhǎng)。
根據(jù)知名研究機(jī)構(gòu)Epoch AI的最新拆解數(shù)據(jù),從2024年初到2025年底,全球AI芯片的總組件支出從220億美元激增至520億美元。然而,代表著最頂尖制造工藝的“計(jì)算大腦”(主邏輯裸片),其成本占比卻始終停留在13%至14%。
![]()
這也就意味著,真正掏空科技巨頭口袋的,是負(fù)責(zé)“記憶”的倉(cāng)庫(kù)——內(nèi)存。
數(shù)據(jù)顯示,高帶寬內(nèi)存(HBM)在AI芯片組件中的成本占比,已經(jīng)從52%一路攀升至63%。在這300億美元的總支出增量里,單單是HBM這一項(xiàng),就貢獻(xiàn)了約200億美元。
![]()
這個(gè)數(shù)據(jù)為什么值得關(guān)注?
因?yàn)榇蟊娭豢吹搅嗽贫薃I芯片的算力狂歡,卻不知道這場(chǎng)看似高大上的算力競(jìng)賽,已經(jīng)變成了一場(chǎng)深刻的產(chǎn)業(yè)重構(gòu)。它不僅在重塑全球半導(dǎo)體資金的流向,甚至直接導(dǎo)致了我們身邊的廉價(jià)智能手機(jī),正在大規(guī)模萎縮。
大腦越來(lái)越便宜,“記憶”為何成了刺客?
大眾往往以為,眼下的AI爭(zhēng)奪戰(zhàn)依然停留在算法、架構(gòu)等“腦力”層面的比拼。但實(shí)際上,真正的戰(zhàn)爭(zhēng)早已悄然演變成了一場(chǎng)客觀的、物理的、生產(chǎn)線上的肉搏戰(zhàn)。
要搞懂這個(gè)錯(cuò)位,我們得先降維通俗地弄明白:AI芯片到底是個(gè)什么構(gòu)造?它和以前的電腦芯片有啥區(qū)別?
在傳統(tǒng)的通用芯片(CPU)時(shí)代,所有的架構(gòu)設(shè)計(jì)都在追求“單兵作戰(zhàn)能力”。你可以把CPU想象成一位絕頂聰明的頂級(jí)學(xué)者。為了不讓他浪費(fèi)時(shí)間去遠(yuǎn)處的圖書館(主內(nèi)存)找資料,工程師在學(xué)者的手邊塞滿了各種私人書架(緩存),甚至允許他“亂序執(zhí)行”,隨時(shí)找活干,絕對(duì)不讓他閑著。
但AI大模型根本不需要這種復(fù)雜的邏輯判斷,它要的是簡(jiǎn)單粗暴的暴力算術(shù)矩陣。
于是,GPU和TPU等AI加速芯片上場(chǎng)了。它們不再是單打獨(dú)斗的學(xué)者,而是數(shù)萬(wàn)名同時(shí)做加減乘除的流水線工人。這些芯片同樣是從硅晶圓(Wafer)上光刻下來(lái)的,但內(nèi)部結(jié)構(gòu)全是大規(guī)模并行的計(jì)算核心。
瓶頸隨之出現(xiàn):這群工人算得實(shí)在太快了!
打個(gè)比方,現(xiàn)在的各大AI芯片就像是一個(gè)班級(jí)里的尖子生,大家的計(jì)算能力都已經(jīng)極其強(qiáng)大。數(shù)據(jù)表明,過(guò)去20年里,硬件的峰值計(jì)算能力飆升了60,000倍,但內(nèi)存容量?jī)H僅提升了100倍,互連帶寬更是只提升了30倍。既然大家的做題速度(計(jì)算邏輯)都差不多且難以拉開巨大差距,比拼的重點(diǎn)自然就變成了最現(xiàn)實(shí)的物理?xiàng)l件:誰(shuí)能搞到最高規(guī)格的高帶寬內(nèi)存(HBM),以及誰(shuí)能在納米級(jí)的物理流水線上把這些數(shù)據(jù)最快地“喂”給大腦。
由于計(jì)算性能的提升速度,遠(yuǎn)遠(yuǎn)超過(guò)了內(nèi)存帶寬的改善速度,搬運(yùn)原材料(數(shù)據(jù))的通道徹底癱瘓了。這就是困擾了計(jì)算機(jī)界幾十年的物理學(xué)幽靈——“內(nèi)存墻”(Memory Wall)。
通道不夠?qū)捲趺崔k?行業(yè)祭出了一種技術(shù)難度極高、成本也極高的解法:高帶寬內(nèi)存(HBM)。
既然平鋪的通道不夠?qū)挘蔷桶袲RAM存儲(chǔ)芯片像蓋摩天大樓一樣垂直堆疊起來(lái),并在微觀層面上打穿無(wú)數(shù)孔洞與計(jì)算核心直接相連,實(shí)現(xiàn)超寬的數(shù)據(jù)通道。
但這玩意兒,大量消耗底層晶圓產(chǎn)能。生產(chǎn)1GB的HBM,需要吃掉相當(dāng)于普通DRAM三倍以上的晶圓產(chǎn)能。
利潤(rùn)分化與產(chǎn)業(yè)鏈重塑
當(dāng)?shù)讓泳A變成了零和博弈,整個(gè)產(chǎn)業(yè)鏈的資金流向就徹底變了。
原因很簡(jiǎn)單:普通商品內(nèi)存(就是你買電腦和手機(jī)里的內(nèi)存)的毛利率常年在20%至30%區(qū)間,而HBM的毛利率則達(dá)到70%以上。
面對(duì)這種級(jí)別的利潤(rùn)差異,存儲(chǔ)三巨頭(美光、SK海力士、三星)的動(dòng)作果斷而激進(jìn)。
老牌存儲(chǔ)大廠美光(Micron)在2025年12月發(fā)布了一份引發(fā)廣泛關(guān)注的決定,宣告其運(yùn)營(yíng)了29年的消費(fèi)級(jí)品牌Crucial(英睿達(dá))即將終結(jié)。隨后在2026年2月,美光正式停止了消費(fèi)端的所有發(fā)貨,將所有空出來(lái)的產(chǎn)能全面轉(zhuǎn)向利潤(rùn)更高、更具定價(jià)權(quán)的AI和企業(yè)級(jí)數(shù)據(jù)中心市場(chǎng)。
![]()
韓國(guó)雙雄更是大幅受益。2026年第一季度,靠著全數(shù)售罄的HBM訂單,SK海力士實(shí)現(xiàn)了72%的營(yíng)業(yè)利潤(rùn)率。三星電子的半導(dǎo)體部門同樣以70%以上的利潤(rùn)率,貢獻(xiàn)了全公司94%的利潤(rùn)。
現(xiàn)實(shí)代價(jià):消失的廉價(jià)手機(jī)
巨頭在云端數(shù)錢,終端手機(jī)廠商卻面臨直接沖擊。
晶圓都被抽走去造AI用的HBM了,普通手機(jī)用的標(biāo)準(zhǔn)內(nèi)存自然面臨斷崖式的缺貨。短短一年間,老一代的LPDDR4價(jià)格大幅上漲了250%,LPDDR5也上漲了220%。
![]()
在這波漲價(jià)潮中,手機(jī)的物料成本里,內(nèi)存占比從原本的15%左右,一路飆升到了最高50%。
結(jié)果就是,低端智能機(jī)在商業(yè)上已難以為繼。分析師指出,低于100美元的智能手機(jī)已經(jīng)“永久性不再經(jīng)濟(jì)”。原本賣50美元的手機(jī),現(xiàn)在因?yàn)閮?nèi)存太貴,被迫漲到120美元以上。
占據(jù)非洲近半壁江山的手機(jī)品牌傳音,2025年凈利潤(rùn)暴跌54%,被迫砍掉40%的出貨目標(biāo)。Oppo和Vivo也分別削減了超20%和近15%的預(yù)期。在印度,100美元以下的手機(jī)市場(chǎng)在2026年一季度同比萎縮了59%。
硅谷扇動(dòng)了一下名為AI的翅膀,使得亞非拉低價(jià)位市場(chǎng)用戶的數(shù)字接入門檻大幅抬高。
下半場(chǎng):封裝瓶頸與AI創(chuàng)投的“破局”之路
內(nèi)存吃掉了AI芯片63%的成本,但這還不是唯一的門檻。
再貴的HBM和邏輯計(jì)算芯片,也必須通過(guò)臺(tái)積電的CoWoS等先進(jìn)封裝工藝,極其精密地縫合在微縮底板上。這道工序目前是真正的物理卡脖子環(huán)節(jié)。臺(tái)積電CEO魏哲家直言,CoWoS產(chǎn)能極度吃緊,到2026年都已完全售罄。英偉達(dá)甚至提前包攬了超過(guò)60%的產(chǎn)能。
那么,未來(lái)的商機(jī)和趨勢(shì)究竟在哪?
隨著行業(yè)從早期的“模型訓(xùn)練”走向大規(guī)模的“AI代理(Agentic AI)”推理,模型需要保持長(zhǎng)時(shí)間的記憶和極長(zhǎng)的上下文,這讓“內(nèi)存墻”的壓力成倍放大。為了破局,行業(yè)分化出了兩條路:
第一條路,是英偉達(dá)的“暴力加碼”。
2026年投產(chǎn)的新一代Rubin架構(gòu),就是為極致吞吐量而設(shè)計(jì)的。單顆Rubin GPU不僅塞進(jìn)了3360億個(gè)晶體管(是上一代的1.6倍),更首發(fā)搭載了容量高達(dá)288GB的HBM4內(nèi)存,帶寬達(dá)到驚人的22 TB/s。而美光的HBM4目前正以兩倍于上一代的速度快速爬坡,專供Rubin。英偉達(dá)的目標(biāo)是用極高的內(nèi)存帶寬,把推理成本打下來(lái)。
第二條路,是初創(chuàng)公司的“從架構(gòu)底層破局”。
既然邏輯計(jì)算本身只占13%的成本,那只要能盡量繞開昂貴的HBM,就能重塑整個(gè)算力市場(chǎng)的利益分配。2026年,初創(chuàng)公司MatX拿到了5億美元B輪巨額融資。他們?cè)O(shè)計(jì)了一款基于“可拆分脈動(dòng)陣列”的專用芯片,利用SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)的超低延遲特性來(lái)直接搞定長(zhǎng)文本推理。歐洲初創(chuàng)公司Semidynamics也剛剛在臺(tái)積電3nm工藝上流片,主攻減少數(shù)據(jù)移動(dòng)的AI推理新架構(gòu)。
而在終端租賃市場(chǎng),算力正在逐漸褪去神秘且昂貴的光環(huán)。
華爾街已經(jīng)推出了追蹤GPU租賃價(jià)格的“硅數(shù)據(jù)指數(shù)”(Silicon Data Indices),像炒大豆、炒原油一樣每天盯盤算力的現(xiàn)貨價(jià)格。在2026年的現(xiàn)貨平臺(tái)上,曾經(jīng)一卡難求的H100,其小時(shí)租賃底價(jià)已經(jīng)被Thunder Compute等平臺(tái)打到了驚人的1.38美元/小時(shí)。
算力大宗商品化的時(shí)代已加速到來(lái)。在這個(gè)劇烈的周期波動(dòng)中,真正稀缺且昂貴的,不再是單純的“大腦計(jì)算能力”,而是數(shù)據(jù)的流轉(zhuǎn)、存儲(chǔ)的吞吐,以及納米級(jí)基板上的物理封裝手藝。看懂這張被內(nèi)存主導(dǎo)的錯(cuò)位賬單,才是真正摸清巨頭底牌的開始。(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 林深)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.