无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI半導體終局推演2026：當“Token經濟學”從GPU算力轉向HBM

2026-05-01 07:03:00　來源: 邏輯與常識

江蘇舉報

0

分享至

如果把這輪AI浪潮拆開來看，你會發現一個正在發生的根本性轉移：衡量價值的核心，不再是GPU的算力本身，而是“每單位成本能產出多少Token”。

本篇文章試圖回答一個市場反復糾結的問題—— 為什么每一代GPU，對HBM的需求幾乎注定是指數級增長？更關鍵的是，這種增長為什么不會像過去那樣中途停滯？這也是我長期買多三星和海力士的理論基礎（憑借這個看多的論點，近一個月本人美股的收益率78%）。

一、一個被忽視的第一性原理

在當前架構下，可以把AI推理的本質簡化為一句話：

Token吞吐量 ≈ HBM容量 × HBM帶寬

這不是一個經驗結論，而是從系統結構推導出來的硬約束。

換句話說： GPU的上限，不再由算力單獨決定，而是被HBM的兩個維度“鎖死”。

二、為什么過去的內存不重要？

要理解今天，必須先回到CPU時代。

在那個階段，整個產業的核心KPI只有一個：性能（performance）。 CPU不斷通過提高頻率、超標量執行（superscalar）、亂序執行等方式去“跑得更快”。

而內存（DDR）在體系中的角色，其實非常邊緣。

為什么？

第一，CPU擅長“掩蓋延遲” 通過多級緩存（L1/L2/L3）、寄存器重命名、超大亂序窗口等機制，把對內存的依賴盡可能隱藏。

第二，絕大多數負載根本不缺帶寬無論是本地應用還是云端任務，DDR帶寬長期處于“過剩狀態”。

結果就是：即便內存速度翻倍，對CPU性能的提升往往不到20%。

這直接導致一個現實：從DDR3到DDR5，技術迭代拉長到十多年，容量增長也極其溫和——十年大約3倍。

本質上，DRAM在CPU時代只是“配角”：它的升級，對核心KPI幾乎沒有決定性影響。

三、AI時代：KPI被徹底改寫

進入生成式AI時代，一切都變了。

GPU不再圍繞“算力跑分”，而是圍繞兩個指標： ? 單位成本的Token產出（核心商業指標） ? Token生成速度（用戶體驗指標）

這就是所謂的“Token經濟學”。

在這個框架下，系統優化的目標變成一條曲線：在吞吐量（throughput）和速度（latency）之間，盡可能逼近最優邊界（Pareto frontier）。

NVIDIA提出“AI工廠”的概念，本質就是一件事：用最低成本，產出最多Token，同時盡可能快。

四、關鍵轉折：從單卡到系統級“Token工廠”

在早期單卡GPU時代（batch size≈1），邏輯很簡單： ? Token吞吐 ≈ HBM帶寬

但進入類似NVL72這種系統架構后，一切復雜起來： ? 72個GPU + 多CPU協同 ? 推理從“單線程”變成“系統級并行”

此時，Token吞吐被拆成兩個變量：

Token吞吐 = 批處理規模（Batch Size） × 單用戶Token速度

五、第一個瓶頸：HBM容量（Size）

為什么Batch Size受限？

因為每一個請求都會占用一塊KV Cache，而這部分數據必須常駐HBM。

隨著Batch增加：

KV Cache線性增長
所有數據必須同時駐留在HBM中

于是得到一個剛性約束：

Batch Size的上限，本質取決于HBM容量

可以把它理解成機場擺渡車：

車廂大小 = HBM容量
一次能拉多少人 = Batch Size

車太小，再多人也得分批運，吞吐上不去。

六、第二個瓶頸：HBM帶寬（Bandwidth）

再看單用戶Token速度。

在大模型的decode階段，每生成一個Token，都需要：

多次讀取權重
高頻訪問KV Cache

而這些操作的瓶頸，不在算力，而在數據搬運速度。

于是得到第二個結論：

Token生成速度 ≈ HBM帶寬

繼續用剛才的比喻：

車門寬度 = 帶寬
門越寬，上車越快

即使車很大（容量高），門太窄（帶寬低），整體效率仍然很差。

七、把兩件事合在一起

現在可以得到一個更清晰的表達：

Token吞吐 = Batch Size × Token速度 ≈ HBM容量 × HBM帶寬

這就是AI推理時代最核心的硬件公式。

也意味著一件非常重要的事：

如果Token吞吐要“每代翻倍”，那么HBM容量 × 帶寬的乘積，也必須同步翻倍。

八、為什么這一次“周期不會重演”？

市場爭議的核心在這里：

歷史上，DRAM也是周期品—— 需求上漲 → 廠商擴產 → 供給過剩 → 周期下行

那HBM會不會重蹈覆轍？

問題在于，這次的需求結構完全不同。

過去：

DRAM需求來自設備數量增長
屬于“可波動需求”

現在：

HBM需求直接綁定Token吞吐
屬于“系統剛性需求”

只要AI系統還在追求更高吞吐：

GPU必須升級
而GPU的上限被HBM鎖死

這是一種供給側被動驅動的需求，而不是需求側自發波動。

九、軟件會不會改變這一切？

一個常見誤區是： “軟件優化可以降低對HBM的需求。”

這在邏輯上是站不住的。

原因很簡單：

軟件優化 ≠ 可以停止硬件進步

就像CPU一樣：

軟件可以更高效
但CPU每一代仍必須跑分更高

否則就沒有商業價值。

GPU也是同理：

無論軟件如何優化，Token吞吐這個KPI必須持續提升。

只要這個目標不變： ? 對HBM容量的需求不會下降 ? 對HBM帶寬的需求也不會下降

十、真正的變化：HBM走上舞臺中央

在CPU時代，內存是配角。在AI時代，HBM成為“天花板”。

它不再是錦上添花，而是決定系統上限的核心變量。

甚至可以說：

GPU的競爭，本質正在轉化為HBM能力的競爭。

十一、最后的問題

當需求被“物理規律”鎖定為指數增長后，故事只剩下一個懸念：

過去三十年里，存儲行業反復上演同一個劇本—— 在繁榮中擴產，在擴產中崩盤。

那么這一次——

當HBM成為AI時代的剛性基礎設施，供給側的三大玩家，還會不會再次把自己拖入周期的深淵？

關注我，我們一起埋伏在大部隊前進的路上。

這里是《邏輯與常識》，用邏輯看市場，用常識做投資。

如果這篇文章對你有幫助，轉發給同樣在投資路上摸索的朋友。

早七點準時發文

大家好，我是江南君，一個路見不平一聲吼的老boy。

做過監理，行政，金融，設計，干過培訓，超市，餐飲，投資，外貿……目前常住越南。

喜歡寫點文字，思考點人生，管管閑事。

多年后，當后人問我對社會做了哪些貢獻時，我會自豪地說，面對事實，我做了誠實的記錄和評論。

為防失聯，加好友（67932342）

投資認知類文章

10萬+文章

【社會】

【社會】

【社會】

【社會】

【社會】

【社會】

【時事】

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

一文看懂芯片產業鏈：誰在撐起AI時代的算力帝國

鈦媒體APP 2026-06-09 13:41:35
3 跟貼 3
PalantirCEO怒懟模型廠賣Token就是收AI稅，軟件公司第一個被打殘

DeepTech深科技 2026-07-03 20:38:32
0 跟貼 0

多名演員發文抵制！業內人士：很悲哀，收入猛降八成，幾乎成“免費勞動力”

浙江之聲 2026-07-04 08:13:16
3342 跟貼 3342

Token吃掉三成工資！硅谷AI賬單失控了

新智元 2026-07-04 13:11:45
0 跟貼 0
阿里為什么全面禁用Claude Code

第一財經資訊 2026-07-03 23:44:21
266 跟貼 266

訂單排到2027年，誰在支撐人形機器人的“量產元年”？

鈦媒體APP 2026-07-04 15:50:17
0 跟貼 0

OpenAI要怎么賣廣告

鈦媒體APP 2026-07-04 16:00:09
0 跟貼 0
諾貝爾經濟學獎得主：我們可能正處于AI帶來的金融泡沫之中

每日經濟新聞 2026-06-18 00:37:52
0 跟貼 0

2001年諾貝爾經濟學獎得主邁克爾?斯賓塞：AI有望抵消風險推升勞動生產率

每日經濟新聞 2026-05-19 04:22:18
0 跟貼 0
Meta為什么必須做“云”

鈦媒體APP 2026-07-03 17:34:13
1 跟貼 1
內存正在毀掉一切，所有的AI都要算力

愛范兒 2026-05-13 09:43:34
11 跟貼 11
Anthropic被曝造芯！挖OpenAI老兵，密談三星2nm

新智元 2026-07-03 12:35:44
6 跟貼 6
Steam主機首現"死亡紅線"故障開機僅20分鐘GPU報廢

3DM游戲 2026-07-03 18:28:05
14 跟貼 14
首個三模式大語言模型：4倍token吞吐量，長文本秒級時代要來了？

機器之心Pro 2026-05-22 14:21:21
0 跟貼 0
《鬼武者：劍之道》發售日提前從9月25日提前至4日

3DM游戲 2026-07-02 09:06:57
0 跟貼 0
佛得角對陣3個世界冠軍90分鐘不敗

紅星新聞 2026-07-04 08:11:01
10113 跟貼 10113
為什么航母速度都在30節左右，30節換成汽車的速度是多快？

可樂愛微笑 2026-07-04 14:08:14
0 跟貼 0
車機卡頓真相：300匹馬力的性能車，竟被一顆1.6GHz芯片拖垮

硅嶼手記 2026-07-03 00:17:54
0 跟貼 0
史上最強的 MacBook 要來了，蘋果要 All in AI

愛范兒 2026-07-04 10:52:47
11 跟貼 11
《灰燼之城》PC配置需求引發爭議最低要求32G內存

3DM游戲 2026-07-02 11:45:17
16 跟貼 16
泰山景區回應修建滾筒式刀片刺繩隔離鐵絲網：與正常游覽路線不交叉不重疊

北京日報客戶端 2026-07-02 08:55:17
20357 跟貼 20357
海歸博士回國創業，一年狂飆4倍，拿下3000億元市值

鈦媒體APP 2026-07-04 16:00:23
0 跟貼 0
美女竟然把墻泚裂了？小伙趕緊上前理論，下幕根本沒眼看

新人類笑說 2026-07-02 16:44:32
1 跟貼 1
趁火打劫！GPT-5.6三大模型全曝，定檔7月7日？

新智元 2026-07-04 13:16:22
0 跟貼 0
那些“喪心病狂”的老六顧客：出牌不按常理，老板的CPU差

人間閑散客 2026-07-03 15:46:43
1 跟貼 1
網約車被別車后，司機當場下車追過去理論，后座乘客都懵了！

牛牛愛搞笑哦 2026-07-02 15:56:34
16 跟貼 16
任天堂稱Switch 2游戲機生產成本將持續上漲

IT之家 2026-07-04 07:40:04
4 跟貼 4
美媒：臺富豪認為臺海緊張局勢正惡化資產涌向新加坡

澎湃新聞 2026-07-03 22:22:09
1454 跟貼 1454
趙祥松｜韓紅的人設，敗給了自己的嘴

祥松談 2026-07-04 16:38:36
0 跟貼 0
美大使裝無辜：好失望你們在中國肯定不自由

澎湃新聞 2026-07-04 13:04:08
63 跟貼 63
盤點：5款Windows游戲掌機，迷你主機進化可行！

海濱稻香 2026-07-02 03:57:36
16 跟貼 16
SemiAnalysis：谷歌下一代TPU將采用英特爾EMIB-T封裝

華爾街見聞官方 2026-07-02 08:53:54
0 跟貼 0
志愿必看！2026本科Top50專業排行！

山東教育 2026-07-03 00:09:43
0 跟貼 0
熱血傳奇，必須明白一個道理，物價保值的背后，底層邏輯

羅密歐游戲解說 2026-06-30 07:00:00
0 跟貼 0
劉芷昂：改變我們共同的處境

北大國發院 2026-07-01 23:13:39
1 跟貼 1
2026魯西烏（Rousseeuw）統計學100萬美元大獎授予R語言項目團隊

小樂數學科普 2026-07-03 20:03:48
0 跟貼 0
Xbox Helix被內存價格逼到重想商業模式？

渡川5 2026-07-02 16:34:19
0 跟貼 0
每周往返13小時，這位上海專家連續兩年堅持周末回鄉坐診

上觀新聞 2026-07-04 13:44:16
15 跟貼 15
經濟學家的理論，憑什么相信它？二零一三年諾獎得主漢森說：拿數據檢驗

余豐慧 2026-07-03 13:10:58
0 跟貼 0
Run·Token｜華南理工大學工商管理學院MBA聯合會走進潤建股份，共話Token激活產業價值

新浪財經 2026-07-04 04:30:50
0 跟貼 0

揭穿行業謊言！電車輻射并不大？實測：腳底輻射遠超手機吹風機等

揭穿行業謊言！電車輻射并不大？實測：腳底輻射遠超手機吹風機等

車見

2026-07-03 11:28:13

世界杯爭議？阿根廷加時進球有效，FIFA給出了證據，越位真相大白

世界杯爭議？阿根廷加時進球有效，FIFA給出了證據，越位真相大白

侃球熊弟

2026-07-04 08:27:13

娃哈哈冰紅茶測出甜蜜素遭美國扣押，該添加劑被當地禁用

娃哈哈冰紅茶測出甜蜜素遭美國扣押，該添加劑被當地禁用

映射生活的身影

2026-07-03 19:55:02

中年少婦現在都在擦邊直播…

微微熱評

2026-07-04 12:47:33

賽格國際購物中心虛假破產案

林孫忠

2026-07-03 20:22:56

統一臺灣的最大障礙，不是美國和臺獨，而是＂中華民國＂這個稱號

統一臺灣的最大障礙，不是美國和臺獨，而是＂中華民國＂這個稱號

共工之錨

2026-07-03 00:10:55

再見了！詹姆斯拒絕加盟！下家球隊數量，減一

再見了！詹姆斯拒絕加盟！下家球隊數量，減一

詹姆斯吧

2026-07-04 10:48:59

沃齊尼亞書寫黑馬傳奇！佛得角世界杯之旅落幕，收獲1100萬美元賽事獎金

沃齊尼亞書寫黑馬傳奇！佛得角世界杯之旅落幕，收獲1100萬美元賽事獎金

紅星新聞

2026-07-04 11:49:12

山姆被吐槽“雙標”“吃相難看”！女子搶在漲價前買MacBook，結果被取消訂單……消費者：山姆“砍單”不是第一次了

山姆被吐槽“雙標”“吃相難看”！女子搶在漲價前買MacBook，結果被取消訂單……消費者：山姆“砍單”不是第一次了

大風新聞

2026-07-03 20:49:04

高溫下，哈梅內伊葬禮開始：6000個噴頭灑水降溫，5000萬個面包，2500輛救護車

高溫下，哈梅內伊葬禮開始：6000個噴頭灑水降溫，5000萬個面包，2500輛救護車

紅星新聞

2026-07-04 12:52:12

難以置信！堂姐強硬要求孩子長期住家，并安排三餐，屋主發帖控訴

難以置信！堂姐強硬要求孩子長期住家，并安排三餐，屋主發帖控訴

火山詩話

2026-07-04 09:07:30

360萬元法拉利被4名兒童劃損，最新進展：4名家長均已道歉，共計賠償2萬元，車主表示將不再追究責任

360萬元法拉利被4名兒童劃損，最新進展：4名家長均已道歉，共計賠償2萬元，車主表示將不再追究責任

大風新聞

2026-07-04 09:50:03

勁爆！知名骨干教師主任自毀前程淪為階下囚

勁爆！知名骨干教師主任自毀前程淪為階下囚

俯瞰江蘇

2026-07-03 15:43:38

17次丟球權！賽后恩佐發文致歉，球迷：請先把專注力放在世界杯

17次丟球權！賽后恩佐發文致歉，球迷：請先把專注力放在世界杯

衣衫襤褸的文人

2026-07-04 10:14:17

人在廣東，卻在上海酒店開房廣東一女子疑似身份信息被盜用

人在廣東，卻在上海酒店開房廣東一女子疑似身份信息被盜用

封面新聞

2026-07-04 16:41:03

犧牲太大！王亞平曾談太空之旅的辛酸，落地后身體弱連走路都困難

犧牲太大！王亞平曾談太空之旅的辛酸，落地后身體弱連走路都困難

無處遁形

2026-06-04 23:20:54

湖南省委：堅決擁護國家監委決定

湖南省委：堅決擁護國家監委決定

政知新媒體

2026-07-04 11:51:19

世界杯16強全部產生，1/8決賽對陣賽程出爐，預測這8支球隊進8強

世界杯16強全部產生，1/8決賽對陣賽程出爐，預測這8支球隊進8強

第五才子

2026-07-04 12:07:15

香港網紅向郭富城、方媛道歉，承認發活動照片時只P了自己，沒有“修飾”郭富城夫婦；否認惡意丑化他人，稱他倆狀態非常出色

香港網紅向郭富城、方媛道歉，承認發活動照片時只P了自己，沒有“修飾”郭富城夫婦；否認惡意丑化他人，稱他倆狀態非常出色

魯中晨報

2026-07-04 09:30:04

粉絲從5萬暴漲到近2000萬，佛得角40歲門將火了！梅西談佛得角：他們好像總是多出一個人

粉絲從5萬暴漲到近2000萬，佛得角40歲門將火了！梅西談佛得角：他們好像總是多出一個人

都市快報橙柿互動

2026-07-04 13:23:28

邏輯與常識

通過時事分析和評論，剖析事件之后的本質和邏輯。反洗腦，真認知

470文章數 999關注度

往期回顧全部

科技要聞

韜定律論文V2版，充工程細節和實測數據

頭條要聞

媒體：日本著急"看上"印度物資高市早苗迅速跟進叫哥

頭條要聞

媒體：日本著急"看上"印度物資高市早苗迅速跟進叫哥

體育要聞

揭法國鋒線最大優勢有人比姆巴佩還快?

娛樂要聞

最富女歌手霉霉完婚在紐約設宴慶賀

財經要聞

韓國股市杠桿失控：450億美元資金狂飆

汽車要聞

方程豹鈦9內飾曝光用上了長聯屏設計/下半年上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

健康

本地

教育

軍事航空

《廢品機械師》7.24正式推出 10年經典機械設計

聽說少吃點能抗衰老？專家講解！

本地新聞

國內足球之旅？這座小城給你高分答案

教育要聞

這不是我寫英語作文的樣子嗎

軍事要聞

普京宣布俄軍“完全解放”盧甘斯克

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版