无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI半導體終局推演2026:當“Token經濟學”從GPU算力轉向HBM

0
分享至

如果把這輪AI浪潮拆開來看,你會發現一個正在發生的根本性轉移:衡量價值的核心,不再是GPU的算力本身,而是“每單位成本能產出多少Token”。

本篇文章試圖回答一個市場反復糾結的問題—— 為什么每一代GPU,對HBM的需求幾乎注定是指數級增長?更關鍵的是,這種增長為什么不會像過去那樣中途停滯?這也是我長期買多三星和海力士的理論基礎(憑借這個看多的論點,近一個月本人美股的收益率78%)。


一、一個被忽視的第一性原理

在當前架構下,可以把AI推理的本質簡化為一句話:

Token吞吐量 ≈ HBM容量 × HBM帶寬

這不是一個經驗結論,而是從系統結構推導出來的硬約束。

換句話說: GPU的上限,不再由算力單獨決定,而是被HBM的兩個維度“鎖死”。

二、為什么過去的內存不重要?

要理解今天,必須先回到CPU時代。

在那個階段,整個產業的核心KPI只有一個:性能(performance)。 CPU不斷通過提高頻率、超標量執行(superscalar)、亂序執行等方式去“跑得更快”。

而內存(DDR)在體系中的角色,其實非常邊緣。

為什么?

第一,CPU擅長“掩蓋延遲” 通過多級緩存(L1/L2/L3)、寄存器重命名、超大亂序窗口等機制,把對內存的依賴盡可能隱藏。

第二,絕大多數負載根本不缺帶寬 無論是本地應用還是云端任務,DDR帶寬長期處于“過剩狀態”。

結果就是: 即便內存速度翻倍,對CPU性能的提升往往不到20%。

這直接導致一個現實: 從DDR3到DDR5,技術迭代拉長到十多年,容量增長也極其溫和——十年大約3倍。

本質上,DRAM在CPU時代只是“配角”: 它的升級,對核心KPI幾乎沒有決定性影響。

三、AI時代:KPI被徹底改寫

進入生成式AI時代,一切都變了。

GPU不再圍繞“算力跑分”,而是圍繞兩個指標: ? 單位成本的Token產出(核心商業指標) ? Token生成速度(用戶體驗指標)

這就是所謂的“Token經濟學”。

在這個框架下,系統優化的目標變成一條曲線: 在吞吐量(throughput)和速度(latency)之間,盡可能逼近最優邊界(Pareto frontier)。

NVIDIA提出“AI工廠”的概念,本質就是一件事: 用最低成本,產出最多Token,同時盡可能快。

四、關鍵轉折:從單卡到系統級“Token工廠”

在早期單卡GPU時代(batch size≈1),邏輯很簡單: ? Token吞吐 ≈ HBM帶寬

但進入類似NVL72這種系統架構后,一切復雜起來: ? 72個GPU + 多CPU協同 ? 推理從“單線程”變成“系統級并行”

此時,Token吞吐被拆成兩個變量:

Token吞吐 = 批處理規模(Batch Size) × 單用戶Token速度

五、第一個瓶頸:HBM容量(Size)

為什么Batch Size受限?

因為每一個請求都會占用一塊KV Cache,而這部分數據必須常駐HBM。

隨著Batch增加:

  • KV Cache線性增長

  • 所有數據必須同時駐留在HBM中

于是得到一個剛性約束:

Batch Size的上限,本質取決于HBM容量

可以把它理解成機場擺渡車:

  • 車廂大小 = HBM容量

  • 一次能拉多少人 = Batch Size

車太小,再多人也得分批運,吞吐上不去。

六、第二個瓶頸:HBM帶寬(Bandwidth)

再看單用戶Token速度。

在大模型的decode階段,每生成一個Token,都需要:

  • 多次讀取權重

  • 高頻訪問KV Cache

而這些操作的瓶頸,不在算力,而在數據搬運速度。

于是得到第二個結論:

Token生成速度 ≈ HBM帶寬

繼續用剛才的比喻:

  • 車門寬度 = 帶寬

  • 門越寬,上車越快

即使車很大(容量高),門太窄(帶寬低),整體效率仍然很差。

七、把兩件事合在一起

現在可以得到一個更清晰的表達:

Token吞吐 = Batch Size × Token速度 ≈ HBM容量 × HBM帶寬

這就是AI推理時代最核心的硬件公式。

也意味著一件非常重要的事:

如果Token吞吐要“每代翻倍”, 那么HBM容量 × 帶寬的乘積,也必須同步翻倍。

八、為什么這一次“周期不會重演”?

市場爭議的核心在這里:

歷史上,DRAM也是周期品—— 需求上漲 → 廠商擴產 → 供給過剩 → 周期下行

那HBM會不會重蹈覆轍?

問題在于,這次的需求結構完全不同。

過去:

  • DRAM需求來自設備數量增長

  • 屬于“可波動需求”

現在:

  • HBM需求直接綁定Token吞吐

  • 屬于“系統剛性需求”

只要AI系統還在追求更高吞吐:

  • GPU必須升級

  • 而GPU的上限被HBM鎖死

這是一種供給側被動驅動的需求,而不是需求側自發波動。

九、軟件會不會改變這一切?

一個常見誤區是: “軟件優化可以降低對HBM的需求。”

這在邏輯上是站不住的。

原因很簡單:

軟件優化 ≠ 可以停止硬件進步

就像CPU一樣:

  • 軟件可以更高效

  • 但CPU每一代仍必須跑分更高

否則就沒有商業價值。

GPU也是同理:

無論軟件如何優化,Token吞吐這個KPI必須持續提升。

只要這個目標不變: ? 對HBM容量的需求不會下降 ? 對HBM帶寬的需求也不會下降

十、真正的變化:HBM走上舞臺中央

在CPU時代,內存是配角。 在AI時代,HBM成為“天花板”。

它不再是錦上添花,而是決定系統上限的核心變量。

甚至可以說:

GPU的競爭,本質正在轉化為HBM能力的競爭。

十一、最后的問題

當需求被“物理規律”鎖定為指數增長后,故事只剩下一個懸念:

過去三十年里,存儲行業反復上演同一個劇本—— 在繁榮中擴產,在擴產中崩盤。

那么這一次——

當HBM成為AI時代的剛性基礎設施, 供給側的三大玩家,還會不會再次把自己拖入周期的深淵?

關注我,我們一起埋伏在大部隊前進的路上。

這里是《邏輯與常識》,用邏輯看市場,用常識做投資。

如果這篇文章對你有幫助,轉發給同樣在投資路上摸索的朋友。


早七點準時發文

大家好,我是江南君,一個路見不平一聲吼的老boy。

做過監理,行政,金融,設計,干過培訓,超市,餐飲,投資,外貿……目前常住越南。

喜歡寫點文字,思考點人生,管管閑事。

多年后,當后人問我對社會做了哪些貢獻時,我會自豪地說,面對事實,我做了誠實的記錄和評論。

為防失聯,加好友(67932342)

投資認知類文章

10萬+文章

【社會】

【社會】

【社會】

【社會】

【社會】

【社會】

【時事】

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
揭穿行業謊言!電車輻射并不大?實測:腳底輻射遠超手機吹風機等

揭穿行業謊言!電車輻射并不大?實測:腳底輻射遠超手機吹風機等

車見
2026-07-03 11:28:13
世界杯爭議?阿根廷加時進球有效,FIFA給出了證據,越位真相大白

世界杯爭議?阿根廷加時進球有效,FIFA給出了證據,越位真相大白

侃球熊弟
2026-07-04 08:27:13
娃哈哈冰紅茶測出甜蜜素遭美國扣押,該添加劑被當地禁用

娃哈哈冰紅茶測出甜蜜素遭美國扣押,該添加劑被當地禁用

映射生活的身影
2026-07-03 19:55:02
中年少婦現在都在擦邊直播…

中年少婦現在都在擦邊直播…

微微熱評
2026-07-04 12:47:33
賽格國際購物中心虛假破產案

賽格國際購物中心虛假破產案

林孫忠
2026-07-03 20:22:56
統一臺灣的最大障礙,不是美國和臺獨,而是"中華民國"這個稱號

統一臺灣的最大障礙,不是美國和臺獨,而是"中華民國"這個稱號

共工之錨
2026-07-03 00:10:55
再見了!詹姆斯拒絕加盟!下家球隊數量,減一

再見了!詹姆斯拒絕加盟!下家球隊數量,減一

詹姆斯吧
2026-07-04 10:48:59
沃齊尼亞書寫黑馬傳奇!佛得角世界杯之旅落幕,收獲1100萬美元賽事獎金

沃齊尼亞書寫黑馬傳奇!佛得角世界杯之旅落幕,收獲1100萬美元賽事獎金

紅星新聞
2026-07-04 11:49:12
山姆被吐槽“雙標”“吃相難看”!女子搶在漲價前買MacBook,結果被取消訂單……消費者:山姆“砍單”不是第一次了

山姆被吐槽“雙標”“吃相難看”!女子搶在漲價前買MacBook,結果被取消訂單……消費者:山姆“砍單”不是第一次了

大風新聞
2026-07-03 20:49:04
高溫下,哈梅內伊葬禮開始:6000個噴頭灑水降溫,5000萬個面包,2500輛救護車

高溫下,哈梅內伊葬禮開始:6000個噴頭灑水降溫,5000萬個面包,2500輛救護車

紅星新聞
2026-07-04 12:52:12
難以置信!堂姐強硬要求孩子長期住家,并安排三餐,屋主發帖控訴

難以置信!堂姐強硬要求孩子長期住家,并安排三餐,屋主發帖控訴

火山詩話
2026-07-04 09:07:30
360萬元法拉利被4名兒童劃損,最新進展:4名家長均已道歉,共計賠償2萬元,車主表示將不再追究責任

360萬元法拉利被4名兒童劃損,最新進展:4名家長均已道歉,共計賠償2萬元,車主表示將不再追究責任

大風新聞
2026-07-04 09:50:03
勁爆!知名骨干教師主任自毀前程淪為階下囚

勁爆!知名骨干教師主任自毀前程淪為階下囚

俯瞰江蘇
2026-07-03 15:43:38
17次丟球權!賽后恩佐發文致歉,球迷:請先把專注力放在世界杯

17次丟球權!賽后恩佐發文致歉,球迷:請先把專注力放在世界杯

衣衫襤褸的文人
2026-07-04 10:14:17
人在廣東,卻在上海酒店開房 廣東一女子疑似身份信息被盜用

人在廣東,卻在上海酒店開房 廣東一女子疑似身份信息被盜用

封面新聞
2026-07-04 16:41:03
犧牲太大!王亞平曾談太空之旅的辛酸,落地后身體弱連走路都困難

犧牲太大!王亞平曾談太空之旅的辛酸,落地后身體弱連走路都困難

無處遁形
2026-06-04 23:20:54
湖南省委:堅決擁護國家監委決定

湖南省委:堅決擁護國家監委決定

政知新媒體
2026-07-04 11:51:19
世界杯16強全部產生,1/8決賽對陣賽程出爐,預測這8支球隊進8強

世界杯16強全部產生,1/8決賽對陣賽程出爐,預測這8支球隊進8強

第五才子
2026-07-04 12:07:15
香港網紅向郭富城、方媛道歉,承認發活動照片時只P了自己,沒有“修飾”郭富城夫婦;否認惡意丑化他人,稱他倆狀態非常出色

香港網紅向郭富城、方媛道歉,承認發活動照片時只P了自己,沒有“修飾”郭富城夫婦;否認惡意丑化他人,稱他倆狀態非常出色

魯中晨報
2026-07-04 09:30:04
粉絲從5萬暴漲到近2000萬,佛得角40歲門將火了!梅西談佛得角:他們好像總是多出一個人

粉絲從5萬暴漲到近2000萬,佛得角40歲門將火了!梅西談佛得角:他們好像總是多出一個人

都市快報橙柿互動
2026-07-04 13:23:28
2026-07-04 17:24:49
邏輯與常識 incentive-icons
邏輯與常識
通過時事分析和評論,剖析事件之后的本質和邏輯。反洗腦,真認知
470文章數 999關注度
往期回顧 全部

科技要聞

韜定律論文V2版,充工程細節和實測數據

頭條要聞

媒體:日本著急"看上"印度物資 高市早苗迅速跟進叫哥

頭條要聞

媒體:日本著急"看上"印度物資 高市早苗迅速跟進叫哥

體育要聞

揭法國鋒線最大優勢 有人比姆巴佩還快?

娛樂要聞

最富女歌手霉霉完婚 在紐約設宴慶賀

財經要聞

韓國股市杠桿失控:450億美元資金狂飆

汽車要聞

方程豹鈦9內飾曝光 用上了長聯屏設計/下半年上市

態度原創

游戲
健康
本地
教育
軍事航空

《廢品機械師》7.24正式推出 10年經典機械設計

聽說少吃點能抗衰老?專家講解!

本地新聞

國內足球之旅?這座小城給你高分答案

教育要聞

這不是我寫英語作文的樣子嗎

軍事要聞

普京宣布俄軍“完全解放”盧甘斯克

無障礙瀏覽 進入關懷版