无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

硅谷深陷算力荒:H200一夜漲價30%,H100搶到缺貨,Karpathy也未能幸免

0
分享至


作者 | 四月

2026 年 5 月的硅谷,對于 AI 算力的“饑荒”和焦慮,正達到一個前所未有的高度。

哪怕那些站在算力中心的人,也不得不開始為算力排隊。

在英偉達,負責應用深度學習研究團隊的 Bryan Catanzaro 找黃仁勛申請訓練卡。最近大家一直抱怨卡不夠用,受限太多。

“不好意思,那些卡已經賣掉了”,這是老黃給出的回復。

Catanzaro 是英偉達的大功臣。十多年前,正是他留意到,GPU 迎來了首批 AI 買家——研究員,且幾乎瘋狂掃貨。基于這個洞察,老黃才下定決心把整間公司押注 AI 賽道。

當年幫英偉達賭對算力卡的人,現在卻買不到自家的 GPU 了。

而比“賣鏟子的沒鏟子了”更戲劇性的事,還發生在谷歌。

去年夏天,DeepMind 的研究員 Andrew Dai 判斷,視覺推理是個值得做的方向。于是向公司內部提了一批 TPU 的資源需求。

但申請遲遲未批。拒絕的理由,倒不是研究方向不夠好,而是項目不能為下一代的 Gemini 服務。當時的內部原則是,資源應該優先流向付費客戶和旗艦模型。

“在谷歌內部,每一塊 TPU 的背后,都有三位競爭者”,華盛頓大學計算機系的榮譽教授 Oren Etzioni 聊到。現實很殘酷,如果你的項目不能直接帶來收入,你就是在和付費客戶搶資源。

Dai 最終選擇離職創業。和他做出同樣選擇的,還有 Anna Goldie。

有趣的是,谷歌用來挽留 Goldie 的籌碼不是加薪,也不是期權,而是——更多的 TPU 算力卡。

但 Goldie 還是走了,還拿到了 3.35 億美元的融資,“這筆錢能買到的算力,和當初 DeepMind 挽留我開出的條件,幾乎相當。”

當大廠圍墻內的算力變成一種“組織權限”,出走就成了唯一解。

而在圍墻之外,獨立開發者和研究員面對的,是比“GPU 短缺”更難的處境:連卡都租不到。

這事已經迫切到什么程度了呢?


這兩天,AI 大神 Andrej Karpathy 都忍不住發帖吐槽。他表示,在錄制 nanochat 教學視頻時,才突然意識到,如果實驗的第一步是,讓學員“從云平臺啟動一臺 8×H100 的服務器”,那么絕大部分人將倒在起跑線上。

有大神出來喊話,評論區迅速變成大型比慘現場。

H100 搶不到,H200 一夜漲價 30%


看這話問得,顯然是我方友軍無疑了。


有人補刀,其實真正的第一步,還不是啟動 Server,而是求爺爺告奶奶等 quota approval。 現在大多數的普通用戶,是連 8×H100 的預審批權限都沒有的。




更有開發者直接曬后臺截圖:RunPod 上多種 GPU 型號顯示 unavailable;Azure 上 H100 虛擬機啟動失敗,提示 capacity 不足;Google Colab 選擇 GPU 后,被系統自動降檔到 G4。


Rohan Bansal 看著賬戶里僅存的兩個 H100 實例,發了條推文:“holding on for dear life”。

如果說資源緊缺必然導致價格上漲,尚可理解。但這漲價的姿勢未免也有些詭異。

正常的邏輯是,新一代出來,舊款降價。B200 已經穩定供貨,四年前的 H100 也理應降價。


但 SemiAnalysis 數據顯示,H100 一年期的合約租金,半年漲了近 40%(從 2025 年 10 月的 $1.70/ 小時,漲到 2026 年 3 月的 $2.35)。


現貨市場更夸張,lambda 的報價已上浮到 4 美元 +/ 小時,是兩年前的兩倍。而 H200 的現貨價格甚至比新一代 B200 還要貴。"這價格是兩年前的兩倍還多,而且通常很難搶到,要寫腳本盯著 API 才有機會。"


圖注:從 4.96 美元 / 小時漲到 6.40 美元 / 小時,漲幅 29%;而更新一代的 B200 為 5.68 美元 /GPU 小時。

5% 的利用率和 B200 的倒掛

一邊是高端 GPU 緊缺,一邊卻是算力中心里的利用率低得令人發指。

Cast AI 的報告顯示,不少大企業 GPU 集群的平均利用率只有 5% 左右。此前,馬斯克的兆瓦級算力中心 Colossus 的 MFU(模型算力利用率)僅為 11% 左右。

其實并不是企業意識到不到算力資源的浪費,而是不敢放手。

排隊幾個月,云廠商銷售突然打電話:“你要的卡現在只剩 36 張了,只能簽一年的長約。不要的話,后面還有五家排隊等著呢。”

這時候,問題已經不是“公司是否需要租用這么長時間的芯片”,而是“我敢不敢錯過這筆訂單”。

先簽下來,哪怕閑置也不釋放,因為交出去的算力卡可能就再也拿不回來了。

芯片不只是產能短缺,更是流動性短缺:它卡在企業的算力長約里,困在云廠商的容量池里,但就是不在普通開發者今晚能點開購買的頁面上。

短缺制造恐慌,恐慌制造囤積,囤積制造更深的短缺。

而這種流動性的枯竭,也放大了另一個結構性問題:為什么偏偏是 H100/H200 被推上了天價,甚至比新一代 B200 還貴?

因為算力市場從來不是按“誰更新”來定價,而是按“誰更好用、更好接入”來定價的。

過去大家搶 GPU,想象中的場景是巨頭訓練下一代大模型,當然要追求極致先進。但現在,消耗 GPU 的地方變多了:推理服務、代碼 Agent、RL 后訓練、自動評測、小模型復現、教學實驗,都在持續吃算力。

對于這些海量需求來說,B200 代表的下一代性能上限并不是首選。

做工程的人最懂:最先進不等于最好用,真正值錢的是確定性。

H100/H200 足夠強,且生態足夠成熟。你用 H100 跑,別人的 benchmark 也是 H100;你用 H200 做推理,調參經驗已經有人踩過坑。

相比之下,新一代芯片再強,也需要時間消化到框架、集群、調度和成本模型里。

訓練市場還沒完全切到 Blackwell,推理和后訓練市場又把需求重重疊加上來。舊卡本該退場,卻因為“確定性”成了剛需。

AI 民主化,卡在了算力門檻上

這一輪的芯片荒,和過去還不太一樣。

過去聊缺芯,是頂級 AI Lab 的軍備競賽,巨頭誰搶到更多 GPU,誰就能訓練更大模型。但這一次,焦慮正在往下沉。

Karpathy 錄教程要先考慮開發者能不能拿到 8×H100;LocalLLaMA 社區討論能不能用本地 Mac 硬跑;高校研究員擔心拿不到算力,小團隊擔心擴容被大客戶擠掉。

這背后已經不是“我要訓練 GPT-5”的野心,而是一個更樸素的問題:我只是想復現一個實驗,為什么第一步就變成搶算力了?

AI 開源這幾年確實降低了許多門檻。模型權重可以下載,代碼可以 fork。但算力把另一扇門關上了。

代碼可以開源,但 H100 不能 fork。

真正的 AI 研究從來不只是看懂代碼,還得你能跑通實驗、復現結果,調參、失敗,以及很多次的再重來。

如果每次實驗的前提,都是拿到一組昂貴且不穩定的 GPU,那么開源的平等,就會被算力的不平等重新抵消。

從 Google 研究員離職創業,到英偉達內部爭 GPU,然后是 Karpathy 的教學視頻卡在 8 張 H100,它們指向同一件事:算力正在從基礎設施,變成一種篩選機制。

它篩掉的未必是沒有想法的人,而是沒有預算、沒有配額資源、沒有長期合同的群體。

這才是 AI 民主化最尷尬的現實:模型越來越開放,但能跑起來的人,可能并沒有變多。

國內開發者的痛:過渡期的壓力

把視線拉回國內,如果說海外開發者是在成熟生態里搶 H100/H200 現貨;那么國內開發者面對的,則是過渡期的多重壓力考驗,要在新的算力結構里找"能用且好用"的解法。

某云 H100 排期已到 2027 年第一季度,更多的云平臺同樣面臨高端卡供應瓶頸,"有錢也租不到"是真實的用戶反饋。

與此同時,高端卡的獲取仍然受政策影響,當然國產算力替代正在加速。但從 CUDA 體系切換的工程成本是真實存在的,適配層、代碼改動、調試周期,對小團隊而言不是輕松的遷移。

其實,大家底層的處境不盡相同。算力底座從來不是一個宏大詞,而是非常具體的體驗——實例能不能啟動,價格扛不扛得住,實驗結果能不能復現。

今天 AI 圈真正稀缺的,也許不是最新的芯片,而是普通人能穩定拿到、馬上用起來、跑出結果的有效算力。

  1. Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

  2. The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

  3. FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing(https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing)

  4. https://semianalysis.com/gpu-pricing-index/

  5. Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance(https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance)

聲明:本文為 AI 前線原創,不代表平臺觀點,未經許可禁止轉載。

會議推薦

Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Shams:沙梅特4年2400萬美元重返尼克斯

Shams:沙梅特4年2400萬美元重返尼克斯

懂球帝
2026-06-30 05:18:27
老板娘問我她身材好不好?我該怎么回答?

老板娘問我她身材好不好?我該怎么回答?

太急張三瘋
2026-06-30 11:28:57
世界杯驚天大瓜!3-3 離譜平局徹底翻車,馬赫雷斯一番話直接自爆

世界杯驚天大瓜!3-3 離譜平局徹底翻車,馬赫雷斯一番話直接自爆

奶蓋熊本熊
2026-06-30 04:07:10
名嘴葉惠賢:開創境外綜藝先河,隨女兒在澳洲養老,79歲晨跑種菜

名嘴葉惠賢:開創境外綜藝先河,隨女兒在澳洲養老,79歲晨跑種菜

白面書誏
2026-06-29 16:36:06
天津凌晨突發!抓了!

天津凌晨突發!抓了!

天津族
2026-06-30 08:58:03
老外搶瘋了!中國分體空調席卷歐洲市場!這只是冰山一角……

老外搶瘋了!中國分體空調席卷歐洲市場!這只是冰山一角……

時尚的弄潮
2026-06-30 01:35:51
聯盟大結局!詹庫在勇士聯手,濃眉加盟組三巨頭

聯盟大結局!詹庫在勇士聯手,濃眉加盟組三巨頭

湖人侃球師
2026-06-30 13:11:51
戰友二婚我隨禮88888,他回我一盒假煙,我心寒丟進垃圾桶,次日民警敲門:那盒煙你抽了嗎?

戰友二婚我隨禮88888,他回我一盒假煙,我心寒丟進垃圾桶,次日民警敲門:那盒煙你抽了嗎?

背包旅行
2026-06-29 12:18:19
中國44年來首次試射洲際導彈,全球反應堪比好萊塢大片

中國44年來首次試射洲際導彈,全球反應堪比好萊塢大片

烽火三月佳人三千
2026-06-25 14:21:42
中國共產黨成立105周年 對話越南駐華大使

中國共產黨成立105周年 對話越南駐華大使

中國日報網
2026-06-30 13:40:10
鐵三女神褲衩開叉 10 厘米!五年被罵上熱搜,裁判卻說是合規的?

鐵三女神褲衩開叉 10 厘米!五年被罵上熱搜,裁判卻說是合規的?

十點體壇
2026-06-09 21:58:11
哈佛10年追蹤:俯臥撐比血壓更準!每周2-3次力竭,給全身換系統

哈佛10年追蹤:俯臥撐比血壓更準!每周2-3次力竭,給全身換系統

健身狂人
2026-06-13 20:30:47
張雪峰女兒張姩菡:否認自己不用讀大學,也不可以躺平

張雪峰女兒張姩菡:否認自己不用讀大學,也不可以躺平

金牌娛樂
2026-06-30 09:36:46
項立剛評馮小剛:飯局跳舞事件后我就不看他電影了,太惡心了

項立剛評馮小剛:飯局跳舞事件后我就不看他電影了,太惡心了

映射生活的身影
2026-06-29 16:37:52
日本心慌了,韓國著急了,如今的中國烏魯木齊,先進制造悄然成勢

日本心慌了,韓國著急了,如今的中國烏魯木齊,先進制造悄然成勢

科技故事聚焦
2026-06-30 09:14:02
董卿:母親因癌離世3個多月,余生我會托起父親的晚年

董卿:母親因癌離世3個多月,余生我會托起父親的晚年

苗苗情感說
2026-06-29 18:11:07
刑偵大案口述紀實:塵封28年,南醫大女學生命案終告偵破!

刑偵大案口述紀實:塵封28年,南醫大女學生命案終告偵破!

橘仔看世界
2026-06-23 09:09:12
中國出手,菲親華派絕地翻盤!憋了17天,菲防長送中方一句狠話

中國出手,菲親華派絕地翻盤!憋了17天,菲防長送中方一句狠話

墨子翟的日記y
2026-06-30 13:34:22
日媒:日本決定暫不把“算數”科目名稱改為“數學”

日媒:日本決定暫不把“算數”科目名稱改為“數學”

隨波蕩漾的漂流瓶
2026-06-29 20:28:56
今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

小椰的奶奶
2026-06-30 01:19:29
2026-06-30 14:15:03
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1586文章數 160關注度
往期回顧 全部

科技要聞

DeepSeek V4正式版要來 高峰期API價格翻倍

頭條要聞

荷蘭隊連續3屆倒在點球大戰 此前9次點球大戰只贏兩場

頭條要聞

荷蘭隊連續3屆倒在點球大戰 此前9次點球大戰只贏兩場

體育要聞

德國足球,臉都不要了

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財經要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點都沒,這臺底盤最硬國產大獵裝太上頭!

態度原創

教育
數碼
時尚
旅游
藝術

教育要聞

找出規律,填寫正確的數字

數碼要聞

內存漲價到頭了?20年前的DDR1被迫“復工”,還真能跑Win11

“復古波點”又流行回來了!夏天簡單穿就很時髦

旅游要聞

自貢富順:白日繁華鋪錦繡 夜色燈火暖人心

藝術要聞

喬治·莫蘭迪簡潔的靜物畫,色彩看著太舒服了!

無障礙瀏覽 進入關懷版