AI推理基礎設施市場正面臨一輪顯著的成本與供給沖擊。
在美國知名風投機構Altimeter近期舉辦的活動上,AI推理基礎設施服務商Baseten首席執行官Tuhin Srivastava透露,其云服務商已于今年5月提前通知,英偉達B200 GPU的每小時租賃單價將在10月合同續約時,從現行的2.63美元漲至5.10美元,漲幅約94%。
他強調,這一數字的關鍵不在于絕對價格水平,而在于其所折射出的供需失衡程度——云服務商提前數月主動報價,本身即表明在算力持續緊缺的背景下,需求方已幾無議價空間。
與此同時,供給端緊張態勢同樣未見緩和。據Tuhin Srivastava介紹,當前采購1000塊GPU的交付排期已普遍延至明年第二季度,等待周期長達12至15個月。交付瓶頸與租賃價格上漲形成疊加效應,企業即便加大投入,短期內亦難以通過采購途徑補足算力缺口。價格上行與供給瓶頸雙重擠壓下,AI推理的成本正面臨實質性抬升。
Baseten成立于2019年,總部位于舊金山,定位為生產級AI推理基礎設施服務商,業務涵蓋模型部署、管理、擴展與監控,提供多集群、多云環境的彈性擴展支持,并輔以性能研究與嵌入式AI工程服務。截至2026年1月,公司已完成D+輪融資,并獲得英偉達戰略投資。
![]()
Baseten首席執行官Tuhin Srivastava
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.