全球科技公司的AI芯片賬單,正在以肉眼可見的速度狂奔。如今,一座中等至大型數據中心配備的AI芯片,造價動輒數十億美元。單是組裝現代AI集群的一塊英偉達Blackwell GPU,價格就能抵上一輛全新的特斯拉Model 3。非AI芯片的支出同樣飆升,中央處理器(CPU)和內存芯片的總采購量與單位成本,雙雙推至歷史最高位。這些冰冷的數字,正把整個AI經濟推向成本失控的邊緣。
**正方觀點很清晰:芯片價格漲勢不可逆,企業會被壓垮。** 需求端的三股力量——人工智能、物聯網和電動汽車——同時擠壓芯片產能。尤其是AI,模型訓練和部署對算力的吞噬幾乎沒有上限。歷史上,模型質量與投入的算力規模嚴格正相關,更多的芯片就意味著更強的輸出。但眼下,驅動需求的引擎正從訓練轉向推理。高盛預測,到2030年token消耗量將增長24倍,達到每月120萬億個。原因在于,代理式AI系統取代了單一提示交互,每一次查詢都疊加了多步任務,每次調用的計算量成數量級膨脹。與此同時,芯片每隔幾年就必須換代以保持成本競爭力,新舊輪替進一步繃緊了供需鏈條。
![]()
**反方曾寄望于效率提升,認為芯片工藝演進和推理優化會拉低單位成本。** 然而,現實正在澆滅這種期待。Gartner已發出警告:即便推理成本暴降90%,企業AI的賬單也不會變得更便宜。原因有二:第一,代理模型單任務消耗的token遠高于傳統交互,用量激增會吞噬掉大部分降幅;第二,AI服務商幾乎不可能把節省的全部成本讓渡給客戶。更扎眼的事實來自企業內部。微軟在發現員工對AI的使用量過大后,最近取消了大部分Claude Code直接許可,一名英偉達高管評價:“算力的成本已遠超人工成本。”優步則在四個月內就燒光了2026年全年的AI編程工具預算。很多公司現在為AI生產力付出的費用,已經超過了它們原本打算用AI替代的人力開銷。
**供給端同樣無力平抑價格。** 一座全新的芯片工廠造價高達數百億美元,且需要數年才能投產。芯片制造商在擴產上極度保守——一旦未來需求下滑,天量投資就可能轉嫁為自身的虧損。這種供給剛性使得需求與產能之間的缺口持續存在,直接推高芯片報價。而且,AI芯片與非AI芯片常常共用生產線,當更賺錢的AI芯片擠占產能時,CPU、內存等非AI芯片的短缺就會加劇,進而拉抬其成本。與此同時,新一代芯片的制造更加昂貴,需要額外的工藝步驟、更貴的材料和更復雜的技術。通脹高企、地緣政治和貿易摩擦,則給這些成本壓力又加上了一把火。
**所以,站在芯片成本與AI經濟的交叉口,我的判斷是:降本預期的幻覺將被快速戳破。** 是的,單個token的推理成本可能持續走低,工藝進步也能在微米間挖掘效率。但企業最終面對的總成本,是token消耗量與單價的乘積。當代理式AI將消耗量推高至數十倍,而供應商又牢牢握住定價權時,劃算就只是一個數學上的假設。Uber的預算閃電戰和微軟的許可收縮,已經提前預告了這種裂痕。如果芯片供給無法彈性響應,AI經濟就可能不是被技術瓶頸卡住,而是被一句老話擊中:成本,才是最終的限制條件。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.