今年以來,硅谷掀起“Token最大化”(tokenmaxxing)之風,Token與KPI直接掛鉤,不斷增長的消耗量被視為生產力提升。在硅谷,亞馬遜建立內部排行榜,根據員工使用AI的情況排名。Meta內部的排名系統讓員工比拼誰消耗的Token最多。如今,這些昂貴的AI賬單開始讓企業感到壓力。
據英國《金融時報》6月30日報道,在員工紛紛采用AI編程工具后,美國打車應用公司Uber僅四個月就耗盡了2026年一整年的AI預算,迫使管理層限制使用量。現在,Uber限制每位員工每月使用AI編程工具的費用為1500美元。畢馬威5月對2145名全球企業領導者的調查顯示,由于成本超過收益,其中近半數表示已縮減了AI智能體的使用。
“人們真的在說…… ‘我的公司在第一季度就花掉了2026年的預算’。”OpenAI首席執行官山姆·奧特曼在6月早些時候表示,“今年年初,一個從未被提及的問題……突然變成了一個巨大的問題”。
盡管Token價格在降低,但AI公司的Token定價從固定訂閱模式轉向按使用量收費,完成一項任務的總成本在上升。任務步驟和數據更多,輸入的內容更長,每項任務的Token使用量難以估算,企業面臨不可預測且價格高昂的AI支出賬單。
咨詢機構Gartner預計,到2028年,AI編程成本將超過開發者的平均薪資。Gartner的調查發現,3/4的高管預計今年技術預算將增加,其中近半數預計會有兩位數增長。
飆升的Token賬單讓企業重新審視AI支出情況,重塑模型選擇方式,企業開始接受更便宜的模型。據路透社報道,微軟CEO薩提亞·納德拉(Satya Nadella)和美國網絡安全公司Palo Alto Networks的CEO尼科什·阿羅拉(Nikesh ?Arora)等科技高管紛紛表示,更小、更便宜的模型足以滿足企業大部分需求。
另據《金融時報》報道,企業軟件公司Atlassian限制每位員工在給定時期內可以使用的Token數量。員工可以申請更多Token,但需經理批準。Atlassian首席執行官邁克·坎農-布魯克斯(Mike Cannon-Brookes)表示,很多公司基本上就是選最貴的模型,想用多少就用多少,“這相當危險,因為它也會教出非常糟糕的習慣。”
企業也在轉向OpenRouter這樣的AI市場平臺,在分配任務時,簡單任務選擇具有成本效益的系統,編程等復雜任務用高端模型處理。開源模型有利于企業降低AI成本,OpenRouter上最受歡迎的四個模型全部來自中國,其中DeepSeek位居榜首。
硅谷AI搜索初創公司Perplexity首席執行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)表示,如果有一個開源模型能在90%的情況下完成任務,而它的成本比前沿模型更便宜,就可能會選擇使用。他表示,前沿智能的未來依然光明,但企業不會再像過去幾個月那樣不計成本地投入了。能夠從AI消耗的電力中提供最大經濟價值的公司,最終才能獲得最高的估值。
幫助企業運行AI模型的WEKA公司首席AI官瓦爾·貝爾科維奇(Val Bercovici)表示,開源模型以10%的價格做到90%的效果,“我們不需要在每個環節都花費高昂的Token。”
阿羅拉呼吁,AI實驗室現在就應該按幾年后預計的低價來對Token收費。持有多家科技巨頭股份的Synovus證券公司私人財富管理財務顧問克里斯托弗·布朗(Christopher Brown)則認為,OpenAI和Anthropic之間將出現價格戰,因為兩者都在爭奪“率先上市”的IPO日期。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.