“企業的AI預算,一個月、兩個月就見底了,而這可是全年的預算。”企業AI公司Glean首席執行官阿爾溫德·賈因(Arvind Jain)對CNBC說出這番話時,語氣并不輕松。他正在描繪一個正在《財富》500強公司內部悄然發生的殘酷現實:人工智能的開銷正以一種誰也沒料到的速度吞噬著企業錢包,進而逼出一個前所未有的選擇題——要“代幣”(token),還是要人?
這不是一個比喻。當一枚前沿大模型生成的每一個“代幣”成本都在翻倍上漲,當企業發現用在AI上的錢已經和雇一個人差不多時,那個“技術永遠比人便宜”的舊信條就開始崩塌了。賈因說,在他記憶里,這是第一次出現“技術成本和人力成本持平”的時刻,企業不得不開始計算:同樣的錢,到底是多燒幾個token,還是多招幾個人?
![]()
而答案,已經開始指向對未來員工增長的犧牲。“這些越來越龐大的AI預算,正在取代未來的人力增長。”賈因直言。這背后的推手,正是AI模型價格不降反升的詭異走勢——每一代新模型,單位token成本幾乎是上一代的兩倍。賈因甚至直接用了“不可持續”這個詞來描述當前的路徑。
在這場算力與工資單的博弈中,另一個關鍵角色——Factory AI的首席執行官馬坦·格林伯格(Matan Grinberg)也給出了相似的診斷。他把這場風波看成一個“資源分配的難題”,正在領導團隊的會議室里激烈上演。“公司會說,嘿,如果我們只能優化一件事,那到底是優化我們擁有的員工數量,還是優化每個員工身上的AI花費?”格林伯格說道。這個問題的提出本身,已足夠說明AI早已不是那個躲在成本表小數位里的廉價工具了。
那么,企業們是怎么一步步把自己推到這條“燒錢高速”上的呢?格林伯格勾勒出了一條清晰的三年快進線。第一階段,董事會急迫地命令CEO“做點兒AI相關的事”,于是風風火火的探索開始了。第二階段,一種被稱為“tokenmaxxing”的行為模式出現——不問成本、只求成果,能用的AI全用上,先把所有前沿模型灌進業務流程再說。而現在,他們進入了第三階段:捂住錢袋子,重新審視需求。“我們真的需要每一個任務都用到Opus級別的智能嗎?”格林伯格發問,“你根本就沒必要。”
這個問句戳中了一個更大的麻煩:技術確實強大,但它還沒能自己養活自己。賈因點出了核心矛盾:“AI目前的工作方式,非常強大,但也非常低效。AI驅動的價值,此刻是落后于企業正在承擔的成本的。”也就是說,花出去的錢,還沒等來對等的回報,那個財務模型下的剪刀差正在越張越大。
更令人咋舌的浪費還在后面。賈因拋出了一個驚人的數字:大約95%的企業AI使用,仍然跑在最昂貴的那批前沿模型上,即便很多任務壓根用不上如此奢侈的算力。這就好比你每天點米其林三星外賣,卻只是想吃碗白粥——不是不行,但賬單足夠燒穿任何一家公司的預算表。而那個最輕易就能摘到的“低垂果實”,恰恰就藏在這里:把簡單工作路由到更便宜的模型上去。
賈因給出的方案聽起來簡單得不可思議:“只要在前端做好模型路由,你就能實現10倍的成本節省。”沒錯,十倍的節省,不靠裁人,不靠砍業務,只靠把交給頂級大腦的簡單問題,轉手丟給它那些更輕量、更便宜的“學弟學妹”們。這或許是當前企業AI預算危機中最直接、也最被低估的解藥。
如果把這個故事抽絲剝繭,它其實已經畫出了一條從瘋狂撒錢到理性算計的拋物線。起初,因為害怕落后,企業把前沿模型當成萬靈藥,不惜成本地all-in;接著,在“tokenmaxxing”的快感中,消費變得毫無節制;最后,當第一張超額賬單擺在CFO桌上時,全員才猛然驚醒——原來AI不是免費的電力,它是昂貴的“大腦”,用多少、怎么用,都有明碼標價,而且比雇一個同樣能干的人還貴。
于是,那句“要代幣還是要人”就不再是個隱喻,而是一道真實出現在企業決策表格里的選填項。在技術照進現實的過程中,每多燒一個昂貴的token,就意味著未來少招一個可能同樣產出價值的員工。這個剛剛被推上臺面的公式,也許比任何一篇AI技術論文都更能讓人們看清,人工智能這場盛宴的真正成本到底是誰在買單。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.