亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

70%的AI預算正在打水漂:OpenAI和Anthropic沒告訴你的省錢真相

0
分享至

有個數(shù)字能讓技術負責人失眠:70%的AI API調用,正在用頂配模型處理連廉價模型都能搞定的任務。

這不是某個創(chuàng)業(yè)公司的焦慮,是整個行業(yè)正在集體踩的坑。過去兩年,「用大炮打蚊子」成了默認操作——寫郵件標題用GPT-4o,分類工單用Claude Opus,總結文檔?還是GPT-4o。邏輯聽起來無懈可擊:既然最好的模型什么都能干,何必費腦子選?

2026年,這個邏輯正在破產(chǎn)。

AI成本從「實驗性支出」變成「工程預算里的硬數(shù)字」,浪費不再是「可以優(yōu)化的事」,而是「必須解決的事」。一場關于「效率」的靜默革命,正在技術團隊內部發(fā)生。

從「模型崇拜」到「任務匹配」

這場革命沒有新模型發(fā)布,沒有 benchmark 刷榜。它的核心就一個字:錢。

過去兩年的行業(yè)慣性很簡單——模型越大越好,能力越強越保險。技術團隊的選擇邏輯是防御性的:萬一小模型搞不定,返工成本更高,不如直接上頂配。這種「過度配置」在實驗階段無傷大雅,但當AI調用量從每月幾千次飆到幾千萬次,賬單上的數(shù)字開始讓人清醒。

真正的轉折點在于一個反直覺的發(fā)現(xiàn):大部分AI任務根本不需要頂配模型的認知能力。

分類一封客服郵件是「是/否」判斷,總結一段文本是模式識別,生成固定格式的報告是模板填充。這些任務對模型能力的閾值極低,卻長期被塞進最昂貴的API端點。就像用法拉利送外賣——能送,但每單成本夠買一輛電動車。

smarter teams 開始重新設計調用策略:先分析任務類型,再匹配模型層級。簡單任務丟給輕量模型,復雜推理才喚醒大模型。這種「路由機制」不是技術突破,是工程常識的回歸。

70%這個數(shù)字背后

70%的浪費率怎么算出來的?

來自對典型企業(yè)AI流量的拆解。文檔摘要、情感分析、實體提取、格式轉換——這些占流量大頭的任務,在不同模型上的輸出質量差異極小,成本卻差出5到10倍。一個用GPT-4o花0.06美元完成的摘要,用輕量模型可能只要0.006美元。

差距在規(guī)模效應下被放大。月調用百萬次的團隊,這意味著每月數(shù)萬美元的「認知稅」——為不需要的能力付費。

更隱蔽的成本在延遲。大模型響應更慢,排隊更長,用戶體驗受損。某些場景下,速度差距直接決定產(chǎn)品是否可用。實時客服、交互式搜索、流式生成——這些場景對延遲的敏感度,遠高于對「更優(yōu)雅措辭」的需求。

一些團隊開始建立內部的「模型性價比矩陣」:橫軸是任務復雜度,縱軸是質量要求,每個象限對應最優(yōu)模型選擇。這不是學術練習,是直接影響毛利的決策。

效率革命的三條暗線

這場靜默革命正在三個方向展開。

第一條是「模型即服務」的分層化。云廠商和AI公司開始主動推銷「小模型」——不是技術妥協(xié),是產(chǎn)品定位。Google的Gemini有Nano、Pro、Ultra三檔,OpenAI的GPT系列分4o、4o-mini、4o-micro,Anthropic的Claude分Haiku、Sonnet、Opus。命名本身就在教育市場:任務分層,模型分層。

第二條是「智能路由」的工程化。不再是人工選擇模型,而是系統(tǒng)自動判斷。輸入任務→預估復雜度→分配模型→質量校驗→必要時升級。這套機制的核心是「置信度閾值」:小模型輸出置信度高,直接采用;置信度低,再上大模型復核。成本與質量的動態(tài)平衡,從經(jīng)驗判斷變成算法決策。

第三條是「微調小模型」的復興。通用大模型的優(yōu)勢是零樣本能力,但特定任務上,微調后的專用小模型往往更便宜、更快、更準。一些團隊開始用蒸餾技術,把大模型的「知識」壓縮進小模型,在封閉場景里實現(xiàn)90%的效果、10%的成本。這不是回到BERT時代,是用新工具做更精細的資源配置。

三條線交匯成一個結論:AI競賽的勝負手,正在從「誰能訓練最大模型」轉向「誰能用最小成本解決具體問題」。

當「夠用」成為策略

這種轉變對行業(yè)生態(tài)的影響是深遠的。

對AI公司來說,商業(yè)模式面臨重構。如果客戶學會「按需調用」,API收入的增長曲線會變平緩。賣「認知能力」變成賣「認知效率」,定價邏輯從「按能力 tier 收費」轉向「按任務價值收費」。一些廠商開始推「效果承諾」——達不到質量閾值,不收費。這是競爭壓力下的自然演化。

對企業(yè)技術團隊來說,核心能力在遷移。Prompt engineering 的熱度在退潮,「模型編排」(model orchestration)在升溫。懂業(yè)務場景、能設計路由策略、會評估性價比的工程師,比會調大模型參數(shù)的更有價值。AI infra 的招聘JD里,「成本優(yōu)化」和「延遲敏感設計」出現(xiàn)的頻率在快速爬升。

對創(chuàng)業(yè)者來說,窗口在收窄,也在打開。靠「接API做應用」的套利空間被壓縮——因為客戶自己也會算了。但幫助客戶「算清楚、省下來」的工具和服務,成為新機會。模型路由中間件、成本監(jiān)控儀表盤、自動微調流水線——這些「賣鏟子」的生意,在淘金熱降溫時反而更穩(wěn)。

一個有趣的對照:云計算的早期,也曾有過「買最大實例」的階段。直到容器化和Serverless普及,資源粒度細化,成本才降下來。AI正在走類似的路,只是速度更快、波動更劇烈。

回到那個70%的數(shù)字。它真正的刺痛點不是「浪費了多少錢」,而是「我們竟然這么久沒意識到」。技術團隊對模型能力的迷戀,掩蓋了對任務本質的審視。這種盲區(qū)在新技術周期里反復出現(xiàn)——先追逐可能性,再回歸經(jīng)濟性。

2026年的AI預算會議上,一個問題正在被頻繁提出:「這個任務,真的需要那個模型嗎?」

答案往往是不需要。而發(fā)現(xiàn)這一點本身,可能就是今年最重要的技術決策。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華為終端正式官宣:姚安娜代言華為新手機

華為終端正式官宣:姚安娜代言華為新手機

第一財經(jīng)資訊
2026-04-15 15:04:17
細思極恐!人類連太陽系都飛不出去,憑什么畫出銀河系的形狀?

細思極恐!人類連太陽系都飛不出去,憑什么畫出銀河系的形狀?

觀察宇宙
2026-04-15 22:13:42
愛潑斯坦案再發(fā)酵,梅拉尼婭親密照被曝光?特朗普解雇邦迪沒用

愛潑斯坦案再發(fā)酵,梅拉尼婭親密照被曝光?特朗普解雇邦迪沒用

青梅侃史啊
2026-04-14 19:53:23
卸妝后,王一博邋遢油膩,張柏芝像土撥鼠,劉曉慶神似禿頭阿哥

卸妝后,王一博邋遢油膩,張柏芝像土撥鼠,劉曉慶神似禿頭阿哥

手工制作阿殲
2026-04-15 17:39:28
俄國防出口公司:已簽署一系列蘇-57E戰(zhàn)機出口合同

俄國防出口公司:已簽署一系列蘇-57E戰(zhàn)機出口合同

財聯(lián)社
2026-04-14 18:35:12
2年前,那個砸神像、睡墳場“八字命硬”的網(wǎng)紅,如今卻變相了?

2年前,那個砸神像、睡墳場“八字命硬”的網(wǎng)紅,如今卻變相了?

天天熱點見聞
2026-03-30 06:53:48
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
馬斯克再放狠話:能建造出比中國任何公共交通系統(tǒng),都更好的系統(tǒng)

馬斯克再放狠話:能建造出比中國任何公共交通系統(tǒng),都更好的系統(tǒng)

Thurman在昆明
2026-04-16 00:25:54
車界大佬再撕電混車遮羞布,2升油耗疑造假,油耗高于燃油車!

車界大佬再撕電混車遮羞布,2升油耗疑造假,油耗高于燃油車!

柏銘銳談
2026-04-14 18:12:06
心酸!兩屆世錦賽亞軍坦言不可能奪冠:要贏趙心童這樣的球員 沒機會

心酸!兩屆世錦賽亞軍坦言不可能奪冠:要贏趙心童這樣的球員 沒機會

晚霧空青
2026-04-15 19:02:34
確定了!廣東正式簽來新大外,粵迷卻炸了鍋:該裁誰?能抗白邊嗎

確定了!廣東正式簽來新大外,粵迷卻炸了鍋:該裁誰?能抗白邊嗎

后仰大風車
2026-04-15 20:13:11
白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
浪姐史上翻車最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的!

浪姐史上翻車最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的!

兩只米老鼠
2026-04-14 03:27:12
93年出差賓館滿了,女同事說跟我將就一晚,我躺下后她卻悄悄靠近

93年出差賓館滿了,女同事說跟我將就一晚,我躺下后她卻悄悄靠近

人間百態(tài)大全
2026-04-15 06:45:03
恒大歌舞圖再曝光:許家印親自面試 貴賓房比外界說的夸張 刷三觀

恒大歌舞圖再曝光:許家印親自面試 貴賓房比外界說的夸張 刷三觀

念洲
2026-04-15 15:32:14
長腿格格也玩劇組夫妻了

長腿格格也玩劇組夫妻了

毒舌扒姨太
2026-04-15 22:42:11
名記:聯(lián)盟將調查三球對阿德巴約的動作,下輪附加賽前公布結果

名記:聯(lián)盟將調查三球對阿德巴約的動作,下輪附加賽前公布結果

懂球帝
2026-04-15 23:14:10
關門!關窗!關燈!即將進入高發(fā)期

關門!關窗!關燈!即將進入高發(fā)期

番禺臺
2026-04-15 19:04:03
接下來的廣州,地鐵、燃氣、水費都要漲價?

接下來的廣州,地鐵、燃氣、水費都要漲價?

南沙部落
2026-04-15 09:53:21
笑死!原來大佬的推薦信只需要幾個字,網(wǎng)友:一字千金

笑死!原來大佬的推薦信只需要幾個字,網(wǎng)友:一字千金

另子維愛讀史
2026-04-15 20:37:30
2026-04-16 01:00:49
閃存獵手
閃存獵手
全網(wǎng)蹲好價的野生捕手,算力與羊毛都不可辜負。
1398文章數(shù) 9關注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

美航母及1萬多士兵將抵中東 特朗普:戰(zhàn)爭或持續(xù)至11月

頭條要聞

美航母及1萬多士兵將抵中東 特朗普:戰(zhàn)爭或持續(xù)至11月

體育要聞

三球準絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

教育
家居
房產(chǎn)
健康
公開課

教育要聞

黃岡小升初招生題,求面積,方法思路太絕了

家居要聞

簡而不減 暖居之道

房產(chǎn)要聞

重磅調規(guī)!341畝商改住+中小學用地!寶龍城這把穩(wěn)了?

干細胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版