![]()
算力可以走普惠路線,可以追求性價比。但沒有廠商,能一直為愛發(fā)
文|羅小媚編|楊肖若 張弘一
出品|商業(yè)秀
“月均調(diào)用API超15萬次每月”,盯著團隊開發(fā)的AI客服SaaS工具后臺近三個月的API調(diào)用量和賬單,李然的眉頭緊鎖。
4月13日,阿里云官網(wǎng)的一紙公告,更讓李然的心一沉。公告顯示,調(diào)整DataWorks標準版、專業(yè)版用戶的API(?應(yīng)用程序編程接口)免費額度并支持按量付費。DataWorks標準版,調(diào)用API的免費額度調(diào)整為10萬次/月,超出部分采用OpenAPI按量付費的方式。
這意味著,從4月14日政策生效起,每月至少5萬次的超額調(diào)用,將讓李然這位DataWorks標準版的用戶,運營成本增加超8000元,而他背后的AI客服SaaS工具上月的凈利潤剛過萬。
“算了一筆賬,這真的不是靠AI降本提效了。你看我們?nèi)ツ赀@時候,甚至還在為免費調(diào)用量用不完發(fā)愁呢!”李然笑著對我們調(diào)侃道。
2025年同期,李然和他的創(chuàng)業(yè)項目調(diào)用1000萬Token的成本僅500元,而如今同樣的用量,如果說再疊加騰訊云混元模型、百度文心的單價上調(diào),成本已飆升至近萬元。
他說,自己的公司現(xiàn)金流還能再撐三個月,但成本一旦上漲,始終是有些壓力。
今年以來隨著AI的火爆,尤其是2026年春節(jié)以來的OpenClaw(龍蝦)熱徹底改變了Token的消耗邏輯,像李然這樣的中小開發(fā)者急需Token算力。
根據(jù)摩根大通曾預測,中國的AI推理Token消耗量預計將從2025年的約10千萬億增長至2030年的約3900千萬億,五年間增長約370倍。
當全球AI行業(yè)還在期待技術(shù)突破時,一場由算力價格調(diào)整引發(fā)的成本考驗也在降臨。最近國內(nèi)外AI和云服務(wù)廠商的價格調(diào)整動作開始愈發(fā)密集,根據(jù)公開報道,阿里云已確認,從4月18日起,AI算力、存儲等產(chǎn)品將全線漲價,最高漲幅34%。
從阿里、騰訊到AWS、OpenAI,無一家缺席,甚至海外廠商的調(diào)整幅度比國內(nèi)更甚。這意味著,所有消費者此前享受的API免費調(diào)用服務(wù)大幅縮水,超出部分必須真金白銀買單,尤其是對像李然這樣高頻用戶來說,也會增加他們的調(diào)用API成本。
這讓無數(shù)中小開發(fā)者正在重新審視這場由AI帶來的成本優(yōu)化競賽。
01一場全球范圍的算力調(diào)價
這場調(diào)整,其實是全球范圍內(nèi)的算力價值重估。
先看國內(nèi)廠商的調(diào)整路徑。最先調(diào)整的是百度智能云,3月18日其官宣,4月18日起AI算力相關(guān)產(chǎn)品價格上調(diào)5%-30%,文心一言系列API單價上調(diào)12%-25%,取消低階模型的“永久免費不限量”,改為QPS限流+超額計費。
這被業(yè)內(nèi)認為是算力補貼時代的結(jié)束,畢竟過去靠免費額度吸引的中小開發(fā)者,如今需按實際用量付費。
緊隨其后的是騰訊云,3月調(diào)整混元模型API價格,4月9日騰訊云正式發(fā)布價格調(diào)整公告,宣布將于5月9日起對AI算力、容器服務(wù)TKE-原生節(jié)點及彈性MapReduce(EMR)相關(guān)產(chǎn)品刊例價統(tǒng)一上調(diào)5%。
字節(jié)火山引擎的調(diào)整相對隱蔽一些,Q1豆包LLM Token單價調(diào)整,文生視頻API價格較內(nèi)測期上漲,單15秒視頻成本約15元,同時取消無限免費調(diào)用,僅保留新用戶500萬Token/30天的短期額度。
智譜AI的調(diào)整最為頻繁。幾乎智譜的每次發(fā)布模型都伴隨著價格上漲。4月8日,智譜發(fā)布旗艦開源模型GLM-5.1,同時智譜GLM系列API價格再度上調(diào)10%,直逼Anthropic。本月12日,智譜Coding Plan(海外版)漲價,月付價格幾乎翻倍,這已經(jīng)是智譜今年第三次提價了。
在3月31日的業(yè)績電話會上,智譜CEO張鵬表示,2026年第一季度智譜的API調(diào)用定價提升83%,即便如此,市場依然呈現(xiàn)出供不應(yīng)求的情況,調(diào)用量增長400%。
算力雖貴,但也在印證一個事實,那就是AI已從可選工具變成了企業(yè)的剛需生產(chǎn)資料,用戶對價格的敏感度卻低于對模型能力的需求。
海外廠商的調(diào)整也來勢洶洶。1月22日,亞馬遜AWS打破20年“價格下行”慣例,上調(diào)EC2機器學習容量塊價格15%;2月15日,微軟Azure調(diào)整GPT-4o、GPT-4 Turbo API價格,取消GPT-4o免費額度;3月10日,Google Cloud官宣5月1日起AI計算實例價格調(diào)整,下架Gemini低價訂閱套餐;OpenAI則調(diào)整GPT-4o/4 Turbo API價格,ChatGPT Plus從20美元/月漲至30美元/月,每日消息限30條。
從國內(nèi)到海外,從算力實例到API調(diào)用,這場全球范圍內(nèi)的集體調(diào)價,硬是把AI產(chǎn)業(yè)從補貼擴張階段拉回到了價值定價的理性軌道。免費額度成為過去,按量付費才是常態(tài),開發(fā)者們是時候需重新算一筆賬,評估成本結(jié)構(gòu)了。
02調(diào)整背后的邏輯
全球廠商們集體調(diào)整價格,逐利是表面的,本質(zhì)上還是AI產(chǎn)業(yè)從擴張期進入盈利驗證期的必然。「商業(yè)秀」認為,這場全球范圍的調(diào)整背后藏著3個底層邏輯。
首先,最核心的底層邏輯是算力價值重估。
隨著AI的核心燃料(GPU、HBM)的供給緊張,成本上漲,也就倒逼所有下游廠商調(diào)整價格。而這一切的起點,或許要回到英偉達來看。
目前英偉達占據(jù)全球85%的AI芯片市場份額,凈利潤率高達56%,可以說,在很大程度上,它的定價直接決定了整個行業(yè)的成本底線。
2026年,英偉達Blackwell系列GPU交付周期排至2027年,單卡采購成本同比上漲30%以上。而HBM3E高帶寬內(nèi)存現(xiàn)貨價較2025年底上漲超20%,全球產(chǎn)能缺口50%-60%,甚至出現(xiàn)供應(yīng)緊張的局面。
更重要的是,英偉達通過硬件+軟件的閉環(huán)生態(tài),進一步拉高了行業(yè)的成本。全球90%的AI訓練代碼基于CUDA編寫,500萬開發(fā)者都依賴這家巨頭的生態(tài),每顆H20芯片就要搭配1.2萬美元的CUDA授權(quán)費,隱性成本占比就超過了30%。
這種從性能到成本的雙重影響,也讓阿里、騰訊、微軟、谷歌等廠商們只能被動接受成本上漲,繼而再將壓力傳導給下游用戶。
如果說,算力成本上漲是被動調(diào)整的理由,那么Token需求的指數(shù)級增長,就是廠商們主動調(diào)整的底氣。
2026年,AI應(yīng)用從單輪對話進入到了智能體時代,隨之而來的是Token消耗呈現(xiàn)指數(shù)級的增長。以O(shè)penClaw等Agent為例,它的單任務(wù)多輪遞歸、工具調(diào)用和反思驗證,光是Token消耗,就已經(jīng)是傳統(tǒng)對話的50到100倍,單個活躍Agent月耗Token可以達到普通用戶的千倍以上。
數(shù)據(jù)顯示,2026年一季度國內(nèi)日均Token調(diào)用量突破140萬億,較2024年初的1000億增長超過1400倍。字節(jié)豆包日均Token消耗超過120萬億,其中多模態(tài)(比如視頻/圖像)Token占比超過40%,成本是純文本的10倍以上。而百度千帆平臺企業(yè)用戶Token消耗Q1環(huán)比增長了280%。
目前算力的消耗狀態(tài)可以用一句話來形容,那就是低階免費模型需求旺盛,高階付費模型供不應(yīng)求。一旦需求增長,供給緊張,價格自然就由供需決定,這也就可以解釋為什么智譜價格調(diào)整后調(diào)用量反而增長400%了。
由是觀之,高質(zhì)量Token成為稀缺資源。
當然最根本的變化,還是整個AI產(chǎn)業(yè)的商業(yè)邏輯變了。行業(yè)開始從燒錢換規(guī)模、虧損換用戶,轉(zhuǎn)向了盈利優(yōu)先和精細化運營,定價權(quán)從用戶端回歸廠商端。
過去兩年,整個AI行業(yè)處于瘋狂擴張的階段,大家的資本投入也多,廠商們靠著免費API、低價算力吸引用戶從而占領(lǐng)市場。哪怕是AI業(yè)務(wù)持續(xù)虧損也無所謂,反正還有其他業(yè)務(wù)的利潤支持,還有資本的資金來保障持續(xù)投入。
但是,進入2026年,風向就變了。資本投入趨于理性了,廠商們紛紛表示我們有盈利壓力了,畢竟大老板說了:AI業(yè)務(wù)必須給我盈利。
所以,這樣一來,我們就能理解為什么阿里云調(diào)整免費額度,開啟按量付費,而騰訊云、百度智能云全鏈路調(diào)整價格。字節(jié)火山引擎則是利用內(nèi)部規(guī)模效應(yīng)降低成本,同時通過外部價格調(diào)整實現(xiàn)AI業(yè)務(wù)盈利,海外的OpenAI、Anthropic,則也通過價格調(diào)整兌現(xiàn)模型能力的價值。
參考亞馬遜AWS歷經(jīng)14年的奮斗才跨過盈虧平衡點,阿里云則在2022年走向盈利。國內(nèi)云廠商的價格戰(zhàn),早在 2014 年便已拉開帷幕,此后十余年間從未停歇,阿里云常年主動發(fā)起大規(guī)模降價,單次最高降幅超 50%,而騰訊云則始終快速跟進,甚至祭出比阿里云更低的報價,展開貼身肉搏式競爭。
據(jù)公開報道,騰訊云在過去很長一段時間里被視為集團的成本中心。為了在阿里云和華為云的激烈競爭中快速搶占市場份額,騰訊云長期采取了激進的低價策略,通過遠低于成本的報價和長期不漲價的承諾來獲取大客戶訂單。?
而這種策略,雖然讓騰訊云的營收規(guī)模快速做大,一度坐穩(wěn)國內(nèi)第二,但也會導致業(yè)務(wù)長期處于規(guī)模不經(jīng)濟的怪圈,也就是規(guī)模越大,虧損可能越嚴重。直到2025年,騰訊云業(yè)務(wù)才實現(xiàn)了全年規(guī)模化盈利。
毋庸置疑的是,隨著AI算力需求的上漲,市場規(guī)模越來越大。但是,絕大多數(shù)云廠商卻依舊是常年處于虧損狀態(tài)。目前這幾家除了市值突破4000億港元的智譜,有資本底氣來繼續(xù)抬高價格,繼續(xù)折騰,其他家?guī)缀踹€在垂死掙扎。
在這樣的大環(huán)境下,更不要說中小企業(yè)的生存了。
03成本增加和賬單反思
“我們這種小團隊,沒有自研模型,沒有算力儲備,只能依賴公有云API。”李然的聲音里透著一絲無奈,“成本上漲后,要么調(diào)整價格,要么壓縮利潤。”
更現(xiàn)實的是,廠商們會把算力資源,優(yōu)先分配給付費率高、用量大、毛利高的客戶比如金融、政企、頭部互聯(lián)網(wǎng)企業(yè)等,中小企業(yè)不僅會增加成本,還可能面臨資源分配的問題,獲取穩(wěn)定算力的難度也會有所增加。
這背后最受影響的反而是那些套殼應(yīng)用,也就是沒有任何技術(shù)壁壘,只是簡單調(diào)用API做二次開發(fā)的企業(yè)和平臺。“一旦成本上漲,它們的成本優(yōu)勢減弱,那就需要重新審視商業(yè)模式了。”前述投資人告訴「商業(yè)秀」。
對個人開發(fā)者來說,免費額度的調(diào)整同樣也會帶來影響,因為零成本試錯的窗口關(guān)閉了。百度調(diào)整低階模型的免費額度、字節(jié)調(diào)整豆包的免費額度,僅保留新用戶短期額度(百度100萬/90天、字節(jié)500萬/30天)。
是時候需重新規(guī)劃成本投入了。這種賬單反思,也正在倒逼開發(fā)者從無腦調(diào)用轉(zhuǎn)向精打細算,開始研究模型壓縮、量化、上下文窗口優(yōu)化、RAG檢索增強,甚至說混合調(diào)用不同版本模型,這些只是為了降低Token消耗。
不過,這也需要時間和技術(shù)積累,對于很多中小團隊來說,當務(wù)之急是重新規(guī)劃公司的發(fā)展路徑。李然決定看看研究一下各家的套餐,“組合疊加使用起來,會更劃算。”
可以看到的是,這場價格調(diào)整,正在加速AI產(chǎn)業(yè)的分化。頭部企業(yè)憑借全棧能力與規(guī)模效應(yīng),調(diào)整后仍能保持毛利,甚至通過資源優(yōu)化進一步鞏固市場份額。而中小廠商,尤其是無自研模型、無算力儲備的中小AI服務(wù)商,成本增加無法傳導,利潤受到影響,需重新尋找發(fā)展路徑。
不過,也會有例外,那些深耕垂直場景、有核心技術(shù)(如模型優(yōu)化、成本管控)的中小廠商,反而可能在這場調(diào)整中跑出來。它們不需要依賴高端API,只要能在垂直場景中實現(xiàn)降本增效,就能找到自己的出路。
相信有很多人關(guān)注這場價格調(diào)整,有人認為廠商們逐利,讓中小企業(yè)和開發(fā)者面臨成本壓力。但「商業(yè)秀」認為,這場調(diào)整也預示著AI產(chǎn)業(yè)正在走向成熟。畢竟,過去兩年免費AI的補貼模式,讓很多人誤以為AI是免費的,也催生了大量無價值的應(yīng)用,浪費了算力資源。而2026年的這場集體調(diào)整,本質(zhì)上是市場在優(yōu)化和淘汰無價值的應(yīng)用,倒逼技術(shù)迭代。只有這樣,才能讓真正有價值的AI應(yīng)用獲得合理的商業(yè)回報。
算力可以走普惠路線,可以追求性價比。但沒有廠商,能一直為愛發(fā)電。
這場調(diào)整對廠商們來說,也是商業(yè)邏輯的回歸。接下來可以用成本+合理利潤定價來實現(xiàn)AI業(yè)務(wù)的可持續(xù)盈利。對中小企業(yè)和開發(fā)者來說,它們除了要控制自己的成本,更要轉(zhuǎn)向技術(shù)優(yōu)化和深耕垂直場景。
AI從來都不是免費午餐。未來AI行業(yè)進入價值付費時代,只有真正能創(chuàng)造價值,做好成本管控的企業(yè)和開發(fā)者,才能不被時代拋棄,站穩(wěn)腳跟活下去。「完」
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.