AI大模型競爭正邁入新的技術節點。以英偉達Blackwell架構訓練的首批旗艦模型即將亮相,花旗研究將其定性為當前行業競爭格局中"最重要的近期技術催化劑",而在此之前,多家頭部AI實驗室已密集推出或預告新品,新一輪能力躍遷正在加速兌現。
Anthropic本周正式發布Claude Opus 4.8,在智能體協作、可控推理與誠實度方面全面升級,發布時間較外界此前預期明顯提前;馬斯克在X平臺披露,參數量高達1.5萬億的Grok-5訓練已完成,預計2至3周內發布,參數規模是現役Grok-4的三倍;MiniMax工程主管同期發布預告,暗示采用全新稀疏注意力機制的MiniMax-M3即將登場。與此同時,OpenAI的GPT-6.0、谷歌的Gemini 3.5 Pro等新一代模型也已排入發布日程。
據追風交易臺消息,花旗研究5月22日報告指出,當前AI需求呈現OpenAI首席財務官Sarah Friar所稱的"垂直的需求之墻"態勢:谷歌每月處理的tokens量已達3.2千萬億(Q),同比增長7倍;Anthropic預計二季度末年化收入(ARR)約達500億美元,較3月底的300億美元大幅跳升,二季度收入預測為109億美元,環比增幅約130%;OpenAI一季度單季收入57億美元,已超去年上半年約43億美元的總和。然而,供給側增速更為漸進,算力與推理成本雙雙走高,供需錯配格局正在重塑整個行業的定價邏輯。
![]()
上述動態意味著AI平臺商業化路徑正沿兩個方向演進:能力競賽驅動前沿推理的持續溢價,供給約束則推動算力服務走向類云計算的預留定價模式。Blackwell訓練模型能否真正帶動能力躍遷,將是檢驗這一邏輯的關鍵節點。
Blackwell訓練模型:下一輪技術躍遷的真正起點
花旗研究把"首批基于Blackwell架構訓練的模型"列為近期AI競爭中最關鍵的技術催化劑,邏輯很直接:目前所有排在前沿模型榜單上的產品,包括OpenAI GPT-5.5(花旗AI智能指數60)、谷歌Gemini 3.1 Pro Preview(57)、Anthropic Claude Opus 4.7(57),全部是用上一代算力訓練出來的。
換句話說,Blackwell的算力優勢到現在還沒有真正體現在模型能力上。市場普遍預期,一旦首批Blackwell訓練模型落地,將與現有產品之間形成明顯的能力斷層。
這也是為什么花旗特別強調Mythos的節點意義——Anthropic的Claude Mythos預覽版,是目前已知的"前Blackwell時代"最后一批頂級模型之一,其對齊性和推理能力已被視為當前架構的天花板。Mythos之后,下一批重磅模型將是首批真正吃到Blackwell紅利的產品。
花旗模型發布日歷顯示,未來數月發布節點密集:谷歌Gemini 3.5 Pro、Anthropic Claude Sonnet 4.7等預計二季度內落地;Claude Opus 5、Sonnet 5及DeepSeek V5等定檔四季度;OpenAI GPT-6.0則排期三季度。其中哪些將成為首批由Blackwell算力全程訓練的產品,是市場當前最核心的關注點。
![]()
GPU算力租賃市場數據同樣印證了這一預期。花旗追蹤的Blackwell系列芯片((G)B200/(G)B300等)租賃價格自2025年下半年以來持續攀升,直接反映出市場對下一代訓練算力需求的強勁升溫。
Claude Opus 4.8:Anthropic在Blackwell前夕加速迭代
在距Claude Opus 4.7發布僅約一個月后,Anthropic本周發布Claude Opus 4.8,時間較此前外界根據代碼泄露推測的"6月中旬"窗口明顯提前。在OpenAI、谷歌等廠商持續推進智能體與推理模型競爭的背景下,Anthropic正以更快的迭代頻率押注高端企業AI市場。
此次升級的核心變化有三:一是新增"投入控制"(effort control)機制,用戶可主動調節模型推理資源的投入強度,在速度、成本與推理深度之間靈活取舍;二是推出"動態工作流"(Dynamic Workflows)研究預覽版,整合進Claude Code,支持協調數百個并行子智能體完成大規模復雜任務——Anthropic舉例稱,新系統可端到端處理覆蓋數十萬行代碼的大型代碼庫遷移;三是著力提升"誠實度"(honesty),內部評估顯示,Opus 4.8允許代碼缺陷未加提示通過的概率,僅為Opus 4.7的約四分之一,且對齊性已達到與Claude Mythos預覽版相媲美的水平。
在基準測試上,Claude Opus 4.8在衡量瀏覽器智能體能力的Online-Mind2Web中獲得84%,Anthropic稱其優于Opus 4.7和GPT-5.5。
定價維持與Opus 4.7一致:每百萬輸入token 5美元、每百萬輸出token 25美元。新增"快速模式"(Fast Mode),定價為每百萬輸入token 10美元,速度為標準模式的2.5倍,成本據稱僅為此前模型的三分之一。模型已在亞馬遜AWS、谷歌云及微軟Foundry同步上線。
Anthropic還在公告中透露,少數機構已開始在網絡安全場景中試用Claude Mythos預覽版(Glasswing項目),并預計"在未來數周內"將Mythos級別模型向全部客戶開放。
Grok-5與MiniMax-M3:更多強模型即將來襲
Blackwell訓練模型即將登場的背景下,多家頭部實驗室正密集預告新品,試圖在新一輪能力競賽正式開始前搶占位置。
馬斯克本周在X平臺披露,1.5萬億參數的Grok V9-Medium(Grok-5)訓練已完成,預計2至3周內向公眾發布。
![]()
相比之下,當前xAI全部生產流量運行在參數約0.5萬億的Grok-4上,新模型參數規模一舉擴至三倍。馬斯克特別提到,來自AI編程工具Cursor的大量編程數據已被納入補充訓練,后續還有更多數據將跟進。Cursor當前年經常性收入(ARR)已達20億美元,三個月內翻倍,開發者在其上產生的代碼補全、重構、調試交互數據,提供了完整的思維鏈訓練素材,對編程能力建模的價值明顯高于直接爬取代碼倉庫。
在此前戰略布局中,SpaceX已于4月21日宣布與Cursor達成合作,Cursor可使用Colossus超算訓練模型,SpaceX獲得以600億美元收購Cursor的期權,否則需支付100億美元合作費用。這一架構下,Grok-5針對編程場景的升級,將在與OpenAI Codex、Anthropic Claude Code的競爭中進一步加碼。
MiniMax方面,工程主管本周發布預告圖,暗示采用全新稀疏注意力機制的MiniMax-M3即將推出,據市場解讀,預填速度可提升9.7倍、解碼速度提升15.6倍。據花旗前沿模型排行榜,當前MiniMax-M2.7以每百萬tokens僅0.22美元的極低定價在市場中占據一席,M3落地后,其在性價比賽道的優勢有望進一步延續。
![]()
此外,DeepSeek V4 Pro(4月24日發布,花旗AI智能指數52)以及來自中國多家機構的Qwen3.6 Plus、Kimi K2.6等產品也相繼入場,前沿模型競爭格局的多極化趨勢愈發清晰。
需求"垂直墻":企業采用仍在早期
花旗研究用"垂直的需求之墻"來描述當前AI需求的增長態勢——這個詞最早來自OpenAI首席財務官Sarah Friar,意思很直白:需求增速幾乎是垂直拉升的。
具體數據印證了這一判斷:谷歌每月tokens處理量同比增長7倍,達到每月3.2千萬億(Q);Anthropic預計二季度末年化收入(ARR)約達500億美元,較3月底的300億美元大幅跳升,二季度收入預測為109億美元,環比增幅約130%;OpenAI一季度單季收入57億美元,已超去年上半年約43億美元的總和。
花旗認為,這些數據背后更重要的信號是:企業端AI采用加速仍處于早期階段,需求的天花板遠未到來。
與此同時,Intuit、Meta及Cisco相繼宣布裁員,花旗將這些行動解讀為AI加速沖擊傳統生產效率場景的潛在信號,并指出一個核心問題仍懸而未決:AI帶來的生產力紅利,究竟將流向AI平臺、軟件廠商、企業客戶還是勞動力市場?這一問題正隨著基礎設施容量的邊際收緊而日益緊迫。
推理定價:高端溢價強化,低端競爭加劇
花旗研究的定價跟蹤數據顯示,AI定價體系正形成明顯的雙軌格局:接入層面競爭趨于激烈,但前沿推理定價幾乎未見下行壓力。
谷歌將AI Ultra訂閱價格從每月250美元下調至200美元,并于5月19日推出100美元/月新檔位,面向專業個人用戶,提供5倍于Pro套餐的使用限額,并捆綁YouTube Premium。相比之下,GPT-5.5相較GPT-5.4的價格約上漲2倍,疊加AI實驗室加速淘汰舊款模型的趨勢,顯示出頭部廠商正通過訂閱分層與前沿推理溢價對用戶群體進行更精細化的市場切割。
企業端采用在邊際上亦承受一定成本壓力。據OpenRouter 5月4日對GPT-5.5的成本分析,不同工作負載下成本增幅為49%至92%,部分被輸出tokens減少19%至34%所抵消。
![]()
供給約束:算力稀缺催生預留定價新模式
供給增速跟不上需求,直接推動了AI算力服務模式的變革。
OpenAI于5月20日推出"保證容量"(guaranteed capacity)方案,允許企業以1至3年期合約鎖定算力,換取隨年度承諾量遞進的token折扣;Blackstone與Google Cloud于5月18日宣布合作;Anthropic近期也完成多項推理服務商業協議。花旗認為,這些舉措的實質是構建云計算式的"預留實例"和"算力即服務"機制,以系統性方式鎖定稀缺推理產能。
分析師還特別指出,前沿能力供給中最嚴峻的約束,依然在于人才層面。頂尖AI研究員Andrej Karpathy近期加入Anthropic,再度印證了頭部實驗室在高端人才爭奪上的高強度角力。在硬件算力之外,頂尖研究人才仍是前沿模型能力演進的核心瓶頸——這也意味著,即便Blackwell算力到位,能否真正轉化為模型能力的躍遷,最終還是取決于人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.