AI產業(yè)的價值重心正在發(fā)生結構性轉移。
過去兩年間,英偉達、內存廠商及能源供應商主導了AI投資回報的分配,但隨著智能體AI(Agentic AI)商業(yè)化加速,模型層的利潤空間正以前所未有的速度擴張,而掌控算力供應端的英偉達與臺積電,卻尚未將這一趨勢充分反映于定價之中。
Anthropic是這一轉變的最直接注腳。據SemiAnalysis最新研究,Anthropic的年化營收(ARR)已從年初的90億美元飆升至440億美元以上,其推理基礎設施的毛利率同期從38%躍升至逾70%。與此同時,代幣(token)生產成本因硬件迭代和軟件優(yōu)化大幅壓縮,價值與成本之間的剪刀差持續(xù)擴大,推動模型廠商進入利潤率快速抬升的新階段。
在供應端,英偉達和臺積電坐擁最稀缺的資源,卻尚未對當前的需求盛況作出充分的價格響應。SemiAnalysis認為,這一定價滯后構成了一個重要的市場錯位:以Vera Rubin(VR NVL72)為代表的下一代系統(tǒng)具備顯著的價格上調空間,而誰能在這場價值重新分配中搶占先機,將深刻影響AI產業(yè)鏈各環(huán)節(jié)的投資邏輯。
AI價值池的三年遷移路徑
2023年至2025年間,AI投資的超額回報主要集中在基礎設施層。
英偉達于2023年5月首次發(fā)布爆款財報,單日盤后大漲25%,正式開啟AI投資浪潮。2024年,Vistra和GE Vernova分別上漲265%和146%,躋身標普500表現最強個股,能源瓶頸成為市場焦點。2025年,內存板塊接棒領漲,SanDisk、Western Digital、Seagate和Micron等均錄得全年逾200%的漲幅,存儲供需失衡成為驅動定價的核心變量。
與此同時,模型廠商和推理服務商的毛利率長期承壓。彼時AI的實際效用被批評者認為不過是"更好的谷歌搜索"加上聊天界面,與數萬億美元的預期資本開支嚴重背離。
這一格局在2025年底出現了根本性的轉變。
智能體AI:重塑代幣經濟學的拐點
SemiAnalysis將2025年12月視為AI商業(yè)化的真正拐點——智能體AI開始穩(wěn)定運行,并在企業(yè)工作流中大規(guī)模落地。這一變化的核心意義,在于它從根本上改變了代幣的經濟價值。
以SemiAnalysis自身為例,其年化代幣支出已相當于員工薪酬總額的約30%,每名員工每月消耗代幣量超過50億個,是Meta內部人均水平的5倍以上。研究團隊列舉了多個真實案例:原本需要初級分析師數小時完成的財務建模、圖表制作和盈利分析等工作,現在通過智能體以極低的代幣成本即可完成,而同等人力成本曾高達數百至數千美元。
與此同時,代幣的生產成本正在急劇下降。SemiAnalysis估算,在智能體任務場景下,運行Opus 4.7的實際混合價格約為每百萬代幣0.99美元,遠低于5美元/25美元的官方標價——原因在于智能體工作負載具有極高的輸入輸出比(約300:1)和超過90%的緩存命中率,大量代幣落入最低價格檔位。
硬件層面的加速同樣顯著。相較于一年前的H100,Blackwell系列在前沿工作負載下每秒可生成的代幣數量提升約30倍。進一步對比顯示,最優(yōu)化配置下的GB300 NVL72相較最優(yōu)化H100在FP8精度下吞吐量提升約17倍,切換至FP4后這一差距擴大至32倍,而總擁有成本(TCO)僅高出約70%。
![]()
價值與成本的雙向剪刀差,正是Anthropic毛利率從38%躍升至70%以上的核心驅動力。
模型層定價權:為何不會被競爭蠶食
面對模型廠商利潤率的快速擴張,市場最常見的質疑是:競爭最終會壓低價格。SemiAnalysis對此持保留意見,并給出兩點支撐。
其一,前沿閉源模型的定價權依然穩(wěn)固。盡管開源模型的基準測試成績不斷刷新,但在真實的知識工作場景中,其表現仍明顯弱于閉源前沿模型。以Kimi K2.6(定價0.95美元/4美元)為例,其對Anthropic Opus定價的下行壓力十分有限。
其二,算力約束意味著沒有任何一家前沿實驗室能夠獨自滿足整個市場的需求。Anthropic已開始通過將Claude Code鎖定在每月100美元以上訂閱門檻背后、限制第三方接入等方式主動管理需求,代幣需求在可預見的未來將持續(xù)超過供給。這一結構性稀缺賦予了前沿模型廠商按價值而非成本定價的底氣。
Anthropic已通過產品線策略兌現這一邏輯:Opus fast定價是普通Opus的6倍,即將推出的Mythos定價為25美元/125美元,是普通Opus的5倍,而頭部企業(yè)客戶仍愿意為這些高價SKU買單。SemiAnalysis表示,若Anthropic將Mythos fast定價至150美元/750美元,其本身也會是付費用戶。
英偉達與臺積電:稀缺資源的定價滯后
然而,掌握最核心稀缺資源的兩家公司——英偉達與臺積電——卻并未充分跟上這一波價值重估。
臺積電的N3先進制程產能已成為整個AI算力擴張最緊張的瓶頸。英偉達、博通、Annapurna、聯發(fā)科和AMD均在爭奪有限的N3晶圓配額,而N3產能利用率預計將在2026年下半年突破100%。DRAM晶圓廠利用率已超過90%,內存整體供應偏緊,但定價卻相對保守。
SemiAnalysis認為,臺積電完全有條件大幅提價,且客戶不僅會接受,部分客戶甚至會歡迎——英偉達就是典型案例:若TSMC提價意味著競爭對手獲得更少產能配額,英偉達支付更高晶圓價格反而有利于鞏固其市場地位。英偉達CEO黃仁勛2024年曾公開表示臺積電應該提高晶圓價格,其背后邏輯正在于此。
![]()
英偉達自身的定價策略也呈現出類似的保守傾向。SemiAnalysis指出,英偉達的定價框架仍錨定于此前"單位算力愿付價格隨時間下降"的假設,但這一假設已不再成立。隨著智能體工作負載爆發(fā),算力需求不再是線性增長,而是呈現復合加速態(tài)勢。
Rubin系統(tǒng):量化Nvidia的定價空間
以即將于2026年下半年發(fā)布的Vera Rubin(VR NVL72)為參照,SemiAnalysis構建了一套"一圖定乾坤"(One Chart to Rule Them All)的定價分析框架,從成本端與價值端分別錨定租金定價的地板與天花板。
![]()
成本端(地板):基于Neocloud(新興云服務商)項目內部收益率(IRR)不低于15.6%的部署門檻,VR NVL72每小時每GPU的最低租金需達約4.92美元,方可維持Neocloud的部署意愿。
價值端(天花板):以GB300當前5年期合約租金約每PFLOP 0.70美元為錨點,VR NVL72對應的租金上限約為每GPU每小時12.25美元。
![]()
目前,VR NVL72系統(tǒng)定價僅使每PFLOP成本降至約0.28美元,相比GB300 NVL72降幅達60%,遠超歷史趨勢線的改善幅度。這意味著Nvidia的服務器價格存在約40%的上調空間,即便調價后仍可為Neocloud留下足夠利潤空間,且整體成本改善幅度依然低于歷史趨勢。
SOCAMM內存定價是另一個關鍵變量。VR NVL72采用插槽式LPDDR5X內存模組(SOCAMM),可與計算單元獨立定價。SemiAnalysis估算,英偉達在2026年一季度支付的SOCAMM合同價約為每GB 8美元,較上季度有顯著跳升;預計至2026年底,SOCAMM價格可能超過每GB 13美元。在此背景下,英偉達若在SOCAMM上實現60%的毛利率,邏輯上具備合理性:一方面內存供應受限、英偉達掌握最大份額優(yōu)勢;另一方面,VR NVL72在TCO層面的性能領先地位使客戶缺乏替代選擇。
價值歸宿:誰在贏,誰在等
SemiAnalysis的框架揭示出當前AI價值分配的核心矛盾:代幣經濟學的改善正在迅速推高模型廠商、推理服務商及Neocloud的利潤,但作為算力供給端最稀缺資源的掌控者,英偉達和臺積電的定價行為與其供給稀缺性之間存在明顯錯位。
這一錯位的持續(xù),本質上是一種主動選擇——英偉達正在扮演類似"AI中央銀行"的角色,通過軟件效率提升向下游輸送價值,以維持生態(tài)系統(tǒng)的長期擴張動力,同時規(guī)避反壟斷監(jiān)管壓力。臺積電則延續(xù)了歷史上"穩(wěn)定生態(tài)、不吃盡上行紅利"的定價哲學。
然而隨著推理ROI日益清晰、價值定價邏輯在市場中普及,這兩家公司向價值定價框架切換的壓力將持續(xù)上升。一旦切換發(fā)生,AI產業(yè)鏈的價值分配格局將再度重塑——屆時,算力供給端的議價權將在更大程度上向硬件層回歸。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.