中國智算行業正在同時經歷兩件矛盾的事:算力越來越貴,但Token越來越便宜。
一面是算力需求溢出,國內優質算力資源持續緊張,價格自今年春節前已漲超50%,有渠道商反映,部分熱門算力卡型號”不是貴的問題,是根本拿不到”;國內外的智算中心瘋狂堆算力,甚至要靠簽遠期合同鎖定。
但另一面是Token價格崩塌,兩年前每百萬token要幾十美元,現在不到一美元,主流大模型廠商為了爭用戶,幾乎在做賠本的生意。行業內有觀點認為,當前以超低價爭奪用戶的模式,長期來看可持續性存疑。
這說明大模型產業發展的早期,還沒有找到多贏的方式,也注定是不可持續的商業模式。當芯片廠商拿走了60%以上的利潤,做應用的幾乎沒有定價權,中間層的智算云,頂著上游的成本壓力,也要面對下游客戶不斷壓價。
![]()
在行業人士看來,更根本的問題是,現在撐著整個行業運轉的硬件,本質上是為訓練設計的,拿來跑推理、生產Token,就像開著法拉利送外賣,成本結構從一開始就對不上。
訓練側的邏輯,撐不起推理側的賬
過去三年,智算行業賣出了一個共同的故事,誰有卡,誰就贏。
這個邏輯在訓練側是成立的,大模型競賽本質是算力競賽,一個1萬卡集群和一個10萬卡集群能訓出來的模型根本不在同一天花板。
九章云集創始人方磊透露,九章云極目前收到的遠期訂單是自身可交付容量的10倍以上,鎖定資源的定金比例最低只有5%,但若同時鎖定價格則需要30%到40%的定金。
但推理側的生意,早就跑在了一條完全不同的軌道上。全球范圍內,Token單價持續降低,底層的算力成本卻并沒有同步下降,能耗、折舊、網絡,每一筆都是真實支出。
問題還不止于此,智算中心的算力利用率普遍不高,根本原因在于網絡傳輸本身成為了瓶頸。在大規模訓練集群里,數萬塊加速卡需要頻繁同步數據,任何網絡延遲都會讓大量算力陷入等待。
此前有業內人士指出,千卡級訓練中通信時間占比可達30%以上,在超大規模場景下甚至高達50%至70%,scale up(單機多卡)和scale out(多機組網)之間的效率鴻溝,是從訓練工廠移植過來、天然無法消除的技術債。
如上所述,產業鏈的利潤分配結構也是問題,上游芯片廠商吃掉了整條鏈路60%以上的價值,中游云廠商在CPU時代的凈利潤率大約在35%,但在AI時代,算力成本占到運營支出的七八成,毛利空間被雙向擠壓。
銀河證券分析師吳硯靖稱,Token經濟的定價權目前仍集中在上游,中游是效率放大器,下游暫時沒有話語權。換而言之,中下游的景氣度改善需要等待上游產能充分釋放之后。
硬件供給側同樣受限,國產AI芯片產能不足,是當前最薄的那塊木板。
國內方面,還多了一層算電協同的復雜性,業內人士提到,綠電直供有60到80公里的物理傳輸上限,一旦上高壓就要繳納“過路費”,而且光伏夜間不發電,風電功率曲線波動劇烈,和智算中心希望的恒定功率曲線嚴重錯位,儲能配比超過15%就開始虧本。
當前算電協同還有待更多突破,包括綠電直供能否通過高壓更遠傳輸,水電和核電能否納入綠電認定,甚至綠證價格本身也在持續上漲,今年以來已漲了近一倍。
現在談Token工廠,時機上既不早也不晚,早了基礎設施不成熟,晚了就錯失機會窗口。
![]()
做運營商,不做中間商
云計算行業已經很久沒有新的挑戰者,即便AI帶來了全新的變量,但云計算所需要的規模和資金,依然是現實的護城河,一些企業極卻給出了一個讓人意外的答案。
“九章非常重要的定位,是走出一條與互聯網大廠云不同的路——做算力賽道的‘第三方選擇。”方磊所說的大云,是阿里云和火山引擎,阿里云和火山引擎背后是兩家年收入數千億的互聯網巨頭,九章云極至今仍是一家創業公司,這種反差,怎么看都有些錯位。
他認為,大云有大云的結構性特點,那些在互聯網時代成長起來的云廠商,底層架構是為帶寬和存儲優化的,AI時代90%的成本是計算,100G的老交換機和為AI專門設計的400G交換機之間,效率差距難以彌合。新的云計算平臺跑同樣一張英偉達GPU,在特定場景下效率優勢顯著,這是歷史包袱決定的。
事實上,行業內存在一種“算力貿易”模式——買一批服務器放進機房,租給客戶,自己沒有調度能力。
在方磊看來,現貨倒賣,客戶應該簽遠期訂單才能拿到資源,資產是自己控制的——一些與互聯網大廠存在競爭關系的企業,在選擇算力平臺時會優先考慮中立方案——這正是第三方云存在的理由。
訓練工廠對應零到一的模型制造,目標是在未來24個月內形成10萬P的訓練算力,方磊判斷,下一代前沿模型的突破,要靠30萬卡甚至更大的集群才能跑出來,而這樣的超大規模基礎設施仍在建設過程中。
Token工廠對應一到N的規模化交付,目標是每天10萬億token,但這10萬億不是通用token,而是面向專業場景的”專業級”和”前沿級”。方磊將token市場分成三層:消費級(每百萬token約1美元)、專業級(每百萬20到40美元)、前沿級(每百萬150美元以上)。
九章的戰略錨定在后兩層,幫助客戶訓練專業模型,再通過Token工廠低成本交付專業token。他的邏輯是,千行百業里真正能讓AI落地的,不是通用大模型,而是垂直專業模型,“沒有專業模型,所謂‘AI+行業’就只是一句口號”。
具體落地上,九章云極計劃合作超過1000家專業模型廠商,資產端則復制了一種基礎設施行業常見的輕資產模式:央國企出資持有資產,九章負責運營,按比例分成。
此外,九章云極已在東南亞、日本、中東及歐洲多地進行布局,將中國方案定位為AI基礎設施的”第二選項”。這背后的邏輯是:上一輪云計算,歐洲和日本幾乎全面依賴美國技術棧,當前AI時代各國對”主權云”的訴求空前強烈,中國的模型能力、成本優勢和不依附于美國供應鏈的屬性,正好填上了這個缺口。(本文作者 | 張帥,編輯 | 楊林)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.