網易首頁 > 網易號 > 正文 申請入駐

國產芯片,能否解決智譜和MiniMax的算力荒問題

0
分享至


4月24日,DeepSeek正式發布新模型V4,以開源、低價、高性能給市場帶來沖擊,智譜與MiniMax雙雙跳水,市值一度跌超10%和12%。有網友戲稱,DeepSeek果然是國產大模型最嚴厲的父親。

無論是新模型V4,還是近期DeepSeek的融資消息,無疑都會給智譜和MiniMax的股價帶來較大波動。4月23日,我們獨家報道DeepSeek最新估值達到3000億元,目前這個數字已經得到一位DeepSeek內部人士的確認。

當前真正卡住智譜和MiniMax的不是別的,而是年初龍蝦火爆后帶來的算力荒。

一位頭部大廠算法人員算了一筆賬,在同一個項目里改幾行代碼,不搭skills,AI先得讀完整套系統的上下文,工程文件、依賴聲明和類定義統統加載,單次任務幾十萬Token可能一下就燒完了。去年底同樣花10塊錢能跑完的任務,今年賬單上變成了近20塊。

“真到了需要復雜推理還原問題的時候,真不如自己手寫,AI的性價比不如大學生,好用還便宜?!苯衲暌詠恚亲VAPI價格連漲三次,4月發布GLM-5.1后Token價格再度上調10%,外版Coding Plan月付價格幾乎翻倍,算下來,第一季度智譜的API定價累計上調約83%。MiniMax則將之前的Coding Plan全面升級為Token Plan,新增免費額度減少。

做出同樣動作的還有阿里和騰訊,他們都將Coding Plan下架換成Token Plan。4月,阿里云四天內連發三條產品漲價公告,部分項目漲幅最高達34%。更早的3月,騰訊云部分模型價格漲幅高達463%。這意味著,哪怕成為高階會員,Token量大管飽的日子也已經一去不復返了。

智譜CEO張鵬上個月在內部會議表示,“未來12個月最大問題是算力,不是需求?!倍鵀榱嗽谟邢薜馁Y源下求生存,MiniMax創始人閆俊杰表示,雖然公司同期收入增長了158.9%,但公司內部已經不再盲目追求用戶量的絕對值,并宣布,截至2月,M2系列模型的百萬Token推理成本已較2025年12月下降了超50%。

摩根大通最近將智譜與MiniMax同列為“中國AI采用周期的結構性受益者”,面對同樣的算力擠兌,智譜和MiniMax交出了截然不同的答卷。

01

算力成了大模型廠商的生死線

春節以來,開發者社區的投訴帖幾乎沒有停過。Kimi自2月起高峰期?,F算力不足,智譜更是一連遭遇了多輪危機,2月GLM-5上線后調用量暴增,API排隊蔓延,部分開發者的長鏈代碼生成任務直接中斷。

智譜不得不公開致歉,承認“規則透明度不夠、GLM-5灰度節奏太慢、老用戶升級機制設計粗糙”,甚至開啟全額退款通道。

4月12日,MiniMax正式開源M2.7模型,首日完成華為昇騰、摩爾線程、沐曦等多款國產GPU的Day-0適配,宣布通過MoE架構優化顯著降低了推理成本。但即便如此,用戶們吐槽MiniMax服務器繁忙、連續掉線、限流的帖子也不在少數。

這種算力短缺的根源在兩端的同時失控。需求端,OpenClaw等智能體應用將Token消耗量推高了不止一個數量級。傳統對話場景一篇文章消耗幾千Token,一個典型的Openclaw自動化任務,其Token消耗量是傳統對話場景的3至5倍,在文件整理、代碼生成、多輪工具調用等環節,單次任務的上下文攜帶量成倍增長。

根據智譜發布的2025年度財報,公司全年實現營業收入7.24億元,同比增長131.9%。但營收增速背后是更驚人的虧損擴大,年內虧損達到47.18億元,同比擴大59.5%,經調整凈虧損31.82億元,同比擴大29.1%。研發開支高達31.80億元,其中支付給第三方算力供應商的計算服務費用占據大頭。

張鵬在一次AI開源前沿論壇上說:“所有的技術,包括智能體框架,在很多場景下可以帶來十倍級的效率提升,但前提是算力充足?!痹?026中關村論壇上,他再次強調:“大模型未來12個月面臨的最大問題可能是算力?!?/p>

這種“增收巨虧”的局面并非智譜獨有。閆俊杰也不止一次公開表示,用戶量的增長和模型廠商收入的增長間并不存在正相關。這恰好解釋了當下大模型公司“增收不增利”的窘境來源。

供給端則被死死卡住。2025年5月,美國商務部升級芯片出口限制,英偉達H20被納入禁售名單。雖然后續H20有望重返中國市場,但配額大幅縮減。據SemiAnalysis數據,H100一年期租賃價格從2025年10月的約1.70美元/小時/GPU漲至2026年3月的約2.35美元/小時,漲幅近40%。

我們獨家獲悉,某頭部大廠更是拿出數百億的預算從年初就開始求卡,但仍然買卡無門。

據中國信通院數據,2025年英偉達在中國數據中心市場的份額已從2022年的95%下滑至50%,而國產AI芯片份額從12%增長至25%。華為昇騰以約81.2萬塊的出貨量位居國產第一,市場份額約49.2%,但與英偉達剩余份額相加仍難以滿足爆發式增長的算力需求。

這種供給失衡,讓Token市場出現了K型分化。低成本“閑聊型”Token價格一降再降,阿里通義千問一度壓至0.0005元/千Tokens,字節豆包0.0008元/千Tokens。這些面向基礎場景的Token,成了黃仁勛口中類似“水電煤”的基礎設施。

而另一端的“黃金型”Token——長鏈推理、復雜代碼生成、企業私有化部署,價格卻一路走高。智譜的API定價去年以來已累計提價83%,而市場需求非但沒有減弱,API調用量反而增長了400%。算力這把達摩克利斯之劍,落在了所有廠商的脖子上。

02

智譜選保毛利,MiniMax選保份額

算力短缺如同一道共同的緊箍咒,但智譜和MiniMax選擇了兩種截然不同的解脫路徑。智譜的打算很清楚,漲價,篩選,保利潤。

張鵬在3月的一次活動中表示,低價競爭不利于行業發展,上調API價格是成本變化的結果。而從今年2月至4月,智譜用連續三次上調API價格來回應了這個判斷:Coding Plan套餐漲30%,旗艦API服務漲20%,GLM-5上線后漲10%,GLM-5.1再漲10%。

Anthropic在海外已經劃出了一條清晰的參考線。最近,Anthropic調整了企業版Claude Enterprise的定價模式,從每月最高200美元的固定費用,改為每月20美元基礎費加按實際算力消耗收費。而在漲價的同時,Anthropic年化收入從2025年1月的約10億美元,一年后,AnthropicARR突破300億美元,超過OpenAI同期約250億美元的規模。

如今,Anthropic估值已突破1萬億美元,超過了OpenAI(同期約8800億美元)。

智譜選擇跟上。通過連續漲價篩選出高付費意愿的客戶,將有限的算力集中在Vibe Coding(氛圍編程)向Agentic Engineering(智能體工程)演進的高價值場景。

2026年一季度,智譜API定價累計上調83%,同期調用量卻暴增400%,云端API業務毛利率從3.3%升至18.9%。在剛結束的2025年財報電話會上,張鵬將智譜定位為 “中國的Anthropic”,并提出:“大模型公司商業價值取決于Token消耗的規模,而定價權完全取決于模型的智能上界。”

在張鵬看來,能高效處理長鏈復雜推理任務的高端Token永遠是稀缺品,而誰掌握了高端Token的定價權,誰就能在下一代競爭中占住入口。這正是智譜在毛利率從56.3%降至41%的背景下,仍堅持聚焦高價值場景的邏輯所在。

MiniMax則走了一條完全相反的路線,開源、優化、搶規模。2025年10月以來,MiniMax在不到半年的時間內完成了M2、M2.1、M2.5和M2.7四代模型迭代。2026年4月12日,M2.7在全球開源。這款2300億參數的MoE模型在推理時僅激活100億參數,激活率約4.3%,極大降低了推理成本。

為了降本,MiniMax與華為昇騰、摩爾線程、沐曦、昆侖芯等海內外芯片廠商在開源首日完成了Day-0適配。摩爾線程基于MUSA架構實現了深度調優,在MTT S5000上完成高性能推理部署。沐曦曦云C系列GPU依托全棧自研的MXMACA軟件棧實現了“模型發布即算力就緒”。

MiniMax已經拿到了成果。模型調用量爆發,M2系列文本模型單日Token消耗量在2026年前兩個月較2025年12月激增6倍以上,2月ARR已突破1.5億美元。經調整凈虧損約2.5億美元,虧損率顯著收窄。

但這也是一場危險的賭注。MiniMaxAPI客單價明顯低于智譜,單位算力的盈利空間被極度壓縮。MiniMax打的是“以規模換生態”的算盤,閆俊杰的策略是先讓Token足夠便宜,讓開發者習慣它的生態,再通過增值服務完成商業閉環。可如果開源生態變現的進度趕不上研發投入的增長,這條路就可能被高成本堵死。

而低價策略能否支撐Minimax在下一代模型研發上與智譜、阿里等巨頭競爭,仍是未知數。

03

破局關鍵在國產芯片和時間窗口

2025年度智譜研發開支為31.8億元,算力成本占研發總開支的七成以上,但仍無法滿足需求。GLM-5單次推理的算力消耗是前代GLM-4.7的3倍,而國產GPU的適配優化尚在推進中。

盡管智譜已完成與華為昇騰、寒武紀等7大國產芯片的深度優化,長序列部署成本下降50%,整體算力缺口依然巨大。

海外巨頭同樣承受著巨大算力緊缺的重壓。OpenAI放棄Sora視頻生成應用,將算力集中到核心模型開發中。Anthropic用鎖定AWS旗下Trainium芯片高達5吉瓦的算力資源來換取客戶穩定性,不只是傳統的風險投資。

算力的“絞索”正在勒緊每一位玩家的脖頸。而在算力的“絞索”被解除之前,智譜和MiniMax各自的探索都只是權宜之計,真正的變數是國產芯片的時間窗口。

2025年,英偉達在中國市場的AI加速卡占有率從2022年的約95%大幅下滑到約55%。國產AI加速卡總出貨量約165萬張,市占率約41%。華為昇騰以約81.2萬張的出貨量斷層領跑,占國產份額約49.2%。阿里平頭哥、百度昆侖芯、寒武紀、海光信息緊隨其后。

在智譜發布的GLM-5中,華為昇騰、摩爾線程、寒武紀等國產芯片平臺已完成深度推理適配與算子級優化。

更關鍵的一步可能在2026年到來。2026年3月,華為在合作伙伴大會上正式發布了搭載全新昇騰950PR的AI訓練推理加速卡Atlas 350。這款芯片性能據估計可達英偉達H20的近三倍,并且對CUDA體系的兼容性已大幅提升,字節跳動、阿里巴巴等大廠都計劃采用。

這意味著通往國產GPU的高質量替代之路已不是紙上談兵。這次DeepSeek V4跳過英偉達CUDA生態,適配的是華為昇騰平臺,可能動搖英偉達在AI算力市場的主導地位,打破其軟件生態壟斷。這也正是黃仁勛最近預言的“災難”。

不過當前DeepSeek自身也卡算力。V4發布時官方明確坦言,V4-Pro當前高端算力吞吐有限,自身都受高端芯片供給約束,無法向外大規模輸出富余算力。

未來的錨點在于,昇騰950PR能否在實際部署中兌現百萬級高吞吐與低延遲的承諾,國產芯片是否能在2026年實現大規模、穩定的ToB商用。假設國產芯片能做到大規模穩定商用,讓算力成本驟降,屆時低價、規?;穆窂綗o疑將占據上風。

留給國內大模型廠商的問題已然清晰,那就是能否在國產算力芯片全面成熟之前,搶先跑通一條脫離英偉達依賴獨立發展的路徑。

撰寫|馬文佩、馬舒葉

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

籃球快餐車
2026-05-08 00:46:53
關于軍購案,黃智賢向季麟連開火,鄭麗文正式交底,不簡單

關于軍購案,黃智賢向季麟連開火,鄭麗文正式交底,不簡單

阿腩講娛樂
2026-05-07 17:04:15
女子川西徒步遇難:全過程曝光,隊友恐擔責,網友怒斥不值得同情

女子川西徒步遇難:全過程曝光,隊友恐擔責,網友怒斥不值得同情

智慧生活筆記
2026-05-08 11:37:52
全身愛馬仕的馬筱梅生完孩子卻改穿三百塊抖音套裝

全身愛馬仕的馬筱梅生完孩子卻改穿三百塊抖音套裝

小邵說劇
2026-05-08 14:12:34
阿斯麥CEO慌了!ASML遭中方禁售,臺積電拒購2nm光刻機,反制猝不及防

阿斯麥CEO慌了!ASML遭中方禁售,臺積電拒購2nm光刻機,反制猝不及防

Thurman在昆明
2026-05-09 01:00:31
演員張頌文片場收工后,將粉絲贈送的茶葉原路退回,并叮囑“你們自己工作掙的錢給自己和家人花,我收收你們的信就好了”

演員張頌文片場收工后,將粉絲贈送的茶葉原路退回,并叮囑“你們自己工作掙的錢給自己和家人花,我收收你們的信就好了”

洪觀新聞
2026-05-07 15:18:54
再見了,塔克!總冠軍+9058萬美金到手,別怪NBA對你無情

再見了,塔克!總冠軍+9058萬美金到手,別怪NBA對你無情

世界體育圈
2026-05-08 14:53:15
一路走好!香港著名填詞人逝世終年60歲,曾為張國榮,鄭秀文填詞

一路走好!香港著名填詞人逝世終年60歲,曾為張國榮,鄭秀文填詞

粵睇先生
2026-05-07 23:56:37
梅西:作為朋友我當然希望內馬爾踢世界杯,但我無法客觀評價

梅西:作為朋友我當然希望內馬爾踢世界杯,但我無法客觀評價

懂球帝
2026-05-08 22:09:49
臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

共工之錨
2026-05-08 00:16:36
三亞皮皮蝦事件升級!43歲老板身亡,多人威脅店鋪,顧客還有惡行

三亞皮皮蝦事件升級!43歲老板身亡,多人威脅店鋪,顧客還有惡行

不寫散文詩
2026-05-08 15:19:45
月薪幾萬卻招不到人?遠洋海員背后的殘酷,配偶:男女關系太亂了

月薪幾萬卻招不到人?遠洋海員背后的殘酷,配偶:男女關系太亂了

李將平老師
2026-05-08 09:42:27
河南籍演員北京聚餐!一眼望去熟人滿滿,李亞鵬岳云鵬劉震云都在

河南籍演員北京聚餐!一眼望去熟人滿滿,李亞鵬岳云鵬劉震云都在

天天熱點見聞
2026-05-08 04:32:33
OnlyFans女星Annie Knight與Henry Brayshaw婚禮細節曝光

OnlyFans女星Annie Knight與Henry Brayshaw婚禮細節曝光

追星雷達站
2026-05-08 00:19:29
國際足聯終于扛不住低頭了。2026世界杯轉播權報價直接腰斬

國際足聯終于扛不住低頭了。2026世界杯轉播權報價直接腰斬

流蘇晚晴
2026-05-08 20:18:42
文章面館正式開業,免費送汽水喝,馬伊琍帶著兩女兒低調支持!

文章面館正式開業,免費送汽水喝,馬伊琍帶著兩女兒低調支持!

老吳教育課堂
2026-05-08 20:15:22
一眼就歡喜:不只是心動,是久別重逢

一眼就歡喜:不只是心動,是久別重逢

疾跑的小蝸牛
2026-05-08 22:32:10
世體:皇馬更衣室認定,是維尼修斯一直向阿韋洛亞“告密”

世體:皇馬更衣室認定,是維尼修斯一直向阿韋洛亞“告密”

懂球帝
2026-05-08 14:21:05
80年代經典游戲機復活,預裝25款游戲

80年代經典游戲機復活,預裝25款游戲

熱搜摘要官
2026-05-08 00:06:45
中國光伏的堡壘,被印度從內部攻破

中國光伏的堡壘,被印度從內部攻破

觀察者網
2026-05-08 09:00:37
2026-05-09 01:35:00
白鯨實驗室one incentive-icons
白鯨實驗室one
記錄 AI改變世界的瞬間
133文章數 15關注度
往期回顧 全部

科技要聞

SK海力士平均獎金600萬 工服成相親神器

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內幕解密

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內幕解密

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經要聞

估值3000億 DeepSeek尋求500億元融資

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態度原創

家居
游戲
旅游
公開課
軍事航空

家居要聞

流動的尺度 打破家的形式主義

PS未發售重磅獨占要完!同類項目崩盤 新作懸了

旅游要聞

母親節+護士節,臨沂景區優惠合集暖心上線

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:最高領袖穆杰塔巴全面掌控局勢

無障礙瀏覽 進入關懷版