網易首頁 > 網易號 > 正文 申請入駐

20萬字不到1分錢,梁文鋒把token價格打骨折了

0
分享至



梁文鋒又出手了,而且還是二連降價。

4月25日,DeepSeek-V4-Pro開啟限時2.5折優惠,輸入價格(緩存命中)降至0.25元/百萬tokens。

業內還沒反應過來呢,結果4月26日晚間,DeepSeek就再次降價。

全系API輸入緩存命中價格直接降至首發價的1/10。

疊加限時折扣后,V4-Pro的緩存輸入低至0.025元/百萬tokens, V4-Flash降至0.02元/百萬tokens,創下全球大模型價格新低。



這是個什么概念呢?

上海譯文出版的《挪威的森林》,全書約20萬字。將整本書命中緩存后喂給DeepSeek-V4-Pro,那么其總成本不到1分錢。

DeepSeek這次降的,不只是token的單價。它是把“長文本、長代碼、長知識庫”這些原本最燒錢的AI應用場景,全都打入了價格的谷底。

01

摸著DeepSeek過河

DeepSeek兩天兩降,這不是簡單的價格戰。

先用限時折扣測試市場承受力和服務器負載,緊接著對緩存命中這一高頻場景實施永久性降價。尤其是對于RAG知識庫、智能客服、文檔分析等緩存命中率超過60%的應用場景,成本可以直接下降90%以上。

DeepSeek研究員陳德里在社交媒體上確認,輸入緩存降價是永久性的,并打上了“AGI for Everyone”的標簽。

雖然說國內所有AI公司,幾乎都是摸著DeepSeek過河,但DeepSeek這波降價之后,卻并非所有人都擔心。

尤其是大廠,他們壓根不在乎DeepSeek降價。

這是因為,大廠賣API的本質,是賣背后的一整套服務。大模型API只是用來引流的,真正賺錢的是背后的計算、存儲、數據庫等云服務。



以阿里云為例,4月15日算力卡漲5%-34%、存儲漲30%,但同時又愿意代理DeepSeek。關鍵點就在于,即便是客戶使用DeepSeek,他們依然離不開阿里云的算力和存儲。

阿里、騰訊、字節這些AI大廠,他們靠的是生態和平臺賺錢。

真正難受的是智譜、MiniMax和月之暗面這樣的中間層。

智譜AI在4個月里已經連續三次漲價。2月代碼訂閱套餐上調30%,3月旗艦API上調20%,4月8日再次上調10%,累計漲幅83%。調價后,GLM系列編程場景緩存命中Token單價已接近Claude Sonnet 4.6的水平。

智譜CEO張鵬的解釋只有一句話:“瓶頸在算力,不在客戶!

在首份財報中,智譜公開了自己的商業邏輯公式:AGI商業價值=智能上限×Token消耗規模。

對于智譜這個上市公司來說,算力是稀缺資源。智譜的API年化收入(ARR)在過去12個月暴漲60倍至17億元,Token調用量在價格上漲83%的背景下仍增長400%。

問題不是客戶不愿意付錢,而是現有算力已經接近滿載,繼續低價只會讓服務質量下降。與其通過價格戰搶來大量低價值客戶,不如提高價格篩選出高價值客戶,把有限的算力用在刀刃上。

月之暗面和MiniMax的特點是量大便宜,當DeepSeek把API價格打到這么低,這兩家或多或少都會有些難堪。

但月之暗面的K 2.6以及MiniMax即將發布的M3模型,性能都要高于DeepSeek-V4-Pro。他們在客戶群體上可能會和DeepSeek有交集,但很難形成全面沖突。

促使DeepSeek降價的原因或許來自于融資,此前DeepSeek曾傳出100億美元估值,如今隨著阿里、騰訊入局,估值進一步拉高至200億美元。

估值拉高以后,融的金額也就多了,同時梁文鋒也需要用市場、收入來證明DeepSeek達到估值所對應的高度。

所以即便DeepSeek是在賠本賺吆喝,也并不會讓人感到非常意外。

對于上市公司來說,API就是核心收入,壓低API價格就等于降低毛利。

更關鍵的是,如果承認“我們也要降價才能競爭”,就等于承認“我們沒有技術護城河”。但如果堅持高價,又必須拿出足夠有說服力的差異化價值。

DeepSeek降價的本質是他們找到了對應的客戶。

梁文鋒不需要DeepSeek有最強的性能。

無論是企業客戶還是個人客戶,模型的性能和使用體驗之間有一道鴻溝。模型的性能跑分是它的上限,但是我們只需要我們能用到的部分。

只要有足夠多的開發者和企業知道“還有這么便宜的選擇”,整個行業的定價體系就會被重構。就像當年小米手機對智能手機市場的沖擊一樣,不是銷量第一,但改變了所有人對“合理價格”的預期。

而且梁文鋒也意識到一個問題,那就是AI就是基礎設施,就和柴米油鹽是一樣的,那么價格戰就變得在所難免,最終,AI也會像云計算一樣走向“規模經濟+薄利多銷”。

在這個邏輯下,誰的成本結構更優、誰的技術迭代更快、誰能更早實現規模效應,誰就能活到最后。

02

DeepSeek給國產AI芯片替代講故事

更關鍵的是,DeepSeek已經適配華為昇騰生態。

DeepSeek官方透露,目前Pro版本的服務吞吐受限于高端算力,預計下半年昇騰950超節點批量上市后,Pro的價格還將大幅下調。

所以這次價格下降,還只是預告而已。

昇騰950超節點通過集群方案彌補了單卡制程差距。

單顆昇騰910C芯片的BF16性能僅為英偉達Blackwell單芯片的約三分之一,但通過超節點集群方式,單個CloudMatrix 384集群的BF16總性能反而是NVL72的1.7倍,總內存容量為后者3.6倍,總內存帶寬為后者2.1倍。



這還只是算力的方面,考慮硬件成本,事情就會更有意思。

華為昇騰950PR的定價約7萬元人民幣,英偉達同級別H200約合人民幣25萬元。根據英偉達AI在X上發布的信息,DeepSeek的確可以部署在英偉達Blackwell架構芯片上,不過這個成本更高,約為40萬元人民幣。

如果我們按FP8精度來算,昇騰950PR是7萬元/PFLOPS,英偉達H200是6.31萬元/PFLOPS。昇騰950PR畢竟是一張推理卡,如果我們按照推理專用的FP4精度來算,昇騰950PR是4.49萬元/PFLOPS,英偉達B200是4.44萬元/PFLOPS。

DeepSeek這次降價,砍在了緩存命中的價格上。

這個場景的特點是,模型不用每次重新理解全部上下文,大量重復輸入可以復用,壓力主要集中在推理吞吐、顯存/內存帶寬、調度和緩存管理上。

換句話說,它不是最依賴“單卡訓練峰值”的場景,而是更適合通過國產芯片集群、工程優化和規;{度來攤薄成本的場景。

那么我們如果把單卡的性價比優勢放到大規模集群部署里,結果又會如何呢?

以100卡集群為例,國內常用的英偉達H20方案裸卡成本為1000萬,13臺服務器主機286萬,加上機柜等,總價約為不到1500萬元。同規模華為昇騰950PR的方案約為1000萬出頭。

昇騰950PR的單卡功耗(600W)比H20(350W)高,但單位算力功耗低65%,相同算力下對電力和制冷的需求大幅降低,基建投入顯著減少。

并且,1張昇騰950PR的推理吞吐量約等于2.2-2.8張H20。這就導致實際上昇騰方案可能要比英偉達H20的方案節省60%到70%。

而大模型的API價格,很大程度上取決于硬件成本。那么DeepSeek打折,也很可能帶動一波國產AI芯片銷量。

連DeepSeek都開始大規模使用國產芯片,整個產業鏈就會被激活。云廠商會增加國產芯片的采購,芯片廠商會加大研發投入,開發者會適配國產生態。

華為昇騰、寒武紀、海光信息、摩爾線程、沐曦股份、昆侖芯、平頭哥真武、天數智芯8家國產AI芯片品牌在DeepSeek-V4發布當天就完成了適配。

在DeepSeek-V4發布當天,AI算力芯片板塊股價大漲。在A股,海光信息以8.2%的增幅領漲、寒武紀增幅為2.23%,在港股,天數智芯的漲幅達到9.54%。

這是一個正向循環。

當然,這并不意味著國產算力已經全面替代英偉達。訓練側仍然更依賴高端GPU、成熟軟件棧和大規模集群經驗DeepSeek真正走通的路徑,可能不是“一夜之間替代英偉達”,而是先在推理側、緩存場景、長文本應用里,把國產算力的性價比優勢釋放出來。

芯片只是第一層。

真正決定國產算力能不能吃下這波需求的,是軟件生態。模型能不能穩定跑在昇騰上,推理框架能不能適配,算子有沒有優化,開發者遷移成本有多高,才決定了這條路是“能演示”,還是“能商業化”。

DeepSeek的價值在于,它不是一家邊緣模型廠商做適配,而是一個頭部模型親自把流量和需求帶進國產算力生態。

03

梁文鋒仍然需要給DeepSeek找商業模式

梁文鋒真正的殺招不在于“便宜”,而在于“定價”。

梁文鋒在用DeepSeek的影響力,讓市場形成一個新的認知:“如果DeepSeek這個級別的模型已經能做到這個價,別家為什么還要賣這么貴?”

一旦這個錨點形成,其他廠商就陷入了兩難。跟價,利潤空間被壓縮;不跟,就必須向客戶解釋“我貴在哪里”。

梁文鋒曾在2024年表示:“我們只是按照自己的步調來做事,然后核算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另一方面也覺得無論API,還是AI,都應該是普惠的、人人可以用得起的東西。”

他認為,只有讓AI真正普惠,才能激發出足夠大的應用市場。也只有應用市場足夠大,技術迭代的飛輪才能真正轉起來。



便宜可以打開市場,但便宜本身不是商業模式。

DeepSeek不能一輩子靠超低API價格活著。

API價格打到這個程度,短期內可以制造影響力,吸引客戶,不過它很難成為一家長期公司的全部收入來源。

尤其是大模型推理本身仍然消耗算力、電力、帶寬和運維,價格越低,調用量越大,對基礎設施的壓力也越大。

低價可以是入口,卻不應該成為終點。

DeepSeek的目標,是成為中國AI開發者的“默認底座”。

只要足夠多的應用和agent以DeepSeek作為基座模型開發,那么DeepSeek就掌握了入口。

API收入只是第一層,模型標準、開發者生態、企業部署、算力適配、云廠商合作,才是梁文鋒想要的商業化空間。

DeepSeek更大的商業化機會,可能在企業私有化部署。

對于金融、政務、制造、能源這些行業來說,價格不是唯一問題,數據安全可控才是核心問題。

它們未必會長期使用公共API,但會愿意為一套能部署在自己機房、自己云環境里的模型系統付費。

梁文鋒可以把開源模型作為入口,把企業級部署、調優、運維、安全、權限管理、知識庫接入變成真正的收費服務。

如果DeepSeek長期只停留在模型層,它仍然會被卷入無休止的價格戰。模型能力會被追趕,API價格會繼續下降,開發者也會在不同模型之間切換。

真正能提高商業化上限的,是應用層產品,比如agent和CLI。

所以我始終認為,DeepSeek的低價API,應該不是梁文鋒心里所想的商業化答案,更像是一個入口。

它先用價格打穿市場,再用開源建立生態,再用企業服務、私有化部署、云廠商合作和應用產品去承接價值。

這才能把“底座”的價值最大化。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
哈佛科學家實錘:太陽系有兩個太陽,另一個就藏在奧爾特云里

哈佛科學家實錘:太陽系有兩個太陽,另一個就藏在奧爾特云里

觀察宇宙
2026-04-28 18:44:39
快訊!網紅白冰被查了,謝霆鋒現在有的忙了!

快訊!網紅白冰被查了,謝霆鋒現在有的忙了!

故事終將光明磊落
2026-04-28 18:11:54
民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

李橑在北漂
2026-04-02 10:22:26
2600萬鎊還嫌貴?巴薩試圖壓價買斷拉什福德,曼聯高層深感惱火

2600萬鎊還嫌貴?巴薩試圖壓價買斷拉什福德,曼聯高層深感惱火

星耀國際足壇
2026-04-29 00:13:40
央視《愛情沒有神話》開播!看完4集,我斷言:這劇又要火向全國

央視《愛情沒有神話》開播!看完4集,我斷言:這劇又要火向全國

阿纂看事
2026-04-28 20:45:05
雖然不穩定但神起來確實很神,森林狼還得繼續增加他的出場時間?

雖然不穩定但神起來確實很神,森林狼還得繼續增加他的出場時間?

稻谷與小麥
2026-04-29 00:03:14
盧秀燕要和這個人搭檔,攜手沖2028?鄭麗文有重磅表態,不簡單

盧秀燕要和這個人搭檔,攜手沖2028?鄭麗文有重磅表態,不簡單

DS北風
2026-04-27 16:40:15
統治力!雷霆連續三年首輪橫掃靜候湖人 亞歷山大開啟衛冕模式

統治力!雷霆連續三年首輪橫掃靜候湖人 亞歷山大開啟衛冕模式

醉臥浮生
2026-04-28 12:15:22
別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

職場資深秘書
2026-04-28 22:32:48
宇航員從太空回望地球,為何會害怕?他們到底看到了什么?

宇航員從太空回望地球,為何會害怕?他們到底看到了什么?

觀察宇宙
2026-04-28 18:36:48
江亞菲婚后9年沒有孩子,一張10年前的病歷單,讓王海洋秘密曝光

江亞菲婚后9年沒有孩子,一張10年前的病歷單,讓王海洋秘密曝光

卡西莫多的故事
2026-04-27 10:49:42
中央定調,退休新規實施后,1972年出生,60歲退休需要什么條件?

中央定調,退休新規實施后,1972年出生,60歲退休需要什么條件?

丁丁鯉史紀
2026-04-28 10:41:06
遲到2分鐘被取消事業單位體檢資格 人社局機械執法敗訴

遲到2分鐘被取消事業單位體檢資格 人社局機械執法敗訴

封面新聞
2026-04-27 16:20:23
女子啃老10年,自盡后老母親收拾房間發現銀行卡,查看余額后崩潰

女子啃老10年,自盡后老母親收拾房間發現銀行卡,查看余額后崩潰

白云故事
2025-03-17 07:55:10
熱刺盯上拉什福德:一筆轉會背后的三重博弈

熱刺盯上拉什福德:一筆轉會背后的三重博弈

賽場名場面
2026-04-28 23:41:35
突然宣布:全網閉店!網友:再見了,國貨之光!

突然宣布:全網閉店!網友:再見了,國貨之光!

電影最TOP
2026-04-27 21:44:41
北京公交專用道行駛時間,又有新調整!

北京公交專用道行駛時間,又有新調整!

BRTV新聞
2026-04-28 12:40:41
打起來了,以軍不宣而戰;內塔尼亞胡迎來勁敵,或被關進大牢!

打起來了,以軍不宣而戰;內塔尼亞胡迎來勁敵,或被關進大牢!

說歷史的老牢
2026-04-27 23:23:31
林志穎模樣大變!帥哥變丑男,網友靈魂拷問:為什么不調養好再復出

林志穎模樣大變!帥哥變丑男,網友靈魂拷問:為什么不調養好再復出

八卦王者
2026-04-28 11:39:15
斯諾克世錦賽:墨菲拒絕連輸4局!趙心童今日首敗,小鋼炮暫2-2!

斯諾克世錦賽:墨菲拒絕連輸4局!趙心童今日首敗,小鋼炮暫2-2!

劉姚堯的文字城堡
2026-04-28 18:23:40
2026-04-29 00:31:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2421文章數 8062關注度
往期回顧 全部

科技要聞

10億周活目標落空!傳OpenAI爆發內部分歧

頭條要聞

媒體:臺海軍退役少校登烏魯木齊艦 給出的結論很直接

頭條要聞

媒體:臺海軍退役少校登烏魯木齊艦 給出的結論很直接

體育要聞

魔術黑八活塞,一步之遙?!

娛樂要聞

蔡卓妍官宣結婚,老公比她小10歲

財經要聞

中央政治局會議定調,八大看點速覽!

汽車要聞

拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

態度原創

教育
時尚
游戲
藝術
本地

教育要聞

山東高?佳薪輬箢l傳!學霸宿舍與硬核班級書寫勵志傳奇!

普通女性春天穿什么好看?這些穿搭值得借鑒,自然舒適

《烽沙》游先看試玩報告:我在東周養刁民"/> 主站 商城 論壇 自運營 登錄 注冊 《烽沙》游先看試玩報告:我在東周養刁民 泥頭車 2026-04-28...

藝術要聞

深圳極具未來感的“外星”建筑亮相

本地新聞

用青花瓷的方式,打開西溪濕地

無障礙瀏覽 進入關懷版