无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

20萬字不到1分錢,梁文鋒把token價格打骨折了

0
分享至


梁文鋒又出手了,而且還是二連降價。

4月25日,DeepSeek-V4-Pro開啟限時2.5折優惠,輸入價格(緩存命中)降至0.25元/百萬tokens。

業內還沒反應過來呢,結果4月26日晚間,DeepSeek就再次降價。

全系API輸入緩存命中價格直接降至首發價的1/10。

疊加限時折扣后,V4-Pro的緩存輸入低至0.025元/百萬tokens, V4-Flash降至0.02元/百萬tokens,創下全球大模型價格新低。


這是個什么概念呢?

上海譯文出版的《挪威的森林》,全書約20萬字。將整本書命中緩存后喂給DeepSeek-V4-Pro,那么其總成本不到1分錢。

DeepSeek這次降的,不只是token的單價。它是把“長文本、長代碼、長知識庫”這些原本最燒錢的AI應用場景,全都打入了價格的谷底。

摸著DeepSeek過河

DeepSeek兩天兩降,這不是簡單的價格戰。

先用限時折扣測試市場承受力和服務器負載,緊接著對緩存命中這一高頻場景實施永久性降價。尤其是對于RAG知識庫、智能客服、文檔分析等緩存命中率超過60%的應用場景,成本可以直接下降90%以上。

DeepSeek研究員陳德里在社交媒體上確認,輸入緩存降價是永久性的,并打上了“AGI for Everyone”的標簽。

雖然說國內所有AI公司,幾乎都是摸著DeepSeek過河,但DeepSeek這波降價之后,卻并非所有人都擔心。

尤其是大廠,他們壓根不在乎DeepSeek降價。

這是因為,大廠賣API的本質,是賣背后的一整套服務。大模型API只是用來引流的,真正賺錢的是背后的計算、存儲、數據庫等云服務。


以阿里云為例,4月15日算力卡漲5%-34%、存儲漲30%,但同時又愿意代理DeepSeek。關鍵點就在于,即便是客戶使用DeepSeek,他們依然離不開阿里云的算力和存儲。

阿里、騰訊、字節這些AI大廠,他們靠的是生態和平臺賺錢。

真正難受的是智譜、MiniMax和月之暗面這樣的中間層。

智譜AI在4個月里已經連續三次漲價。2月代碼訂閱套餐上調30%,3月旗艦API上調20%,4月8日再次上調10%,累計漲幅83%。調價后,GLM系列編程場景緩存命中Token單價已接近Claude Sonnet 4.6的水平。

智譜CEO張鵬的解釋只有一句話:“瓶頸在算力,不在客戶。”

在首份財報中,智譜公開了自己的商業邏輯公式:AGI商業價值=智能上限×Token消耗規模。

對于智譜這個上市公司來說,算力是稀缺資源。智譜的API年化收入(ARR)在過去12個月暴漲60倍至17億元,Token調用量在價格上漲83%的背景下仍增長400%。

問題不是客戶不愿意付錢,而是現有算力已經接近滿載,繼續低價只會讓服務質量下降。與其通過價格戰搶來大量低價值客戶,不如提高價格篩選出高價值客戶,把有限的算力用在刀刃上。

月之暗面和MiniMax的特點是量大便宜,當DeepSeek把API價格打到這么低,這兩家或多或少都會有些難堪。

但月之暗面的K 2.6以及MiniMax即將發布的M3模型,性能都要高于DeepSeek-V4-Pro。他們在客戶群體上可能會和DeepSeek有交集,但很難形成全面沖突。

促使DeepSeek降價的原因或許來自于融資,此前DeepSeek曾傳出100億美元估值,如今隨著阿里、騰訊入局,估值進一步拉高至200億美元。

估值拉高以后,融的金額也就多了,同時梁文鋒也需要用市場、收入來證明DeepSeek達到估值所對應的高度。

所以即便DeepSeek是在賠本賺吆喝,也并不會讓人感到非常意外。

對于上市公司來說,API就是核心收入,壓低API價格就等于降低毛利。

更關鍵的是,如果承認“我們也要降價才能競爭”,就等于承認“我們沒有技術護城河”。但如果堅持高價,又必須拿出足夠有說服力的差異化價值。

DeepSeek降價的本質是他們找到了對應的客戶。

梁文鋒不需要DeepSeek有最強的性能。

無論是企業客戶還是個人客戶,模型的性能和使用體驗之間有一道鴻溝。模型的性能跑分是它的上限,但是我們只需要我們能用到的部分。

只要有足夠多的開發者和企業知道“還有這么便宜的選擇”,整個行業的定價體系就會被重構。就像當年小米手機對智能手機市場的沖擊一樣,不是銷量第一,但改變了所有人對“合理價格”的預期。

而且梁文鋒也意識到一個問題,那就是AI就是基礎設施,就和柴米油鹽是一樣的,那么價格戰就變得在所難免,最終,AI也會像云計算一樣走向“規模經濟+薄利多銷”。

在這個邏輯下,誰的成本結構更優、誰的技術迭代更快、誰能更早實現規模效應,誰就能活到最后。

DeepSeek給國產AI芯片替代講故事

更關鍵的是,DeepSeek已經適配華為昇騰生態。

DeepSeek官方透露,目前Pro版本的服務吞吐受限于高端算力,預計下半年昇騰950超節點批量上市后,Pro的價格還將大幅下調。

所以這次價格下降,還只是預告而已。

昇騰950超節點通過集群方案彌補了單卡制程差距。

單顆昇騰910C芯片的BF16性能僅為英偉達Blackwell單芯片的約三分之一,但通過超節點集群方式,單個CloudMatrix 384集群的BF16總性能反而是NVL72的1.7倍,總內存容量為后者3.6倍,總內存帶寬為后者2.1倍。


這還只是算力的方面,考慮硬件成本,事情就會更有意思。

華為昇騰950PR的定價約7萬元人民幣,英偉達同級別H200約合人民幣25萬元。根據英偉達AI在X上發布的信息,DeepSeek的確可以部署在英偉達Blackwell架構芯片上,不過這個成本更高,約為40萬元人民幣。

如果我們按FP8精度來算,昇騰950PR是7萬元/PFLOPS,英偉達H200是6.31萬元/PFLOPS。昇騰950PR畢竟是一張推理卡,如果我們按照推理專用的FP4精度來算,昇騰950PR是4.49萬元/PFLOPS,英偉達B200是4.44萬元/PFLOPS。

DeepSeek這次降價,砍在了緩存命中的價格上。

這個場景的特點是,模型不用每次重新理解全部上下文,大量重復輸入可以復用,壓力主要集中在推理吞吐、顯存/內存帶寬、調度和緩存管理上。

換句話說,它不是最依賴“單卡訓練峰值”的場景,而是更適合通過國產芯片集群、工程優化和規模化調度來攤薄成本的場景。

那么我們如果把單卡的性價比優勢放到大規模集群部署里,結果又會如何呢?

以100卡集群為例,國內常用的英偉達H20方案裸卡成本為1000萬,13臺服務器主機286萬,加上機柜等,總價約為不到1500萬元。同規模華為昇騰950PR的方案約為1000萬出頭。

昇騰950PR的單卡功耗(600W)比H20(350W)高,但單位算力功耗低65%,相同算力下對電力和制冷的需求大幅降低,基建投入顯著減少。

并且,1張昇騰950PR的推理吞吐量約等于2.2-2.8張H20。這就導致實際上昇騰方案可能要比英偉達H20的方案節省60%到70%。

而大模型的API價格,很大程度上取決于硬件成本。那么DeepSeek打折,也很可能帶動一波國產AI芯片銷量。

連DeepSeek都開始大規模使用國產芯片,整個產業鏈就會被激活。云廠商會增加國產芯片的采購,芯片廠商會加大研發投入,開發者會適配國產生態。

華為昇騰、寒武紀、海光信息、摩爾線程、沐曦股份、昆侖芯、平頭哥真武、天數智芯8家國產AI芯片品牌在DeepSeek-V4發布當天就完成了適配。

在DeepSeek-V4發布當天,AI算力芯片板塊股價大漲。在A股,海光信息以8.2%的增幅領漲、寒武紀增幅為2.23%,在港股,天數智芯的漲幅達到9.54%。

這是一個正向循環。

當然,這并不意味著國產算力已經全面替代英偉達。訓練側仍然更依賴高端GPU、成熟軟件棧和大規模集群經驗DeepSeek真正走通的路徑,可能不是“一夜之間替代英偉達”,而是先在推理側、緩存場景、長文本應用里,把國產算力的性價比優勢釋放出來。

芯片只是第一層。

真正決定國產算力能不能吃下這波需求的,是軟件生態。模型能不能穩定跑在昇騰上,推理框架能不能適配,算子有沒有優化,開發者遷移成本有多高,才決定了這條路是“能演示”,還是“能商業化”。

DeepSeek的價值在于,它不是一家邊緣模型廠商做適配,而是一個頭部模型親自把流量和需求帶進國產算力生態。

梁文鋒仍然需要給DeepSeek找商業模式

梁文鋒真正的殺招不在于“便宜”,而在于“定價”。

梁文鋒在用DeepSeek的影響力,讓市場形成一個新的認知:“如果DeepSeek這個級別的模型已經能做到這個價,別家為什么還要賣這么貴?”

一旦這個錨點形成,其他廠商就陷入了兩難。跟價,利潤空間被壓縮;不跟,就必須向客戶解釋“我貴在哪里”。

梁文鋒曾在2024年表示:“我們只是按照自己的步調來做事,然后核算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另一方面也覺得無論API,還是AI,都應該是普惠的、人人可以用得起的東西。”

他認為,只有讓AI真正普惠,才能激發出足夠大的應用市場。也只有應用市場足夠大,技術迭代的飛輪才能真正轉起來。


便宜可以打開市場,但便宜本身不是商業模式。

DeepSeek不能一輩子靠超低API價格活著。

API價格打到這個程度,短期內可以制造影響力,吸引客戶,不過它很難成為一家長期公司的全部收入來源。

尤其是大模型推理本身仍然消耗算力、電力、帶寬和運維,價格越低,調用量越大,對基礎設施的壓力也越大。

低價可以是入口,卻不應該成為終點。

DeepSeek的目標,是成為中國AI開發者的“默認底座”。

只要足夠多的應用和agent以DeepSeek作為基座模型開發,那么DeepSeek就掌握了入口。

API收入只是第一層,模型標準、開發者生態、企業部署、算力適配、云廠商合作,才是梁文鋒想要的商業化空間。

DeepSeek更大的商業化機會,可能在企業私有化部署。

對于金融、政務、制造、能源這些行業來說,價格不是唯一問題,數據安全可控才是核心問題。

它們未必會長期使用公共API,但會愿意為一套能部署在自己機房、自己云環境里的模型系統付費。

梁文鋒可以把開源模型作為入口,把企業級部署、調優、運維、安全、權限管理、知識庫接入變成真正的收費服務。

如果DeepSeek長期只停留在模型層,它仍然會被卷入無休止的價格戰。模型能力會被追趕,API價格會繼續下降,開發者也會在不同模型之間切換。

真正能提高商業化上限的,是應用層產品,比如agent和CLI。

所以我始終認為,DeepSeek的低價API,應該不是梁文鋒心里所想的商業化答案,更像是一個入口。

它先用價格打穿市場,再用開源建立生態,再用企業服務、私有化部署、云廠商合作和應用產品去承接價值。

這才能把“底座”的價值最大化。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
哈馬斯文件揭2023年10月7日襲擊以色列的動機

哈馬斯文件揭2023年10月7日襲擊以色列的動機

近距離
2026-06-15 17:26:13
世界杯:伊薩克獨造3球 約克雷斯傳射 瑞典5-1力壓日本荷蘭登頂

世界杯:伊薩克獨造3球 約克雷斯傳射 瑞典5-1力壓日本荷蘭登頂

釘釘陌上花開
2026-06-15 12:00:25
1歲多“獸皮痣”小樂寶去世,哥哥6歲時走了,父母再遭喪子之痛

1歲多“獸皮痣”小樂寶去世,哥哥6歲時走了,父母再遭喪子之痛

九方魚論
2026-06-15 14:00:46
少林寺新方丈釋印樂,上任才10個月,少林寺被曝一下少了800多萬

少林寺新方丈釋印樂,上任才10個月,少林寺被曝一下少了800多萬

許三歲
2026-06-14 09:57:24
高市早苗抵達英國訪問,現場無歡迎儀式、無紅毯,出發前在《金融時報》發文自稱“日本鐵娘子”

高市早苗抵達英國訪問,現場無歡迎儀式、無紅毯,出發前在《金融時報》發文自稱“日本鐵娘子”

極目新聞
2026-06-15 14:49:27
特朗普稱將允許伊朗進行低水平鈾濃縮

特朗普稱將允許伊朗進行低水平鈾濃縮

新華社
2026-06-15 17:54:25
瘋狂帶貨!張水華同時穿著3個代言品牌:我單純實在 不懂球不看世界杯

瘋狂帶貨!張水華同時穿著3個代言品牌:我單純實在 不懂球不看世界杯

可樂談情感
2026-06-15 20:46:13
“山姆被約談”沖上熱搜第一,網友罵翻,最新回應來了

“山姆被約談”沖上熱搜第一,網友罵翻,最新回應來了

星島記事
2026-06-15 15:03:55
頻頻被年輕人“翻牌子”的康師傅,為何又成“新剛需”

頻頻被年輕人“翻牌子”的康師傅,為何又成“新剛需”

智谷趨勢
2026-05-26 19:42:08
“繼承權”不用爭了!2026房產繼承新規,父母房子都以后這樣處理

“繼承權”不用爭了!2026房產繼承新規,父母房子都以后這樣處理

復轉這些年
2026-06-15 19:10:29
山西肉鋪傷人后續:又殺害兩名顧客,3人當場死亡,家屬曝隱情

山西肉鋪傷人后續:又殺害兩名顧客,3人當場死亡,家屬曝隱情

大魚簡科
2026-06-15 16:39:42
待業5個月后復出 41歲曼聯棄帥執教米蘭 簽約2年+稅后薪水350萬歐

待業5個月后復出 41歲曼聯棄帥執教米蘭 簽約2年+稅后薪水350萬歐

我愛英超
2026-06-15 18:06:35
“遇見小面”創始人宋奇就起訴“渝見小面”致歉:決定無償贈予已注冊商標“渝見小面”,稱此次起訴是管理上的重大失誤

“遇見小面”創始人宋奇就起訴“渝見小面”致歉:決定無償贈予已注冊商標“渝見小面”,稱此次起訴是管理上的重大失誤

封面新聞
2026-06-15 09:34:09
世界杯下課首人?曝1-5瑞典后,突尼斯解雇54歲主帥!帶隊僅5個月

世界杯下課首人?曝1-5瑞典后,突尼斯解雇54歲主帥!帶隊僅5個月

我愛英超
2026-06-15 21:04:08
福克斯取關馬刺引熱議!曾取關小薩:人與人之間沒必要都走很近

福克斯取關馬刺引熱議!曾取關小薩:人與人之間沒必要都走很近

羅說NBA
2026-06-15 19:32:35
官方:庫庫雷利亞加盟皇馬,簽約至2032年

官方:庫庫雷利亞加盟皇馬,簽約至2032年

體壇周報
2026-06-15 17:25:13
烏合之眾的“愛國幻覺”與流量狂歡

烏合之眾的“愛國幻覺”與流量狂歡

文史非常道畢延河
2026-06-14 09:28:31
鄭欽文終于贏了:2-1逆轉高排名強敵,晉級WTA250諾丁漢站16強

鄭欽文終于贏了:2-1逆轉高排名強敵,晉級WTA250諾丁漢站16強

側身凌空斬
2026-06-15 21:23:32
泰國公主葬禮內場畫面,讓網友大開眼界,原來不是平躺而是坐著

泰國公主葬禮內場畫面,讓網友大開眼界,原來不是平躺而是坐著

魔都姐姐雜談
2026-06-15 15:19:34
英國官宣:16歲以下全面禁用社交媒體

英國官宣:16歲以下全面禁用社交媒體

新華社
2026-06-15 17:40:29
2026-06-15 23:44:49
鏡像娛樂
鏡像娛樂
洞見文娛產業另一面。
3389文章數 1192關注度
往期回顧 全部

科技要聞

白宮一個電話,最強Claude上線三天就沒了

頭條要聞

女生當模特被折騰3個半小時 遭老板嫌棄顏值取消合作

頭條要聞

女生當模特被折騰3個半小時 遭老板嫌棄顏值取消合作

體育要聞

世界杯開賽4天,亞足聯依然保持不敗!

娛樂要聞

黃大煒猝逝過程太離奇,母親追查真相

財經要聞

活鼠、活蛆、農殘超標 山姆回應被約談

汽車要聞

網易X智己 夏日尊享內購會,熱力收官

態度原創

健康
房產
手機
教育
旅游

粽子難消化 細嚼慢咽能解決嗎?

房產要聞

最低13100元/㎡!三亞新一輪安居房房源,開始登記!

手機要聞

小米18系列突然入網:國產首款2nm旗艦,真的要發力了!

教育要聞

考前準備第十一期:吃動平衡篇,考場不犯困的小動作。#中考加油

旅游要聞

走過微山湖水,遇見水鄉溫柔,跟著鏡頭走進濟寧微山湖的另一面!

無障礙瀏覽 進入關懷版