網易首頁 > 網易號 > 正文 申請入駐

不想跟英偉達玩了

0
分享至


文:王智遠 | ID:Z201440

我點開 DeepSeek 的 API 定價頁,想看看 V4 具體售價多少,結果在價格表下方看到一行灰色小字。

字體特別小,不留意的話很容易直接劃走。

上面寫著「受限于高端算力,目前 Pro 的服務吞吐十分有限,預計下半年昇騰 950 超節點批量上市后,Pro 的價格會大幅下調」。

簡單來說,DeepSeek 把自己未來能不能降價、降多少,公開綁定到了華為昇騰 950 這顆芯片的出貨節奏上。

早在 DeepSeek 正式發布前,就有不少傳聞將它和昇騰關聯在一起,只是一直沒有實錘,現在來看,雙方的深度合作已經落地。

所以,在我看來,這行不起眼的灰色小字,蘊含的關鍵信息,比所有跑分加起來都大。

想要看懂這行小字到底有多關鍵,得先弄懂一個技術細節;DeepSeek V4 訓練時,用了一種叫 mxFP4 的精度方案。這名詞聽著特別高大上,其實我也不懂啊。

于是,索性了解了下,意思是:

大模型有著上萬億個參數,每個參數本質上是一串數字,這些數字全都要存放在芯片的儲存空間里;行業里普遍用的是 FP8 方案,靠 8 位比特記錄一個數字,FP4 只需要 4 位比特就行。

打個通俗的比方:

FP8 就像用常規字號在 A4 紙上記筆記,一頁紙能承載的內容很有限,FP4 把字號縮小一半,同一張紙能裝下兩倍內容。

雖說精細度稍微差一點,完全不影響正常識別和使用。

我專門查過實測數據,FP4 對比 FP8,問答的準確度幾乎沒怎么掉,日常使用的絕大多數場景里,普通人完全感受不到區別,還能直接省下一半儲存空間。

簡單講,FP4 的優勢,是更少的存儲空間,更低的計算成本,跑差不多效果的模型。

搞懂 FP4 之后,接下來的事情有意思了。

目前英偉達的整個生態體系,主流用 FP8。國內芯片這邊,華為昇騰 950 是唯一一款已經商用、并且明確支持 FP4 的 AI 加速卡。

重點是:唯一一款。

DeepSeek V4 在訓練階段選了 FP4,昇騰 950 恰好是國內唯一支持 FP4 的芯片,這兩件事放在一起,不需要任何人告訴你結論。

這根本不是模型做完再臨時去兼容國產芯片,早在模型訓練起步階段,選擇精度規格的時候,已經專門為這顆芯片量身鋪路了。

就像你設計一把鑰匙時,已經知道它要開的那把鎖長什么樣。

那 DeepSeek 為什么要這么做?單純立場問題,或是情懷加持?我覺得根本沒這么簡單,畢竟它一直堅持開源,海外也有大量用戶在使用。

本質上,背后有一筆實打實的商業賬單。

要知道 DeepSeek 是開源企業,核心收入全靠 API 調用;它的核心打法是極致低價,V4-Flash 輸入只要 0.2 元每百萬 tokens,比 OpenAI 同檔次產品便宜幾十倍,妥妥的行業價格殺手。

「價格屠夫」的名頭聽著亮眼,背后卻有個繞不開的硬性要求,那就是算力成本必須壓到極致。

如果一直綁定英偉達,兩大難題永遠躲不開:

一,顯卡造價昂貴,高昂的算力成本會直接壓縮利潤;二,供應鏈完全不受自己掌控,一旦相關管制收緊,隨時會被卡脖子。

開源模型廠商利潤本來就十分微薄,這種盈利模式下,把核心算力命脈,攥在無法自主掌控的外部供應商手里,無異于慢慢等死。

所以,擁抱國產芯片是 DeepSeek 能持續走低價路線、長久活下去的核心關鍵。

對了,這還沒完。V4 是周五上午發的,同一天之內,華為昇騰、寒武紀、海光信息、摩爾線程率先官宣完成適配。

到收盤前,加上沐曦、昆侖芯、平頭哥、天數智芯,一共 8 家國產 AI 芯片品牌全部完成「Day 0 適配」。

Day 0,發布當天就能跑。

不光是芯片廠商,華為云、騰訊云、百度智能云、阿里云、天翼云、聯想智能云這些云服務商,也在同一天宣布把 V4 上架到自己的平臺;寧暢、長江計算這些做服務器的廠商,也跟著同步跟進。

一個模型發布,整條產業鏈當天就集體響應,這速度絕對不可能是看到發布才開始動手的。

你想啊,一個萬億參數的全新模型,從拿到權重,到完成適配、跑通推理、測出性能數據,幾個小時根本不可能做完。

那答案就只有一個了:這些廠商,早就提前拿到了 V4 的模型,早就開始做準備了。

我查了一下,The Information 的報道也印證了這一點。DeepSeek 在 V4 發布之前,特意給國產芯片廠商開了提前適配的窗口,給了他們好幾周的時間做調試、做優化,反倒是英偉達和 AMD,沒拿到這個優先權。

所以,你再回頭看周五那天的場面,它更像一場提前排練好的集體亮相。

DeepSeek 是領唱,幾家芯片廠商是和聲,云服務商和服務器廠商是伴奏,所有人在同一天一起上臺。

以前聊 AI 產業鏈,基本上都沿著同一條線說:

模型突破了,算力需求爆發,所以要建更多算力中心,需要更多芯片,英偉達吃肉,臺積電代工跟著喝湯,臺積電產能不夠就得買設備,半導體設備是下一個主線。

我承認,這條邏輯過去兩年完全成立,V4 這次釋放的信號,是旁邊正在長出另一條鏈路。

前面我說的,FP4 精度選擇、幾家芯片同天適配、云服務商同步上架,串起來看,這條新鏈路的輪廓已經很清晰了。

它的核心驅動力是「軟硬件從源頭協同設計」。堆量和協同,受益的方向幾乎沒有重疊,用舊地圖去找新鏈路上的機會,大概率會走偏。

這件事的影響范圍還不止于「利好誰」。

我查了一下,據路透社 3 月 27 日報道,字節跳動和阿里巴巴均計劃大規模采購昇騰 950,華為今年計劃出貨約 75 萬顆。

國內財經媒體援引的數據更具體,字節約 25 萬顆,阿里約 15 萬顆,光這兩家加起來就 40 萬顆,占了全年出貨計劃的一半以上。

需要說明,這組采購數字,幾家當事方既沒有回應、也沒有承認,芯片采購量級本身屬于高度敏感的商業信息,不公開確認是正常的。

因為供需關系的變化,昇騰 950 已經漲價 20%,這些訂單在 V4 發布之前就已經下了。

這里有一個很微妙的關系,大廠們買了芯片,準備用國產算力來跑大模型、做云服務。

這個商業決策最終成不成立,取決于一個前提:得有一個足夠強的模型,在這顆芯片上真的跑通了,效果經得起驗證。

V4,正是那個驗證。

它是整個國產算力產業鏈的一張驗收單,驗收通過,40 萬顆芯片的訂單才有意義,后續更大規模的采購才有依據。

當然,這件事也沒有那么完美,不能為了吹捧忽略客觀事實。

訓練側,V4 最核心預訓練過程,仍然跑在英偉達的體系上,國產芯片目前接住的是推理側,用戶實際調用模型時的那部分算力。

訓練和推理是兩件事,推理跑通了不代表訓練也能脫離英偉達。

昇騰 950 的產能也是另一個未知數,全年 75 萬顆的出貨計劃,光字節和阿里兩家就要走一半以上,后面排隊的還有騰訊、百度和一眾中小廠商;供不應求的局面下,產能能不能跟上,直接決定這條新鏈路的傳導速度。

換句話說,閉環在推理側跑通了,訓練側還要時間。

我認為,看這件事得看方向,過去幾年,中國 AI 產業的底色一直是「用別人的芯片,追別人的模型」;V4 釋放的信號不一樣,有人開始用自己的芯片跑自己的模型了,芯片和模型從一開始就在一起長。

路還很長,產能瓶頸、訓練側的硬骨頭、CUDA 生態十幾年積累的護城河,這些都是真的;當然,中國 AI 第一次在頂級模型層面跑通國產算力閉環,這也是真的。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
生理旺盛的女性,大多有這3個特征,超準!

生理旺盛的女性,大多有這3個特征,超準!

皓皓情感說
2026-04-25 19:09:10
“新管理層對我不友好”,東方甄選四大主播集體離職!俞敏洪公開致歉:是平臺的損失

“新管理層對我不友好”,東方甄選四大主播集體離職!俞敏洪公開致歉:是平臺的損失

都市快報橙柿互動
2026-04-26 10:57:49
突發!光通信再爆黑馬!這個方向,即將開啟史詩級大周期(附股)

突發!光通信再爆黑馬!這個方向,即將開啟史詩級大周期(附股)

林子說事
2026-04-26 13:10:32
2.4億頂薪打沒了!季后賽場均9+8,不像魔獸霍華德,更像小喬丹

2.4億頂薪打沒了!季后賽場均9+8,不像魔獸霍華德,更像小喬丹

你的籃球頻道
2026-04-26 08:17:48
沒有對手了?華為Mate90重磅信息出爐,蘋果18優勢蕩然無存

沒有對手了?華為Mate90重磅信息出爐,蘋果18優勢蕩然無存

叮當當科技
2026-04-26 10:58:22
50萬的車預訂量破2.5萬臺,問界M9這次真的把BBA打懵了

50萬的車預訂量破2.5萬臺,問界M9這次真的把BBA打懵了

小南看車
2026-04-25 23:08:49
張檬兒子周歲宴排面拉滿,爸爸全程溫柔抱哄,被全家寵成小寶貝

張檬兒子周歲宴排面拉滿,爸爸全程溫柔抱哄,被全家寵成小寶貝

黔鄉小姊妹
2026-04-26 09:35:09
重返國乒僅1周,國際乒聯對馬龍的稱呼變了,再次印證劉國梁的話

重返國乒僅1周,國際乒聯對馬龍的稱呼變了,再次印證劉國梁的話

阿纂看事
2026-04-25 18:11:38
湖南美女“克拉姐姐”去世,年僅25歲,原今年訂婚,棺木不能入家

湖南美女“克拉姐姐”去世,年僅25歲,原今年訂婚,棺木不能入家

裕豐娛間說
2026-04-25 22:47:12
公安部正式回應:紅綠燈7月1日全國取消倒計時?不要被誤導了!

公安部正式回應:紅綠燈7月1日全國取消倒計時?不要被誤導了!

科學發掘
2026-04-26 11:01:00
“早知這么危險就不當總統了”,特朗普和萬斯撤離畫面曝光!槍手系教師兼游戲開發者,作案目標是誰?嫌疑人供認:美官員

“早知這么危險就不當總統了”,特朗普和萬斯撤離畫面曝光!槍手系教師兼游戲開發者,作案目標是誰?嫌疑人供認:美官員

每日經濟新聞
2026-04-26 16:27:34
陳奕迅女兒陳康堤承認與香港網球一哥黃澤林戀愛:是家人介紹的

陳奕迅女兒陳康堤承認與香港網球一哥黃澤林戀愛:是家人介紹的

懂球帝
2026-04-25 16:34:10
洗腦、性侵、亂倫,全球頭號變態復出了

洗腦、性侵、亂倫,全球頭號變態復出了

獨立魚
2026-04-23 22:35:39
都是窮,河南的窮,四川的窮,有什么差別

都是窮,河南的窮,四川的窮,有什么差別

高廣銀
2026-04-10 06:09:37
那個信了“朋友”去泰國潑水節的19歲女生,再也回不來了

那個信了“朋友”去泰國潑水節的19歲女生,再也回不來了

迷世書童H9527
2026-04-25 09:10:21
馬寧搶鏡亞冠決賽!指示主裁罰下沙特球員 霸氣伸指+喝退對方質疑

馬寧搶鏡亞冠決賽!指示主裁罰下沙特球員 霸氣伸指+喝退對方質疑

我愛英超
2026-04-26 06:11:19
顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

澎湃新聞
2026-04-26 11:18:27
眾生喧嘩,唯有豐田“為你而來”

眾生喧嘩,唯有豐田“為你而來”

汽車現場AS
2026-04-26 08:16:51
孟子義《奔跑吧》14宣傳片半球裸露被審判,網友:為了黑而黑

孟子義《奔跑吧》14宣傳片半球裸露被審判,網友:為了黑而黑

草莓解說體育
2026-04-26 10:58:37
警惕!七旬老人散步掉入池塘,獲救5天沒好轉,身上拔出17只蜱蟲

警惕!七旬老人散步掉入池塘,獲救5天沒好轉,身上拔出17只蜱蟲

萬象硬核本尊
2026-04-25 19:05:07
2026-04-26 17:44:49
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
684文章數 160關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

美國網民質疑:為什么先救萬斯

頭條要聞

美國網民質疑:為什么先救萬斯

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

中辦、國辦:加強新就業群體服務管理

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

游戲
藝術
房產
數碼
公開課

《刺客信條:黑旗 記憶重置》仍然會保留血液效果

藝術要聞

東漢最美的一幅隸書!這才是中華筆法根源,當代99%的人沒有見過!

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

數碼要聞

Google或正逐步淡化 Fitbit 品牌

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版