![]()
「核心提示」
國產架構與外部融資同時啟動,DeepSeek的驚險一躍。
作者 | 張經緯
編輯 | 邢昀
2026年4月,DeepSeek幾乎同時公布了兩條大新聞:一是公司啟動首次外部融資,目標估值從100億美元迅速抬升至200億到300億美元,騰訊、阿里正洽談入局;二是其新一代旗艦模型V4發布,全面適配華為昇騰950PR芯片,從英偉達的CUDA生態轉向華為的CANN框架。
一內一外兩種變化,背后是DeepSeek的全面戰略轉向,也是AI公司競爭進入深水區的標志。
那個純靠自身的量化投資輸血、以“技術理想主義”自居的DeepSeek,正在完成自己的“成人禮”。
1、國產替代和推理躍進,V4的新故事
2026年4月24日,DeepSeek V4發布。
這不是一次常規的模型迭代。新模型將總參數推至1.6萬億,首次將百萬token上下文打成標配,并實現了百萬上下文下每token的算力消耗僅為V3.2的27%,KV緩存占用只有10%。
模型輸出質量上,V4同時支持三檔推理強度,并針對Agentic Coding做了專項優化。內部評測顯示,其交付質量已接近Claude Opus 4.6的非思考模式。
不過V4最受矚目的,是首次在官方技術報告中,把國產芯片和英偉達GPU寫進了同一份硬件驗證清單。
V4適配的華為昇騰950PR推理芯片于2026年3月量產,單卡算力較英偉達對華特供版H20提升2.87倍。到目前為止,阿里巴巴、字節跳動、騰訊等國內科技巨頭已向華為下單數十萬顆昇騰芯片。
從成本角度看,這是一次理性的商業選擇。昇騰950PR的采購價格約為英偉達H200的三分之一到四分之一,絕對算力則是H200的一半,這意味著性價比。
雖然和英偉達的前沿芯片相比,國產芯片有顯著的算力差距。不過在低精度推理場景下,華為昇騰950PR的SIMD/SIMT新同構設計、低精度數據格式支持和自研HBM,能展現出超越通用GPU的效率。不僅更便宜,而且更高效。
現在也正好是大模型正從“訓練為王”逐漸轉向“推理決勝”的時代。2026年3月的GTC大會上,黃仁勛宣布推理的拐點已經到來,需求還在不斷增長。他指出過去兩年AI計算需求激增了1萬倍,行業重心正在從一次性、高成本的模型訓練,轉向持續性的推理服務。
事實上,黃仁勛本人也曾公開表達對中國芯片的憂慮。4月15日,他在彭博社播客訪談中罕見發飆,當眾反駁“芯片是濃縮鈾,不該出口給中國”的說法。他警告,過度限制無法阻止中國進步,反而會逼中國建立完整的自主生態。
跳出英偉達架構是一條高風險、高收益的新路。風險在于,CANN不是一個非常成熟的架構,第三方庫支持、調試工具鏈仍不及CUDA,對于個人開發者和小團隊而言遷移門檻依然存在。
但如果V4在華為芯片上跑出有競爭力的性能,它將是全球第一個不依賴英偉達的前沿AI模型,這意味著中國AI產業將擁有完全自主的算力底座,不再受制于華盛頓的出口管制。
這也意味著中國的AI企業們會直接坐在金山上。根據OpenRouter的數據, 2026年3月30日-4月5日,中國AI模型的周調用量突破12.96萬億Token,是同期美國的4.3倍,國產化無疑有著巨大的市場前景。
2、向資本重新伸出的手
不過,追求國產架構性價比的另一面,是DeepSeek的資金壓力。
這家一度站在中國AI賽道頂峰的公司,長期主要靠創始人梁文鋒和背后的量化基金幻方量化支持。梁文鋒直接和間接持有DeepSeek 84.29%的股份,擁有幾乎100%的表決權,這讓DeepSeek在AI創業公司中顯得格外另類。當智譜、MiniMax、月之暗面在2023-2024年瘋狂融資時,DeepSeek像一個隱士般潛心研發,直至2025年R1的橫空出世。
也是在這一年,梁文鋒拒絕了來自騰訊和阿里巴巴等科技巨頭的合作機會,擔心外部投資者會干預公司決策。而且,梁文鋒本人也極少出現在公眾視野中,除了幾篇AI研究的論文。
但他的態度不久前發生了180度大轉彎。2026年4月,DeepSeek啟動首輪外部融資,募資至少3億美元,目標估值超200億美元,市場傳聞甚至飆至300億美元以上。
AI正在變得越來越燒錢,也變得越來越值錢,這是全球性共識。
OpenAI 2025年虧損80億美元,2026年預計虧損250億美元。2026年3月OpenAI完成最新一輪融資,募集資金1220億美元,投后估值8520億美元。其最大競爭對手Anthropic于2026年2月完成300億美元G輪融資,投后估值3800億美元。由于年化收入從2025年底的90億美元暴漲至2026年4月的300億美元,Anthropic在一些二級市場的隱含估值已超1萬億美元。
除了算力采購,燒錢的還包括人才競爭。脈脈高聘《2026春招人才供需報告》顯示,2026年1至2月,AI崗位數量同比增長約12倍,崗位占比升至26.23%,平均月薪超6萬元。
薪資上漲促進了人才流動,這給很多AI大廠帶來了薪資壓力。據媒體報道,過去一年間,字節跳動Seed團隊有近70名技術人才離職,轉而加入國內頭部互聯網企業、大模型公司及國際科技巨頭。為抵御人才流失,字節跳動為Seed團隊大規模發放專項期權,提高待遇。在字節內部,活水流動到Seed部門是新風向,面試流程也相比其他部門更為復雜。
字節被報道2025年凈利潤同比下滑超過70%,核心原因是在三、四季度加碼了人工智能領域的資源投入。隨后抖音副總裁李亮澄清稱,凈利潤下降主要是優先股和期權成本變動等會計因素帶來的。雖然緩解了市場上對于字節凈利潤下滑的擔憂,但也顯示出公司在人才,尤其是AI人才激勵上的大手筆。
AI公司人才的頻繁流動,也同時給DeepSeek帶來了壓力。
去年底至今,DeepSeek有多位核心員工離職。2025年11月,羅福莉加入小米MiMo大模型團隊,她曾是DeepSeek-V2核心開發者、被冠以“95后天才少女”之名;2025年底2026年初,王炳宣加入騰訊混元大模型團隊,他是DeepSeek第一代大語言模型的核心作者;2026年1月阮翀加入元戎啟行,他是DeepSeek多模態領域核心貢獻者;2026年4月,R1核心研究員、DeepSeek-Coder系列第一作者郭達雅被報道加入字節Seed團隊。
有說法稱,梁文鋒最近尋求融資是在給員工做期權定價,以留住人才。
無論是出于保有技術人才還是做算力儲備,AI廠商都不可能暫停這種“軍備競賽”。在這當中,DeepSeek還有一些自身的課題要解決。和很多收費服務的廠商不同,DeepSeek在C端推行token平權,專注免費模式,主要靠B端API調用商業化。
這無疑讓DeepSeek更加需要引入資本市場的力量。
3、被支持,也被期待
DeepSeek作為國產大模型始終被寄予厚望。自2025年1月R1模型橫空出世以來,它以極低的訓練成本達到OpenAI頂尖模型的性能,一度引發全球科技股震蕩,被視作中國AI的標桿。
一年來,DeepSeek受到了很多不同形式的支持。比如R1上線后,國家超算互聯網平臺第一時間上線DeepSeek,提供一鍵推理和定制化訓練服務;體制內曾掀起“學習使用DeepSeek”的熱潮;華為昇騰、寒武紀、沐曦等十余家國產芯片廠商,以及華為云、天翼云、騰訊云、阿里云等九大國內云巨頭,也都及時推出適配DeepSeek的算力方案或服務。
“被支持”也意味著“被期待”。人們也同樣期待DeepSeek能在算力自主上蹚出一條路。V4全面擁抱華為昇騰,某種程度上是對這種期待的回應。
同樣備受期待的還有模型本身的性能。
V4發布前,很多人期望DeepSeek的新模型能在多模態上有所進步。然而,V4僅支持文字輸入,暫不支持原生多模態功能。相比之下,Gemini 3.1 Pro已實現"全模態”(文本+圖片+音頻+視頻),GPT-5.4支持文本、圖片、音頻、視頻全鏈路,國內主要大模型也基本支持文本+圖片的信息輸入。
DeepSeek的融資與轉向,同樣折射出中國AI創業公司的某種困境。在技術迭代以月為單位、資本開支以百億為單位的軍備競賽中,“中小廠”的研發窗口正在急劇收窄。智譜和MiniMax已先后赴港上市,月之暗面正以180億美元估值完成新一輪融資。當大廠們揮霍著源源不斷的彈藥,創業公司們只能選擇求助資本市場。
對DeepSeek自己來說,新階段也意味著新的問題。引入過多外部融資是否會掣肘DeepSeek的決策?芯片國產化是否意味著,在一定階段中美大模型技術的切割甚至差距拉大?這些都是未知數。
但DeepSeek仍有其獨特優勢。它的開源策略和低成本訓練方法論,已在全球開發者社區建立了品牌認知;它在MoE架構、條件記憶機制(Engram)、流形約束超連接(mHC)等底層技術上的創新,證明了其不依賴算力堆砌的研發能力。如果V4能在國產芯片上跑出有競爭力的性能,它將證明一件事:中國AI公司可以在被制裁的環境下,用更少的錢、更自主的供應鏈,做出世界一流的產品。
當理想主義撞上現實的算力賬單,DeepSeek正在經歷驚險一躍。這場跳躍如果成功,超越的將是整個AI產業的舊秩序。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.