這個周末,投資圈被一條消息炸開了鍋。
據外媒The Information引述四位知情人士報道,國內AI明星公司DeepSeek正式啟動成立以來的首次外部融資——目標估值不低于100億美元,計劃募集至少3億美元資金。
對此,《上海證券報》的記者多方求證,有接近人士表示“很有可能”,多位投資人直言“圈里信息已經炸了”。有消息人士甚至說,已經有投資人訂好了機票,務必要在這周末見到梁文鋒。
那個曾經把所有投資人擋在門外的DeepSeek,為什么突然要錢了?
![]()
1.“不差錢”
在聊這輪融資之前,我們先來理解一個事實——梁文鋒是真不差錢。
2023年7月,DeepSeek正式成立,由量化私募巨頭幻方量化孵化。梁文鋒從第一天就給這家公司劃了一條清晰的紅線:不接受外部融資,不稀釋股權,不被任何人的商業化時間表綁架。
他確實有這個底氣。梁文鋒是幻方量化的創始人,而幻方是國內頂級的量化對沖基金,管理規模超700億元,2025年平均收益率高達56.6%。
2025年初DeepSeek爆火之后,投資人們曾密集尋找見梁文鋒的機會。五源資本創始合伙人劉芹找了三撥人想約見,被拒絕;與DeepSeek北京辦公室同樓辦公的百度風投,也沒能投進去。
梁文鋒的態度異常鮮明,他曾對聯想創投高級合伙人宋春雨明確表示:“對商業化不感興趣,只想做技術研究。”
2025年3月,騰訊和阿里巴巴等科技巨頭遞出橄欖枝,他同樣婉拒,擔心“外部投資者會干預公司決策”。
然而,如今風向變了。
2.人才危機
最先松動的,是人。
過去半年,DeepSeek的核心團隊經歷了一場不小的動蕩。
V3架構的關鍵開發者羅福莉,在2025年底轉投小米,接手了MiMo大模型團隊;差不多同一時期,第一代大語言模型核心作者王炳宣去了騰訊;多模態方向的核心研究員阮翀加入了元戎啟行做首席科學家;OCR系列核心作者魏浩然在今年春節前后離開。
最令人關注的是郭達雅。1994年生,中山大學博士,在DeepSeek只待了兩年,卻全程參與了V3、R1、Coder、Math、Prover等幾乎所有標志性模型的研發。他提出的GRPO算法是R1的核心技術底座。
近期,郭達雅被曝以近億元的薪酬包入職字節跳動Seed團隊。抖音集團副總裁李亮雖否認了“年薪近億”的說法,但也承認,如果業務發展良好,部分技術人員四年后的收益確實可能達到數億元。
這些人為什么要走?
其實,不是梁文鋒給不起工資。據業內消息,DeepSeek的薪資并不低,問題出在期權上。
DeepSeek從未融資,沒有市場化的估值錨點,員工手中的期權完全依賴內部估值。在外部機構未以真金白銀確認價格之前,這種賬面財富在頂級人才眼中缺乏足夠的流通性和溢價錨點。
一個VC朋友直言:“DeepSeek的員工期權,就像一個沒有行權價的彩票。雖然中獎概率可能很高,但沒法換成人民幣。”
DeepSeek過去可以靠技術理想、開源聲望和梁文鋒的個人號召力凝聚一批人。但當競爭對手開出翻倍的薪資和可流通的期權時,“理想”這兩個字就變得格外沉重。
這稱不上道德層面的背叛。畢竟,對于任何一個頂級的AI研究員來說,他們的市場價值已經被大廠和資本的激烈競爭推到了一個不可思議的高度。DeepSeek如果不建立市場化的估值體系和薪酬激勵,就永遠無法在這個層面與字節、阿里掰手腕。
正是在這個背景下,這次融資最核心的目的之一就是給期權體系引入市場化定價,讓員工知道“我手里的期權到底值多少錢”。
3.新的壓力
人才只是表面的問題,DeepSeek壓力的根源是V4。梁文鋒從沒公開談過,但業內人都心知肚明,V4是一場硬仗,而且是換了跑道的硬仗。
DeepSeek已經有15個月沒有發布大版本更新了。在這段時間里,字節發布了豆包2.0,阿里和騰訊把世界模型推到了臺前,智譜和MiniMax不僅上市還完成了新一輪估值重估。
而DeepSeek的下一代旗艦模型V4一再跳票,原定春節前后發布,推到2月,再推到3月,目前的口徑是4月下旬。
V4不是普通迭代,它是一個萬億參數的MoE架構模型,支持原生多模態(文本、圖像、視頻),上下文窗口擴展到100萬token,還首次引入了Engram條件記憶機制。從工程復雜度來看,這已經不是刷benchmark的基礎模型,而是一個系統級工程。
更關鍵的是,V4是DeepSeek第一個專門為國產芯片深度優化的模型。
據路透社報道,V4的核心計算遷移到了華為最新的昇騰芯片上。從英偉達的CUDA生態遷移到華為的CANN架構,整套技術棧都需要重寫。有報道稱,V4正是因為軟件棧磨合不順而推遲過兩次。
英偉達CEO黃仁勛對此直言不諱,DeepSeek基于華為平臺的新模型“對美國來說將是一個糟糕的結果”。
言下之意,一旦AI模型被優化為在中國硬件上跑得最好,美國芯片的護城河就不再牢固。
但換跑道的代價是巨大的,萬億參數模型、多模態能力、國產芯片適配,每一項都在燒錢,燒錢量級已經跟過去DeepSeek不是一個級別。
幻方能養一個專心搞研究的DeepSeek,但一個既要換國產芯片、又要支持全球API調用、還要做多模態的DeepSeek,就不一定了。
4.戰略卡位
面對這樣的一場硬仗,那為什么只融3億美元?
這個金額,放在今天AI行業,說多不多說少不少。OpenAI今年3月剛以8520億美元估值融了1220億美元,Anthropic在2月以3800億美元估值融了300億美元。國內同行的估值也早已起飛,智譜和MiniMax的市值一度突破400億美元,月之暗面的最新估值達到180億美元。
100億美元的估值,3億美元的融資,放在這個坐標里,甚至顯得有點“便宜”。
梁文鋒不是融不到更多錢。我的判斷是,他要的其實不是錢本身,一方面他希望借助融資穩定人才隊伍,另一方面順便買一張“入場券”。
早在去年融資傳聞中,就有消息透露中投、全國社保基金主動接洽、表達投資意向。
這個資方結構本身就是一個信號。國有資本入場,意味著DeepSeek有可能獲得政府AI項目的“優先供應商”資格。在國內To-G市場,有沒有國資背書,有時候直接決定了你能不能進場。
這不是簡單的財務投資,而是戰略卡位。
5.梁文鋒不“裝”了
過去三年,梁文鋒在“裝”一個“完全不需要資本、完全不需要商業化、完全不受任何世俗約束”的技術隱士。
這個形象為他贏得了整個行業的尊敬和媒體的追捧。但也正因如此,當DeepSeek真的面臨人才流失、產品迭代壓力、生態建設需求時,他反而被自己的形象綁架了。
這一次,梁文鋒徹底“不裝了”。
幻方的錢是他的子彈,資本的錢是市場的子彈。兩種子彈有不同的用途,打不同的仗。當一個AI公司需要的不僅僅是研發經費,還需要市場化的治理結構、薪酬激勵、商業化渠道和生態入口時,自我供血的模式就不再適用了。
如果非要我給這件事下一個定義,我會說梁文鋒正在從一個“技術極客”變成“商業領袖”。
這是一個所有偉大的科技公司創始人都必須經歷的轉變。喬布斯有過,扎克伯格有過,馬化騰有過,張一鳴也有過。區別只在于,有些人在創業初期就完成了,有些人在公司爆發后才被迫完成。
梁文鋒屬于后者。
DeepSeek100億美元的估值只是一個開始。V4模型即將在4月底亮相,如果它在華為昇騰芯片上跑出世界級的性能,它將是全球第一個不依賴英偉達的前沿AI模型。這個意義,遠不止100億美元的估值能夠衡量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.