AI新浪潮觀察
7min read
DeepSeek 融資后,大模型領域會有什么新格局?
張鵬2026/05/14
![]()
摘要
到今天看,大模型還不能說只是巨頭的游戲,故事還在分叉,精彩還在繼續。
最近業界都在傳,DeepSeek 進行了目標可能高達 500 億人民幣的首輪融資,將刷新中國大模型公司單輪融資最高紀錄。據我了解到的消息,是不是 500 億的規模雖然無法確定,但其首輪融資金額已打破紀錄并嚴重超募,成功完成首輪融資已成定局。
那么,今天這樣的形勢下,中國大模型玩家的未來格局是什么樣的?甚至未來市場上能有多少家大模型玩家?這些玩家將如何構成?其實挺值得討論一下。
競賽規則和目標越來越明確
先說個業界的共識:Scaling law 并沒有到頭,
「更多維度的數據,更高質量的數據工程,更大的算力帶來的更龐大的基模,還在給模型能力帶來快速增長,甚至這種能力的成長還沒有看到邊界。」這基本上是現階段硅谷一線 Researcher 的共識。
這種共識代表著某種「確定性」,這意味著提升模型智能水平,在一定程度上從一個高風險的科學探索問題,開始更靠近一個高投入的工程和資本問題。只要有足夠的數據、算力和工程執行力,持續投入就能換來相對可預期的智能提升。
與此同時智能本身也逼近了一個臨界點——智能程度足以實現自進化。Anthropic Claude Cowork 的代碼全部由 Claude Code 產出,并在十天中完成。用當前最先進的智能生產力,投入下一代智能的迭代,這種模型能力到達某種臨界點后,可用于提升下一代模型的訓練效率或數據質量的現實,開始給人一種近乎「左腳踩右腳」的梯云縱的想象。
相信中國模型領域應該也已經迅速形成了兩個共識:
一方面,無論大廠還是創業公司,都必須拼盡全力,盡快跨過這道臨界點。跨不過去,差距將被徹底拉開,牌桌就沒有你的位置。
另一方面,這并不是靠一代、兩代模型 SOTA 就能贏得的比賽。它是一場星際飛行,在一個足夠長的時間里,玩家們比拼的是持續的加速度,而非某一次的沖刺加速。這意味著,你需要足夠大的「能量池」,才能留在競賽里。
模型不只是現有巨頭的游戲
訓練模型需要巨大的資源消耗,上頂級模型牌桌的入場券大概就得 10 億美元級別。這筆錢,依靠一級市場的融資已經非常不易。但這很可能僅僅是「起步價」。
真正的考驗在于,你是否具備「百億甚至千億美元」級別的持續投入能力。這筆錢大概率無法單靠融資,它可能來自兩個核心支柱之一:一個能持續產生巨額利潤的強大業務,或是能被資本市場長期、海量注資的信心。
雖然模型一度被認為是獨屬于「巨頭」的游戲,但隨著這場游戲的確定性和「規則」逐漸明確,反而現在有一些新玩家在入場,他們未必是傳統意義上的巨頭,但是他們也有強烈的入場動力。
這背后的思考是,基礎大模型并非一個產品,而是這個時代的「工業母機」。擁有自主、可控、持續迭代的模型能力,相當于在新時代擁有了自己的核心工業體系。反之,如果完全依賴外部模型 API,就像你只能做來料加工甚至是服務業,而不擁有核心的工業體系,那么無論你的應用層業務多么繁榮,都會面臨「空心化」的問題,淪為他人工業鏈條中的一環。當然,更大的問題是你也會嚴重缺少在新時代開疆辟土的「工業能力」。
基于此,中國的模型牌桌上可能將會有三類玩家:
第一類玩家是科技巨頭,例如阿里、字節、騰訊。
他們的核心優勢并非單純的資本,而是他們都有著非常強大的主營業務。
這種優勢對于訓模型的重要性,可以從「云」的發展中窺見:阿里云之所以能成為亞洲第一云,根源在于它誕生于雙十一的極限交易洪峰中,是被自有業務的極端場景「逼」出來的基礎設施。亞馬遜 AWS 也是如此。
所以科技巨頭作為第一梯隊的核心優勢在于他們強大的「A 面」——電商、社交、內容等龐大的主營業務,是「B 面」模型引擎的天然訓練場與價值出口。
對科技巨頭而言,投入模型研發并非選項,而是必須。放棄自研模型,就意味著平臺「空心化」,將未來的「工業主權」拱手讓人,這是他們絕對無法接受的。
比如之前比較被大家忽視的騰訊,其最近的模型雖然還沒有 SOTA 到引人注目,但已經看得出在快速追趕和提速。按照這種發展趨勢,未來也一定是不可忽視的力量。
第二類玩家是 MiniMax、智譜、月之暗面、階躍星辰這類模型創業公司。
他們是本輪浪潮中最敏銳的先行者,他們因模型而來,也 all in 模型,憑借技術信仰和敏銳的執行力,在模型能力上緊咬前沿。
作為新興公司,他們的優勢理應體現在更高的組織效率、更敏捷的執行力,以及在技術上的原生「天賦點」,能以相對更優的效率取得成果。
但他們面臨的挑戰也顯而易見:如何解決持續長跑的燃料問題?因此長出一個強大的 A 面業務一定是值得追求的。
例如相對于 OpenAI,Anthropic 最近一年多來在硅谷更受推崇,就是因為它憑借 Claude Code 等產品迅速建立起了強大的 A 面,展現了從第二類向第一類玩家遷移的趨勢。
在全球化中尋找出路或許是一個要探索的方向。畢竟在中美兩大市場之外,廣闊的全球市場提供了巨大空間。將模型能力或基于模型的產品,像電力一樣輸出到全球不同角落,用一定的價值循環做支點,驅動模型引擎的持續迭代,形成價值閉環。這條路不容易,但概率不為零。
相對于我們比較熟悉的前兩類,第三類玩家也很值得討論。
這類玩家是戰局中最值得關注的變量。他們雖然沒有巨頭的體量,但具備幾個典型的特征:較高的利潤率、可觀的利潤規模、有砸幾十億美元的投入決心,以及創始人自己對大模型領域足夠深的投入,在技術決心和業務決定上的極度篤定。
DeepSeek 就是這類里最獨樹一幟的代表。它正是基于幻方量化在長期量化交易業務中錘煉的 AI 與超算技術能力而創立,也得益于幻方量化這個堅實業務 A 面的支撐,加之創始人梁文峰兼具決心、意愿與模型領域的能力,使 DeepSeek 成為了業界不可忽視的力量。
但當所有人都意識到模型是一場長跑時,僅靠一個中型 A 面業務的利潤支撐是不足的。因此,這也解釋了 DeepSeek 走向融資就是一種必然選擇。
此外,DeepSeek 之所以受到大力加持,還在于其獨特的戰略站位。首先 DeepSeek 在開源路線上已經在建立初步的生態,實際上帶動了硅基流動、無問芯穹等公司的存在。同時,在所有國內大模型公司里,DeepSeek 也是與國產算力生態整合最為積極和堅定的。畢竟對于其他巨頭和創業公司而言,這是一條充滿不確定性與挑戰的、讓他們很難 all in 的道路,但 DeepSeek 做出了這個選擇,使其在事實上承載了部分與國家科技戰略相關的使命。這種與國家戰略的深度共振,超越了單一的商業業務,構成了其更宏大、也更穩固的一個「A 面」。
這不僅僅意味著 DeepSeek 可能獲得不亞于大廠的持續資源能力,也意味著開源模型領域的進一步能力加強,成為了中美閉源大模型之外的一股對沖力量。
其實我還有一個大膽的推測,大模型玩家中,可能還有一個值得重點關注的是米哈游創始人之一的蔡浩宇創立的 AI 公司 Anuttacon,其近期發布的 LPM 1.0 表演模型可能只是一道「前菜」。據傳蔡浩宇在 LLM 上的專注投入已經開始一段時間了。
另外的一個證據是在米哈游 4 月 17 日的官方校招信息中,已明確開始為「基礎大模型」舉辦技術分享暨頂尖校招生招募,并清晰地指出這是基于「自研 Foundation Model」。更值得注意的是,信息中提到米哈游的另一位創始人劉偉也將前往現場共同探討交流。從這也看得出來,投身基礎大模型大概率不只是蔡浩宇的個人興趣和動作,而可能是創始團隊在這方面達成了共同的決心,是一次重要的集體戰略選擇。
從基本能力上看,米哈游的游戲業務年收入在百億美元級別,利潤可能在 30-40 億美元區間。同時蔡浩宇已經建立獨立的公司,應該已經開始明確集中精力聚焦于大模型領域。他大概率不是像之前外界猜測的那樣只是圍著未來游戲引擎來搞模型——雖然最開始的出發點可能確實有這個因素。因為從當下模型的發展趨勢看,就算最終其模型的能力可以幫助米哈游創造「AI 世代的新游戲」,那也一定不會只是垂直于游戲領域的「AI 游戲引擎」,而必須是基于強大語言模型向上生長的數字世界「工業母機」。
實際上,米哈游在游戲領域的成就已經非常可觀,我猜測其創始人們很可能不只把大模型作為確保游戲業務能穿越時代的「防守動作」。這為什么不能是他們依托游戲業務這么好的陣地的「進攻性」能力?是通向更大賠率和更大規模的未來業務新可能性呢?
畢竟米哈游憑借其游戲業務的支撐,并且同樣可以借助資本市場的杠桿,它有潛力成為第三類玩家中另一個重要的力量。前提是,要看他們什么時候能在大語言模型上放出他們的階段性成果,驗證他們在技術上獲得被認可的「參賽資格」。
這種半場殺入,但目標堅決,并一定會尋找用技術創新超車的新玩家,至少對技術人才們而言是一種新機遇。
總之,到今天看,大模型還不能說只是巨頭的游戲,故事還在分叉,精彩還在繼續。
大模型AI創業行業趨勢
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.