![]()
撰文|畫畫
過去 15 個月,DeepSeek 幾乎在主流視野里隱身了。
在這段大模型行業每隔幾個月就要通過新品發布自證一次的狂飆期里,DeepSeek 顯得格格不入。他們沒有推出新一代模型,也沒跟進頻繁的功能補丁,甚至沒去湊行業里任何一個熱鬧。
但輿論從未放過它。
質疑、猜測與傳聞交織成網,如影隨形。
有人判斷它已掉隊,有人揣測它在等待救命錢,更有人斷言,DeepSeek 徹底錯失了 AI 競賽最關鍵的窗口期。
在那個更新頻率即實力的叢林法則里,沉默往往被直接等同于落后。
直到今天,DeepSeek 拿出了 V4。
一、名氣有多大,質疑就有多慘
DeepSeek真正的問題,從來不是技術,而是節奏。
2025年1月,DeepSeek R1橫空出世,英偉達市值單日蒸發近6000億美元,華爾街把這件事叫做AI界的斯普特尼克時刻。全球下載量第一,就連OpenAI CEO Sam Altman都說令人印象深刻,硅谷的工程師們徹夜研讀技術報告。
那個冬天,DeepSeek是中國科技史上最快進入全球視野的公司之一。
可緊接著,是漫長的靜默。
從 R1 到 V4,中間整整 15 個月,DeepSeek 的版本號像是凝固了。
外界坐不住了,開始自發為它編寫劇本。 2025 年二季度,QuestMobile 的數據給出了殘酷的側寫,DeepSeek月均下載量從 8000 萬跌至 2000 萬。
與此同時,競爭對手的評測刷榜從未停歇,國產最強的標簽被輪番爭搶,DeepSeek 似乎成了那個過氣的英雄。
緊隨其后的是關于融資的傳聞,估值從 100 億美元跳漲到 200 億美元,阿里、騰訊入局的消息傳得有鼻子有眼。梁文鋒過去對外部資金的克制立場,被外界解讀為“迫于生計的松動”。(延伸閱讀:)
這套敘事邏輯很順滑。用戶流失、友商倒逼、資金承壓,DeepSeek 大抵是撐不下去了。
這種邏輯里藏著一個默認的偏見。如果一家 AI 公司超過三個月沒搞出大動靜,就是在原地踏步。
DeepSeek 顯然不打算接受這種定義。
二、15個月,外界發生了什么
過去15個月,DeepSeek確實慢。尤其是放在整個行業的狂飆背景下,顯得更刺眼。
OpenAI融資的節奏快到荒誕。
2025年9月完成400億美元融資,估值1570億美元。七個月后,再次完成1220億美元融資,投后估值8520億美元。兩輪加起來超過1600億美元,不到一年。GPT-4o mini、o3、GPT-5,模型迭代速度按月計。
Anthropic的節奏類似。Claude 3系列到Claude 3.5系列,再到Opus 4.6、Sonnet 4.7,每一輪發布都伴隨著密集的評測轟炸和媒體報道。
國內更像一場接力賽。阿里千問密集推出Qwen 2.5系列、QwQ推理模型,今年四月72小時內連發三款戰略級模型。月之暗面的Kimi持續迭代,估值從不到百億漲到180億美元。
就在DeepSeek V4發布的同一周,馬斯克的SpaceX宣布有權以600億美元收購AI編程初創公司Cursor,那家公司2025年2月年化收入才突破20億美元,從零到被600億估值盯上,不過兩年。
整個行業形成了一套不成文的邏輯:不更新等于落后,沒融資等于出局。
在這個全員加速的跑道上,DeepSeek 的閉關,像是一種對時代節奏的無聲對抗。
三、沉默的另一面
V4 技術報告里藏著過去這段時間的部分答案。
架構層面重新設計了注意力機制。在token維度進行壓縮,結合DSA稀疏注意力,既實現了全球領先的長上下文能力,又大幅降低了計算和顯存需求。1M超長上下文,現在成為所有官方服務的標配。
Agent能力做了專項優化,針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流框架進行適配。
公告里有一句話值得注意:DeepSeek-V4已成為公司內部員工使用的Agentic Coding模型,使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式。
意思直白是說,DeepSeek自己先用,確認好用了,才拿出來給公眾看。
把這些選擇放在一起,方向很集中,壓縮計算成本,把長上下文變成標配,優化Agent協同,用Flash版降低推理門檻。它在解決的問題是怎么用,而不是有多強。
在一個還在不斷刷新"最強模型"的行業里,這是一種克制的路線。
更值得玩味的是關于硬件的深層適配。在過去這段時間里,DeepSeek 實現了對華為昇騰(Ascend)芯片的極致壓榨。
這是一個極其關鍵的信號。
在大模型被算力卡脖子的常態下,DeepSeek 并沒有選擇把未來押注在單純的 H100 堆疊上,而是走通了一條國產軟件+國產算力的深度協同路徑。
這不僅僅是出于成本考量,更是一種底層的技術主權,證明了即便在非頂配算力環境下,通過算法的極致優化,依然能跑出世界級的性能。
在出口管制持續收緊的背景下,不依賴英偉達的完整技術棧路徑,對整個中國AI產業的意義遠超DeepSeek本身。
DeepSeek 用 15 個月證明了一件事,它拒絕參與過程的可見性競賽。它不要過程的繁榮,只要結果。
梁文鋒在極少數場合說過一句話,大意是:我們不做用來講故事的產品,我們做技術本身。
這不是被迫的選擇,更像主動的取舍。
四、那16個字
在技術參數堆滿的 DeepSeek 官方推文中, 末尾有 16 個字:
“不誘于譽,不恐于誹,率道而行,端然正己。”
這出自《荀子·非十二子》。完整原文是:是以不誘于譽,不恐于誹,率道而行,端然正己,不為物傾側。
荀子當時的語境,是在痛斥那些追逐名聲、隨波逐流的人。他認為,真正的羞恥是不把事情做好,而不是不被看見。
用來翻譯DeepSeek這十五個月,相當精準。
2025年初,DeepSeek處于"譽"的極端,全球最熱的AI公司,硅谷朝圣對象,中國科技的象征。在這個位置上,最危險的是被自己的名聲帶著跑,不為了維持熱度而急著交出一份平庸的卷子。
隨后的一年,是"誹"的階段。用戶流失數據、落后論、神壇跌落的標題,每一條都在暗示它需要回應,需要反駁,需要解釋。
DeepSeek都沒有站出來。
那16個字放在V4公告的結尾,語氣平靜,沒有攻擊性,沒有說教,但信息量很足。
翻譯成直白的話是:我知道你們說了什么,但你們的話,無法改變我的方向。
這不是凡爾賽,也不像是姿態管理。
在今天,這是一個承受了十五個月空窗期的公司,在交卷的時候,順手說了一句兩千多年前就有人說過的話:我走我的路。
【版面之外】的話:
大模型行業有一種根深蒂固的焦慮,仿佛必須時刻在場才算存在。
而梁文鋒和 DeepSeek 用 15 個月的消失,完成了一次對這種焦慮的拒絕。
V4 只是結果。
至于那個漫長、枯燥、充滿質疑的過程,梁文鋒沒打算解釋。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.