![]()
DeepSeek V4到底何時(shí)發(fā)布?不少人都在好奇和關(guān)注這一點(diǎn)。
之所以DeepSeek V4吊起了這么多人的胃口,主要是其發(fā)布時(shí)間已出現(xiàn)一再延期的現(xiàn)象。
原本在今年1月份時(shí),傳出發(fā)布時(shí)間在春節(jié)期間,但當(dāng)時(shí)沒有發(fā)布。時(shí)間來到3月份,有消息稱定在同月的十幾號,可到了3月30日還沒有發(fā)布。還有消息稱,其將于4月正式上線。
這一次,“靴子”會準(zhǔn)時(shí)落地嗎?
1
DeepSeek V4距離上一次產(chǎn)品發(fā)布更新,已經(jīng)過去三個月了。這在更新飆速的2025年,是不可想象的。
人工智能的技術(shù)迭代到底有多快?人們開玩笑地稱,不學(xué)或許是一種抵抗焦慮的方法。因?yàn)橥F(xiàn)實(shí)是,這個技術(shù)新品剛剛摸到點(diǎn)門道,下一秒已經(jīng)過時(shí)了。
DeepSeek作為開源模型的“一代宗師”,勢必成為大眾關(guān)注的焦點(diǎn)。其距離現(xiàn)在最近的一次發(fā)布,是2025年12月1日DeepSeek V3.2發(fā)布。那之后便是一些修修補(bǔ)補(bǔ)類的更新,DeepSeek V4的發(fā)布時(shí)間則一再延期。
此前的2025年,DeepSeek的發(fā)布節(jié)奏大概維持在月更或兩月一更的狀態(tài)。2025年一年的時(shí)間里,DeepSeek陸陸續(xù)續(xù)發(fā)布了V3系列、R1推理模型、V3.2-Exp(稀疏注意力)、V3.2正式版等等模型。
![]()
讓人留意的是,整個人工智能行業(yè)的大方向,正從模型發(fā)布比拼轉(zhuǎn)向智能體能力。這與日前林俊旸在離開阿里后首度發(fā)長文提到的內(nèi)容頗為一致。
在林俊旸看來,人工智能時(shí)代,正從“推理式思維”轉(zhuǎn)向至“智能體思維”。
林俊旸在文中回顧了OpenAI的o1和DeepSeek R1,在整個人工智能時(shí)代當(dāng)中的符號意義,即證明和推廣了推理概念,然而未來這不再是時(shí)代主流。
林俊旸認(rèn)為,未來的主流方向是“智能體思維”。其特點(diǎn)便是,在與環(huán)境的交互中不斷修正計(jì)劃。林俊旸將其形象地描述為:不再是“想更久”,而是“為了行動而想”。
讓人印象深刻的是,林俊旸在文中認(rèn)為,未來更好的模型,僅僅是其中之一的競爭力,而非全部,更好的環(huán)境設(shè)計(jì)、更強(qiáng)的harness工程以及多個智能體之間的編排,都將成為未來不可或缺的競爭力。
比拼模型發(fā)布已經(jīng)不再是重點(diǎn),重點(diǎn)是如何讓模型實(shí)現(xiàn)“連續(xù)干活”。
這個時(shí)候,DeepSeek V4的發(fā)布一再延期,似乎就是情理之中的事情。
2
Agent時(shí)代到來,從梁文鋒以及DeepSeek的近況來看,他們已經(jīng)開始逐漸轉(zhuǎn)變了方向和重點(diǎn)。
據(jù)爆料,梁文鋒的研究方向,近半年來主要鎖定了兩個重點(diǎn),一個是模型的視覺內(nèi)容處理,另一個則是AI搜索。
去年底發(fā)布的DeepSeek V3.2,其明顯特征是重點(diǎn)鎖定tool-use和agent訓(xùn)練數(shù)據(jù)。按官方說法,其引入了覆蓋1800+真實(shí)環(huán)境、8.5萬+復(fù)雜指令的agent訓(xùn)練數(shù)據(jù)合成方法。
這意味著什么?在DeepSeek V3.2身上,就已經(jīng)顯現(xiàn)DeepSeek將目標(biāo)鎖定在訓(xùn)練一個“真正可執(zhí)行的系統(tǒng)”,而非訓(xùn)練“更聰明的模型”。
上述轉(zhuǎn)變,在梁文鋒帶領(lǐng)團(tuán)隊(duì)新發(fā)布的論文當(dāng)中也可窺一二。
2026年1月其發(fā)布的一篇署名論文則提出了條件記憶機(jī)制,稍早一點(diǎn),2025年底,一篇署名論文呈現(xiàn)優(yōu)化Transformer記憶與長上下文瓶頸的成果。
據(jù)爆料,DeepSeek V4可能將在多模態(tài)、長期記憶、代碼能力躍升等幾個方面呈現(xiàn)其特點(diǎn)。另外其還會深度適配國產(chǎn)芯片,比如向華為等國內(nèi)廠商提供提前訪問權(quán),以支持其優(yōu)化處理器軟件,確保模型在硬件上高效運(yùn)行。
若如爆料所述,可能即將發(fā)布的DeepSeek V4,不再單單是一個更強(qiáng)模型,而是一個涉及模型、工具、工作流以及生態(tài)的系統(tǒng)工程。
近來,模型領(lǐng)域的創(chuàng)新速度其實(shí)是越來越快的。一些海外大模型比如OpenAI和Anthropic,到了2026年更新速度明顯加快,甚至趕上2025年DeepSeek的更新狀態(tài)。
為什么DeepSeek卻變慢了?除了上述重點(diǎn)創(chuàng)新方向的轉(zhuǎn)變,創(chuàng)新難度加大之外,就是開源模式比閉源模式壓力更大。出牌若無大創(chuàng)新,這個牌反而不出更好一些。這恐怕也是DeepSeek V4一再延期的原因之一。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.