都說梁文鋒變了。
在備受矚目的DeepSeek V4發布前夕,DeepSeek首輪融資浮出水面據悉,DeepSeek正以約100億美元估值尋求新一輪融資。然而一年前,梁文鋒明確表示對商業化不感興趣,拒絕了一批試圖洽談融資的人。
那時正逢DeepSeek初芒乍現。2025年1月,DeepSeek R1發布,彼時英偉達單日狂瀉17%,市值蒸發近6000億美元。這場極其優雅的東方開源革命,以超低成本帶來頂尖模型,此后DeepSeek及梁文鋒聲名鵲起。
只是時過境遷,眼下大模型江湖日卷夜囂,世界變化緊湊劇烈,DeepSeek卻遲遲未拿出外界苦等的續作。
有人開始著急,有人開始懷疑,但持續封神的敘事對任何人都是一種負擔。
如無意外,DeepSeek V4本周即將登場。AI圈注定不會平靜。
梁文鋒保持沉默
“任何事情在你懷疑并想突破它的時候,是最吸引人的階段”,《三體》中如此寫道。
這正如今天人們對DeepSeek的期待。
自2025年初以來,國內智譜、MiniMax、Kimi以及字節、阿里等在Agent和coding強化上已經更新了數版模型,春節“百模大戰”一幕更是歷歷在目,造就覆蓋文本、圖像、視頻多模態的AI最強春節檔。
但DeepSeek仿佛不問戰事。
至今,多次傳聞要上線的DeepSeek V4還是沒有來。有人戲言,“DeepSeek已成Next Week。”
不可否認,外界對DeepSeek的好奇、關心從來不減。最近一次DeepSeek關于模型動態的推文官宣,則停留在2025年12月初,彼時其發布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
其實水面之下,并非沒有新鮮事:今年1月,DeepSeek團隊連續發布了兩篇由梁文鋒署名的論文,mHC(流形約束超連接)及Engram(條件記憶),瞄準對大模型長序列處理的提升。4月8日凌晨,DeepSeek悄悄上線了分層模式界面,出現快速模式和專家模式兩個入口,甚至還埋下了一個視覺模式的新選項。
一切都隱隱被解讀為:V4快了。
有爆料稱,DeepSeek創始人梁文鋒近日在內部溝通中透露,DeepSeek新一代旗艦大模型DeepSeek V4將于4月下旬正式發布。依然,DeepSeek官方沒有澄清,沒有回應。這風格,相當“DeepSeek”。
任江湖喧囂鼎沸,無論是梁文鋒還是DeepSeek團隊,與外界的互動從來都克制。
這種克制足夠深入,一位AI獵頭就聊起:有認識的大廠員工跳槽去DeepSeek后就“失聯”了,再也沒回復過微信。投資界此前和一位DeepSeek研究員交流,聊及公司,一律保持緘默。
人們為什么期待V4
DeepSeek此前堅定不融資。
多年前,中國前首富陳天橋曾與梁文鋒對談四小時,然后梁文鋒婉拒了陳天橋的投資。2024年初,聯想創投也找到梁文鋒想投一筆錢,但同樣無果。
再后來,無論大模型江湖融資如何熱鬧非凡,DeepSeek融資通道始終緊閉。甚至一度有消息稱:梁文鋒不急于獲得投資,擔心外部投資者會干預DeepSeek的決策。
專注,低調,不太做沒把握的事梁文鋒及DeepSeek給外界留下如此印象。
依稀記得2025年初,DeepSeek R1橫空出世,在純強化學習激發推理能力這條路徑上開創了先河,它向世界宣告著:中國能夠以極低成本做出世界級的模型。
更優雅的是,還是開源的。
以至于2025年的精彩仿佛就是由“DeepSeek時刻”開啟,這年中國大模型江湖迅速崛起和急劇變化,不僅是價格戰與開源潮襲來,競爭路線也開始高度集中在AI編程和多模態。
時至今日,開源者DeepSeek依然無可避免寄托著中國人工智能的厚望,誠如今天外界對DeepSeek V4的期冀。
如無意外,本周,DeepSeek將推出新一代大模型DeepSeek V4。此時,距離上一次重大版本更新已經過去15個月。
此前有市場傳聞,DeepSeek V4不僅將帶來萬億參數規模和百萬級上下文窗口,更首次實現與華為昇騰等國產芯片的深度適配,標志著中國AI產業在去CUDA化道路上邁出關鍵一步。
一個細節是,2025年DeepSeek V3發布時,就有開發者發現模型代碼里出現了大量PTX(Parallel Thread Execution)指令的蹤跡這是英偉達GPU的匯編語言,比CUDA更底層,當時市場就開始猜測:DeepSeek在修煉脫離CUDA的內功。
隱隱約約,梁文鋒依然是那個要做出創新的人。
中國AI敘事沸騰
別催梁文鋒
短短一年,中國AI敘事翻天覆地。
應用端的繁榮肉眼可見。國家數據局3月一則數據顯示,中國日均Token調用量已突破140萬億,較兩年前的1000億增長超過1400倍。
這帶來了全產業鏈的景氣:Kimi、智譜、Minimax等大模型商,還有阿里、字節等各大云廠商,以及芯片層、服務器層、算力調度層的參與者,無一不在積極承接這波需求沖擊。
因此,一種聲音翻涌得更加厲害:DeepSeek應該趁現在來一波大的。
但天下英雄如過江之鯽,巨大機會敞口意味著更激烈的競爭。就在這個傳聞V4將發布的4月,由姚順宇統籌的混元大模型也將發布HY 3.0,內部稱之為:混元系列重大版本迭代。
可以感受到,DeepSeek本身壓力也在顯現2026年開年來,DeepSeek上演了至少7次大規模服務中斷,例如3月29日晚至當月30日上午,其網頁端與APP端同時無法使用,宕機時間持續約12小時。
以及肉眼可見的人才流失。2025年底至2026年初,DeepSeek有郭達雅、魏浩然、王炳宣、阮翀、羅福莉等多名核心研發骨干離開。當這次傳出DeepSeek融資,市場也不可避免想到:DeepSeek不融資就沒有市場估值錨點,無法給拿了期權的核心員工吃下定心丸。
而對于令人興奮的適配國產芯片消息,亦是一項成本極高而沉重的重寫工程。外界幾乎一致認為,DeepSeekV4多次跳票,就與重寫底層代碼試圖適配國產芯片密切相關。
“我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚。”梁文鋒曾如此坦言。此時此刻,或許更不該讓曾無意成為鯰魚的DeepSeek,承擔商業世界的慕強敘事。
不可否認,DeepSeek曾真真切切給中國AI帶來破壁時刻。無論DeepSeek能否再給世人以震撼,它所展現的世界觀和方法論,都極大支撐了對通用大模型的理解甚至對頂尖人才的理解。
不妨再給DeepSeek一些耐心。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.