網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek重磅發(fā)布多模態(tài)論文，怎么又連夜刪除了？

2026-05-02 14:55:16　來源: 前沿科技學習分享圈

北京舉報

分享至

五一放假前一天，大家都準備躺平了。DeepSeek反手就是一個大招。多模態(tài)能力灰度測試開啟。部分用戶打開首頁，發(fā)現(xiàn)多了一個"識圖模式"的入口。

上傳圖片，DeepSeek能像人一樣理解畫面了。

多模態(tài)團隊負責人陳小康發(fā)了句話："現(xiàn)在，我們能看見你了。"

聽起來像情話。但這是DeepSeek的聊天產(chǎn)品，第一次接入多模態(tài)。

然后論文就沒了

更魔幻的來了。

4月30日，DeepSeek發(fā)了一篇技術(shù)報告《Thinking with Visual Primitives》（用視覺原語思考）。五一節(jié)前一天發(fā)重磅論文，這很DeepSeek。

但很快，官方連夜刪除了多模態(tài)倉庫和論文原文。5月1日打開Github，已經(jīng)是404狀態(tài)。

刪除原因？官方?jīng)]說。

有人猜不是內(nèi)容問題，而是信息透露太多。DeepSeek這波操作，我只能說：懂的都懂。

這篇論文說了啥？

先別管刪沒刪，內(nèi)容才是重點。

這篇論文，符合DeepSeek一貫的風格：扎實，務(wù)實，用工程能力降成本。

核心就一句話：多模態(tài)模型在復(fù)雜任務(wù)上崩潰，不是因為看不見，而是因為"指不準"。

什么意思？

自然語言天然有模糊性。你讓模型處理復(fù)雜空間布局，光靠文字描述，很容易產(chǎn)生歧義。

就像數(shù)一堆散落的硬幣。你不用手指逐個按著確認，人類也會數(shù)錯或數(shù)重。

DeepSeek的解法是：給模型配一只"手指"。

通過引入"視覺原語"框架，模型把點、邊界框這些空間標記，提升為最小思維單元。模型在推理時，能一邊"想"一邊"指"，把抽象的語言邏輯指向具體空間坐標。

這靈感來自人類認知。你走迷宮或數(shù)密集物體時，會用手指這類指示性指向，來降低認知負荷、維持邏輯一致性。

DeepSeek把這套邏輯，教給了模型。

性能怎么樣？

這模型基于DeepSeek-V4-Flash構(gòu)建，總參數(shù)2840億。

大量實驗表明，在推理精度上實現(xiàn)顯著突破。空間推理、視覺問答這些挑戰(zhàn)性任務(wù)上，性能持平或超越GPT、Claude、Gemini最新版本。

DeepSeek的研究證明了一件事：多模態(tài)智能的未來，不只是"看見更多像素"，而是構(gòu)建語言與視覺之間精準、無歧義的指代橋梁。

這句話，值得讀三遍。

為什么之前不做多模態(tài)？

其實DeepSeek在4月24日發(fā)布了V4系列旗艦?zāi)Ｐ停敃r并沒有涉及多模態(tài)。官方對V4的定義是：支持百萬字超長上下文，在Agent能力、世界知識和推理性能上實現(xiàn)國內(nèi)與開源領(lǐng)域領(lǐng)先。

多模態(tài)已經(jīng)是當前大模型更新的重要方向。DeepSeek遲遲沒跟上，被認為是能力上的一大短板。

有傳言說，DeepSeek暫緩多模態(tài)生成的訓練策略，主要源于算力和現(xiàn)金的掣肘。融資后，這一方向的訓練會更順利。

是不是真的？我不知道。但我知道一件事：技術(shù)路線的選擇，永遠比我們想象的更復(fù)雜。

一個比喻

DeepSeek這次的創(chuàng)新，讓我想起一個場景。

你讓一個盲人描述房間里的東西。他能聽見你的描述，能摸到家具的輪廓，但就是沒法精準指向某個具體位置。

現(xiàn)在，你給了他一根手杖。

他可以一邊走，一邊敲，一邊確認。語言和空間，終于對上了。

這就是視覺原語的意義。不是讓模型看得更清楚，而是讓模型指得更準確。

DeepSeek這波操作，讓我想起一句話：

技術(shù)進步的本質(zhì)，是把人類的認知方式，翻譯成機器能理解的語言。

視覺原語框架，就是這樣一個翻譯器。它把人類"邊指邊想"的認知習慣，變成了模型推理的基本單元。

論文刪了，但思路留下了。

DeepSeek的多模態(tài)時代，才剛剛開始。。。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

馮德萊恩：中歐對話結(jié)果必須令人滿意否則將進行報復(fù)

澎湃新聞 2026-07-05 07:08:04
10444 跟貼 10444
法國隊主帥:安排2名強壯球員保護姆巴佩以防對手報復(fù)

紅星新聞 2026-07-05 09:06:42
2963 跟貼 2963

河南80后男子帶村民養(yǎng)蟬，高峰期一晚上可抓1.2萬只：每晚摸三輪爬叉，抓到4小時內(nèi)冷凍

環(huán)球網(wǎng)資訊 2026-07-05 08:36:34
4092 跟貼 4092

中央安全考核巡查組專家現(xiàn)場質(zhì)問：你們管理人員上去過嗎？

上觀新聞 2026-07-05 14:22:38
21 跟貼 21
哈蘭德將標志性長發(fā)剪成利落短發(fā)，6日凌晨4點迎戰(zhàn)巴西

極目新聞 2026-07-05 17:19:25
1906 跟貼 1906

7月15日，豆包、千問下線該功能！

濟源網(wǎng) 2026-07-05 11:07:47
136 跟貼 136

泰山景區(qū)回應(yīng)修建滾筒式刀片刺繩隔離鐵絲網(wǎng)：與正常游覽路線不交叉不重疊

北京日報客戶端 2026-07-02 08:55:17
20357 跟貼 20357
兩支巴西球隊有意簽下沃齊尼亞

瀟湘晨報 2026-07-05 21:08:09
1222 跟貼 1222

知名感冒藥沖上熱搜，全國銷量暴跌55%，網(wǎng)友：好難買

哈爾濱日報 2026-07-05 11:11:15
258 跟貼 258
全球最大數(shù)據(jù)中心建設(shè)，終止了

上觀新聞 2026-07-05 06:41:18
48 跟貼 48
請客吃早餐花掉12萬！全網(wǎng)都在找他

環(huán)球網(wǎng)資訊 2026-07-05 16:57:11
2253 跟貼 2253
TCL回應(yīng)永樂款菩薩像現(xiàn)其廣告：未授權(quán)或參與涉事文物展陳

南方都市報 2026-07-05 21:14:13
2528 跟貼 2528
耗資33億！宮殿修了，國王不住了

中國新聞周刊 2026-07-05 07:31:05
132 跟貼 132
嫌顧客只點15元麻辣燙，店主稱沒心思做還追出門嘲諷：吃不起別吃

星視頻 2026-07-05 13:14:29
875 跟貼 875
馬未都：如佛像確為海口五公祠當年失竊普庵祖師坐像，愿意高高興興送回

界面新聞 2026-07-05 20:56:35
69 跟貼 69
小店老板守著冰柜嘆氣：今年雪糕棒冰怎么沒人吃了？

大象新聞 2026-07-05 21:58:07
4 跟貼 4
活力中國調(diào)研行丨向“電子工業(yè)大米”卡脖子技術(shù)發(fā)起沖擊

經(jīng)濟日報 2026-07-05 20:53:50
11 跟貼 11
銀價，跌了約50%！未來怎么走

齊魯壹點 2026-07-05 15:29:15
36 跟貼 36
罕見熱浪來襲，預(yù)計美國超1.65億人面臨高溫健康風險

齊魯壹點 2026-07-05 12:41:27
110 跟貼 110
極目幫辦丨走幾步路就有公廁，有人卻非要在小區(qū)門口隨地小便

極目新聞 2026-07-05 12:09:21
33 跟貼 33
2010年，河北四個半大小子開車撞上警車，扯出個燒焦的死人

深夜探案館 2026-07-06 01:26:53
0 跟貼 0
2017年內(nèi)蒙古那個單親媽媽，消失6天以后人在山里被挖了出來

法紀實錄簿 2026-07-06 01:34:27
0 跟貼 0
77萬未讀消息幕后：企微40人規(guī)則被老年人“圍獵”

固件更新中 2026-07-06 01:55:47
0 跟貼 0
她提前4個月請假，經(jīng)理卻讓她取消

生活觀察員啊 2026-07-06 01:36:12
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

DeepSeek重磅發(fā)布多模態(tài)論文，怎么又連夜刪除了？

華為：邏輯折疊將大幅提升麒麟CPU核心頻率

醫(yī)院給老人一次拔12顆牙種10顆 官方：將頂格行政處罰

醫(yī)院給老人一次拔12顆牙種10顆 官方：將頂格行政處罰

姆巴佩點走巴拉圭：巴黎三代左鋒傳承

霉霉婚禮照片泄露 有四人違規(guī)

揭秘跨境“對敲”換匯黑產(chǎn)

方程豹鈦9內(nèi)飾曝光 用上了長聯(lián)屏設(shè)計/下半年上市

態(tài)度原創(chuàng)

總裁空缺17個月、現(xiàn)金缺口超1000億：金融局“局外人”入局萬科

伊朗超高層方案驚艷世界，曾獲國際大獎！

乾坤灣：天下黃河第一灣，三秦黃河文旅新標桿

工程車愛游泳

醫(yī)院給老人一次拔12顆牙種10顆官方：將頂格行政處罰

醫(yī)院給老人一次拔12顆牙種10顆官方：將頂格行政處罰

霉霉婚禮照片泄露有四人違規(guī)

方程豹鈦9內(nèi)飾曝光用上了長聯(lián)屏設(shè)計/下半年上市