今天上午,DeepSeek-V4模型預(yù)覽版正式上線,并且同步開源。距離上次發(fā)布R1已經(jīng)過去15個(gè)月,這一年多里AI圈的更新節(jié)奏快到讓人眼花繚亂,DeepSeek卻一直保持著低調(diào)。今天,這份答卷終于交出來了。
![]()
而這次升級(jí)最大的亮點(diǎn)就是把百萬字上下文理解能力做成了標(biāo)配,Agent能力也有了大幅提升,而且使用成本仍然主打“價(jià)格屠夫”。那么,它和上一代相比,就叫有哪些變化呢?
丨幾百頁的論文一次讀完
1M(一百萬tokens)上下文,是V4最明確的升級(jí)點(diǎn),作為對(duì)比,上一代DeepSeek模型的上下文窗口為128K,這次直接翻了接近8倍。
![]()
這意味著什么?簡(jiǎn)單來說,你可以一次性扔給AI一整本技術(shù)手冊(cè)、一份完整的法律合同,或者幾百頁的學(xué)術(shù)論文讓它通讀處理,而不需要分章節(jié)反復(fù)喂給它。對(duì)于寫代碼的人,丟一整個(gè)大型項(xiàng)目的代碼庫進(jìn)去讓它理解和維護(hù),也變成了現(xiàn)實(shí)場(chǎng)景。
背后的技術(shù)支撐是DeepSeek自研的DSA稀疏注意力機(jī)制(DeepSeek Sparse Attention)。這套方案在token維度進(jìn)行壓縮,相比傳統(tǒng)的全量注意力計(jì)算,大幅降低了對(duì)算力和顯存的占用——這也是為什么1M上下文能作為標(biāo)配,而不是只在高配版本上才提供。
![]()
兩個(gè)版本的選擇也不復(fù)雜。Pro版總參數(shù)1.6萬億,Agent編碼能力更強(qiáng),官方內(nèi)部已經(jīng)用它替代Sonet 4.5作為日常編程工具,交付質(zhì)量接近Opus 4.6非思考模式。Flash版2850億參數(shù),在簡(jiǎn)單任務(wù)上和Pro表現(xiàn)接近,但響應(yīng)更快、價(jià)格更低。對(duì)于多數(shù)日常使用場(chǎng)景,F(xiàn)lash就夠用了。
價(jià)格方面,F(xiàn)lash版緩存命中時(shí)輸入約0.2元/百萬tokens,Pro版緩存命中約1元/百萬tokens。放在整個(gè)大模型API市場(chǎng)里看,這個(gè)定價(jià)依然有明顯的成本優(yōu)勢(shì),尤其是Flash版,幾乎是同類能力中最便宜的選擇。
丨國產(chǎn)算力全面接棒,下半年還有降價(jià)空間
V4的另一個(gè)看點(diǎn),是國產(chǎn)算力的適配速度。
![]()
華為昇騰950在發(fā)布當(dāng)天就宣布全面支持DeepSeek-V4系列,通過融合kernel和多流并行技術(shù)優(yōu)化推理性能。基于昇騰950超節(jié)點(diǎn),V4-Flash在8K輸入場(chǎng)景下單卡解碼吞吐可達(dá)1600TPS,延遲約10ms。同時(shí),昇騰A3超節(jié)點(diǎn)系列產(chǎn)品也完成了全面適配,并提供了基于A3的訓(xùn)練參考實(shí)現(xiàn),方便開發(fā)者進(jìn)行微調(diào)。
寒武紀(jì)這邊同樣動(dòng)作迅速,宣布完成Day 0適配,基于自研高性能融合算子庫Torch-MLU-Ops對(duì)V4的新結(jié)構(gòu)做了專項(xiàng)加速,適配代碼已開源到GitHub。
![]()
整體來看,DeepSeek-V4的定位很清晰:它不像當(dāng)年橫空出世那么顛覆,而是穩(wěn)扎穩(wěn)打的進(jìn)階者。1M上下文解決了長(zhǎng)文本處理的剛需,Agent能力的提升讓它在編程和自動(dòng)化任務(wù)上更有實(shí)戰(zhàn)價(jià)值,開源策略加上國產(chǎn)算力適配,則是在構(gòu)建一個(gè)更可持續(xù)的生態(tài)基礎(chǔ)。
至于能不能追上頭部閉源模型?目前仍然有一定差距,由于不支持圖像視覺等多模態(tài)技術(shù),單看文本能力,在arena.ai榜單位列第20位,編程能力則是第14位,整體位列開源模型第一,全球第九的水平。
![]()
據(jù)了解,DeepSeek此次并未給英偉達(dá)或AMD提供提前優(yōu)化適配的機(jī)會(huì),而是將早期訪問權(quán)限獨(dú)家開放給了國產(chǎn)芯片廠商,完成了從英偉達(dá)CUDA生態(tài)向華為CANN架構(gòu)的底層遷移。而它后續(xù)不斷優(yōu)化后,應(yīng)該會(huì)在接下來的4.1或者4.2版本中給大家?guī)砀嗟捏@喜。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.