甫一發布便成為外界焦點的DeepSeek V4開啟限時折扣。
4月26日,澎湃新聞記者獲悉,DeepSeek最新發布的DeepSeek-V4-Pro模型API開啟2.5折價格特惠,輸入(緩存命中)價格為0.25元/百萬Tokens,輸入(緩存未命中)價格為3元/百萬Tokens,輸出價格為6元/百萬Tokens,優惠期截至5月5日。
而據Open Router數據顯示,最新推出的海外知名AI大模型GPT-5.5 Pro加權平均輸入價格為30美元/百萬Token,輸出價格為180美元/百萬Token,從輸入價格就和DeepSeek V4 Pro相差超700倍,此外,GPT-5.5標準版加權平均輸入價格為5美元/百萬Token,輸出價格為30美元/百萬Token,包括Anthropic Claude Opus系列、OpenAI GPT-5.4,以及谷歌Gemini 3.1 Pro系列大模型的輸出價格在12-25美元之間,均和調價后的DeepSeek V4 Pro拉開較大差距。
值得注意的是,在今年AI行業整體算力集體漲價的背景下,DeepSeek V4再次將“AI降價”的理念貫徹到底,進一步打響業內的“價格戰。
此前4月13日,阿里云宣布,旗下大數據開發治理平臺DataWorks對標準版、專業版用戶取消每日調用API的數量限制,本次變更從2026年4月14日起逐步發布。其中,DataWorks標準版調用API的免費額度調整為10萬次/月,DataWorks專業版調用API的免費額度調整為50萬次/月,超出部分采用OpenAPI按量付費的方式。
3月18日,百度智能云官網發布公告稱,受全球AI應用快速發展影響,算力需求持續攀升,核心硬件及相關基礎設施成本出現顯著上漲。為保障平臺長期穩定運行與服務質量,4月18日起,AI算力相關產品服務上調約5%至30%,并行文件存儲等上調約30%。
今年以來,騰訊云也連續兩次宣布漲價。繼3月11日對部分模型啟動正式收費及漲價后,4月9日,騰訊云稱鑒于全球AI算力需求持續激增,核心硬件供應鏈成本大幅上漲,將于2026年5月9日起,對AI算力、容器服務及彈性MapReduce(EMR)相關產品刊例價進行調整。
除了云端之外,下游模型端同時出現價格上修信號。國產大模型廠商智譜已在年內進行三次API價格上調。2月12日,智譜對GLM Coding Plan套餐實施結構性調價,整體漲幅自30%起。智譜在價格調整函中明確表示,漲價源于“市場需求持續強勁增長,用戶規模與調用量快速提升”。
3月16日,智譜發布專為智能體“龍蝦”(OpenClaw)場景深度優化的通用大模型GLM-5-Turbo,并上調其API價格,漲幅為20%。4月8日,智譜正式發布GLM-5.1,再度提價10%。調價后,GLM-5.1在Coding場景的緩存命中Token價格已接近Anthropic旗下Claude Sonnet 4.6水平。
此次DeepSeek在全球范圍內再次廣受關注,除了創新性的技術架構,核心在于對于國產芯片的全面適配,實現國產AI算力的快速崛起。華為計算發布信息稱,昇騰超節點產品全面支持DeepSeek V4。本次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持DeepSeek V4系列模型。
在DeepSeek V4發布后,寒武紀也在第一時間宣布,基于vLLM推理框架完成了對此次DeepSeek-V4-flash和DeepSeek-V4-Pro兩個版本的Day 0適配,適配代碼已開源到GitHub社區。
其中,昇騰950通過融合kernel和多流并行技術降低Attention計算和訪存開銷,大幅提升推理性能,結合多種量化算法,實現了高吞吐、低時延的DeepSeek V4模型推理部署。昇騰A3超節點系列產品也全面適配,同時為便于用戶快速微調,提供了基于昇騰A3超節點的訓練參考實現。
據DeepSeek的技術論文披露,DeepSeek V4的核心創新叫做"混合注意力架構",由兩種機制交替疊加構成:CSA(壓縮稀疏注意力)和HCA(重度壓縮注意力)。兩種機制交替出現在模型的不同層:CSA處理精細的中程信息,HCA處理粗粒度的超長程信息。同時,每個注意力層還保留了一個"滑動窗口注意力分支",專門負責最近128個token的近鄰局部信息,彌補壓縮機制容易丟失局部細節的缺陷。
在100萬token的超長上下文場景下,與上一代V3.2相比:V4-Pro的推理計算量(FLOPs)只需 27%,KV緩存(模型的"工作記憶")只需 10%;V4-Flash更極端,推理計算量降至 10%,KV緩存降至 7%。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.