5月29日下午,好幾位平時靠DeepSeek反復推敲文案的朋友突然發現,生成鍵不太聽話了。連續點了幾次“重新生成”后,屏幕上彈出一句冷冰冰的提示:操作達到上限。有人試著在專家模式下多試兩回,結果發現機會更少,可能只給三次。普通對話里,改幾次問題、重新生成幾次,上限好像是6次。準確數字沒人說得清,因為官方沒有貼出任何公告,也沒有公開配額表,就像一道隱形的柵欄突然橫在那里,把很多人卡得一愣。
讓人心慌的不是限制本身,而是沒有任何解釋。DeepSeek的用戶忠誠度很高,平時服務器繁忙、頁面偶爾崩一下,大家還愿意體諒,但這次不一樣——功能直接被按下了暫停鍵,摸不清恢復時間,也不知道會不會變成常態。我心里也在打鼓:是不是以后修修改改都要精打細算了?
![]()
算法圈小有名氣的“半官方賬號”白墻很快在小紅書遞出定心丸:別慌,這只是一次臨時的措施。按照它的說法,“修改消息”和“重新生成”這兩個按鍵,并不是因為產品要做“負優化”才被鎖住,而是算力壓力太大之后,團隊不得不踩下的一腳剎車。最近DeepSeek用戶量攀升很快,尤其從5月29日下午起,App端的請求壓力明顯陡增。為了保證最基礎的文字對話還能正常進行,只能先對那些高頻的二次操作下手。
很多用戶可能覺得奇怪:重新生成不就是把同一個問題再問一遍嗎?修改消息也只是改幾個字而已,能有多大負擔?但從服務器的視角看,事情沒這么簡單。用戶每點一次重新生成,模型就要把整個上下文重新處理一遍,然后再生成一個新的答案,這本質上是一次完整的推理請求。修改消息也是同樣的邏輯——只要原始輸入發生了變化,模型就得基于全新指令再算一次,沒有捷徑可走。當大量用戶同時把“重新生成”當成抽卡按鈕一樣反復敲,那一波波請求就會堆疊成一座算力消耗的大山,基礎對話的通道反而可能被擠得搖搖晃晃。
這次限制能與DeepSeek近期一連串的動作對應起來看。之前專家模式的文件上傳功能下架、智能搜索功能暫時關閉,以及時不時跳出來的“服務器繁忙”提示,背后的原因其實都指向同一個方向:算力資源緊張,服務壓力已經到了必須做取舍的階段。產品越好用,涌進來的人就越多;人越多,壓力越大——這幾乎是一個甜蜜又痛苦的循環。
白墻給出的應對建議很實在:觸及上限后別急著反復重試,可以先停下來,等上十五到三十分鐘再試。多半情況下,限制會自動恢復。但如果連續快速點擊,系統很可能會把這種行為標記為異常高頻請求,等待時間反而會被拉長。同時它提到,華為昇騰超節點的新卡正在部署中,預計下半年上線,屆時算力會大幅擴容,這些臨時限制的繩子大概率會被松開。當然,這些說法目前都還屬于“路邊社”信息,DeepSeek官方尚未發布正式公告。限制的具體次數、恢復機制,以及下半年擴容后的確切變化,都需要等官方進一步確認。
如果把眼光拉遠一些,就會發現DeepSeek并非第一家這么做的AI公司。大模型產品在算力吃緊、用戶暴漲或者高峰壓力過大的時候,限流、降級、排隊,或者把一些高消耗功能單獨拿出來做限制,其實是行業里一套很常見的手牌。ChatGPT一直有消息上限,付費用戶在高需求時期同樣可能碰到使用次數被框定的情況;免費用戶用完了高級模型的配額,也會被切換到更輕量的模型繼續服務。這可以理解為一種“服務降級”,不是不讓用,只是不能讓所有人都用最貴、最占資源的能力無限跑下去。
Claude也是類似的路數。Anthropic會給不同用戶設置使用預算,Claude Code和API這類高頻場景會根據容量變化動態調整上限。今年5月6日,Anthropic專門發了一篇文章說,隨著新的算力合作和容量增加,它提高了Claude Code和Claude API的使用上限。這反過來也印證了一條規律:使用上限與算力容量是直接掛鉤的,算力吃緊時就收緊,算力放寬后才放開。而現在,Anthropic對不同訂閱的額度拆得更細,Claude Code這類高消耗場景越來越接近token計量收費的節奏。
圖像和視頻生成產品就更典型了。Sora、Gemini的圖像生成功能,以及其他AI視頻工具,在需求激增時都出現過生成次數收緊、排隊時間變長、免費額度減少的情況。“每一次推理都有成本”這句話,已經從理論變成了AI產品難以回避的現實。前陣子豆包收費引發的討論也踩在這個鼓點上。“豆包,貴又難用”一度沖上微博熱搜,它和DeepSeek這次限制功能的原因不同,但用戶情緒反彈的邏輯是相通的:大家習慣了AI產品便宜、隨便用,一旦平臺開始收費,或者悄悄給某些功能套上枷鎖,失落感就會立刻涌上來。
對AI公司而言,基礎能力免費、復雜能力開始收費、高成本功能設置額度、高峰期再做臨時限流,已經逐漸沉淀為一套通行的運營手法。DeepSeek這次限制“重新生成”和“修改消息”,放在整個行業里看并不算特殊。它限制的并不是聊天入口,也不是模型本身,只是那些容易被用戶高頻點擊、但每點一次都會重新消耗推理資源的具體操作。核心的邏輯很簡單:基礎對話必須盡量保住,這是用戶還能不能用產品的底線;而重新生成、反復修改、文件上傳、聯網搜索、長上下文、多模態生成這類消化算力的功能,在壓力高峰時更容易被限流或降級。
我覺得這次爭議最值得琢磨的地方,其實不是“限制了多少”,而是“怎么限制的”。如果官方能早一點站出來說明,這是一次臨時限流、大概需要多久恢復、哪些操作會受影響,多數用戶是愿意理解的。但在沒有任何公告的情況下,用戶昨天還用得好好的功能今天就按不下去了,大家的第一反應當然是懷疑:是不是在暗中縮水?是不是在為收費鋪路?這種信息真空帶來的不安,比限制本身更傷感情。
當AI產品從嘗鮮的玩具變成每天要碰的生產力工具,用戶對穩定性和透明度的要求自然水漲船高。限制并不可怕,可怕的是讓用戶在彈窗里才第一次知道自己被限制了。使用次數激增到需要被限額的程度,本身就意味著有大量用戶正在那里等著——哪怕只是給一句準信,也比讓一群人對著屏幕反復點擊、反復疑惑要好得多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.