1945年2月,美、英、蘇三巨頭在克里米亞半島坐下來,劃定了此后半個世紀(jì)的游戲規(guī)則。大國劃定勢力范圍,小國接受安排,體系一旦確立,后來者很難翻盤。歷史學(xué)家管這叫“雅爾塔體系”。
2026年4月的第三個周四,全球AI行業(yè)走到了類似的節(jié)點(diǎn)。
24小時(shí)內(nèi)發(fā)生的事,從GPT-5.5到DeepSeek-V4,表面是幾款模型的迭代。深層看,卻是一場關(guān)于定價(jià)權(quán)與技術(shù)尊嚴(yán)的博弈。
兩條路線在這一刻被涇渭分明地劃定出來:一條是OpenAI的算力霸權(quán)加定價(jià)權(quán)收割,另一條是DeepSeek的算法極效加極致普惠。
這已經(jīng)不能被簡單稱為技術(shù)競賽的延續(xù),而是全球人工智能產(chǎn)業(yè)秩序重建的起點(diǎn)。規(guī)則正在被寫下,參與者只能選擇站在哪一邊。
硅谷的 算盤
GPT-5.5的真正分野,不在參數(shù)規(guī)模,在智能體化的底層躍遷。
OpenAI公布了一項(xiàng)指標(biāo)。內(nèi)部測試Expert-SWE中,人類需要20小時(shí)的長周期工程任務(wù),它實(shí)現(xiàn)了端到端的自主修復(fù)。它不再補(bǔ)全代碼,而是擁有了“系統(tǒng)形狀理解”能力。能理解龐大代碼庫中的依賴關(guān)系,預(yù)判一行改動會不會讓另一個模塊崩潰。配合多模態(tài)的計(jì)算機(jī)使用能力,跨軟件穿梭、讀屏、點(diǎn)擊UI、跑測試,獨(dú)立完成調(diào)試閉環(huán)。AI的角色,正從被動工具向主動同事遷移。
這種能力已滲透進(jìn)OpenAI內(nèi)部。財(cái)務(wù)團(tuán)隊(duì)用它處理2.4萬份稅務(wù)表格,7.1萬頁,幾個月的工作量壓縮到兩周。市場團(tuán)隊(duì)每人每周節(jié)省5到10小時(shí)。
學(xué)術(shù)界同樣震動。GPT-5.5在組合數(shù)學(xué)領(lǐng)域?yàn)榘倌觌y題“非對角拉姆齊常數(shù)”提出了漸進(jìn)式證明,已通過Lean形式化驗(yàn)證的嚴(yán)格審查。它從檢索已知,跨入了探索未知。
還有一件事更值得注意。為在英偉達(dá)GB200/300系統(tǒng)上提升推理效率,GPT-5.5分析了數(shù)周的生產(chǎn)流量模式,自己編寫了一套動態(tài)負(fù)載均衡與分區(qū)啟發(fā)式算法。不犧牲智能水平,Token生成速度提升20%以上。AI開始參與自身基礎(chǔ)設(shè)施的優(yōu)化。這個閉環(huán)一旦形成,技術(shù)迭代的加速度會超出多數(shù)人的預(yù)期。
但這輪發(fā)布真正的沖擊,是價(jià)格。
GPT-5.5 Pro的API定價(jià),輸入30美元,輸出180美元。單位是每百萬token。行業(yè)此前的天花板Claude Opus 4.7,輸出價(jià)是25美元。GPT-5.5直接翻了7倍。
智能體任務(wù)的真實(shí)場景里,模型需要不斷循環(huán)、調(diào)用工具、反復(fù)驗(yàn)證。一個輕量級任務(wù)消耗千萬級token是常態(tài)。
這意味著,API門檻已被暴力抬升。任務(wù)剛開始幾步,幾千甚至上萬美元就進(jìn)了OpenAI的賬戶。
但更值得追問的細(xì)節(jié)在這里。ChatGPT的Plus和Pro訂閱套餐,價(jià)格沒動。沒有漲價(jià),沒有停續(xù),沒有限流。20美元一個月的Plus用戶,仍然能用近乎不合理的價(jià)格,使用這款地表最強(qiáng)模型。
這是一場精心設(shè)計(jì)的商業(yè)架構(gòu)調(diào)整。用API天價(jià)定義行業(yè)天花板,倒逼高用量用戶轉(zhuǎn)向訂閱,把分散的API收入轉(zhuǎn)化為穩(wěn)定現(xiàn)金流。另一邊,用大眾能承受的訂閱費(fèi)守住用戶基本盤。
它傳遞的市場法則是冷的。基礎(chǔ)模型的成本與分配,由算力壟斷者定義。
中國的 出路
理解DeepSeek V4的價(jià)值,要回到一個殘酷的起點(diǎn)。
由于出口管制,中國AI企業(yè)短期內(nèi)無法在算力儲備上與OpenAI的芯片矩陣匹敵。中國人對“卡脖子”的敏感,源自真實(shí)的困境。每一次技術(shù)封鎖,最終都指向同一條出路:在硬件受限的維度上,向算法的縱深處掘進(jìn)。
DeepSeek的戰(zhàn)略回應(yīng),是這套邏輯在AI時(shí)代的延續(xù)。
上下文長度是大模型的算力黑洞。傳統(tǒng)注意力機(jī)制下,計(jì)算量隨序列長度平方級爆炸。這正是智能體快速燒錢的技術(shù)根源。每次交互堆積上下文,Token消耗在不知不覺中失控。
DeepSeek V4拿出的方案是CSA加HCA,混合壓縮注意力機(jī)制。CSA把每m個token的KV緩存壓縮成一個條目,再通過稀疏注意力篩選top-k參與計(jì)算。HCA壓得更狠,全部壓縮后執(zhí)行稠密注意力。模型只在序列維度上關(guān)注最核心的特征,實(shí)現(xiàn)了高效的信息壓縮。
數(shù)據(jù)回報(bào)相當(dāng)可觀。100萬token的超長上下文,1.6萬億參數(shù)的V4 Pro,單token推理計(jì)算量只有上一代的27%,KV緩存占用率暴跌到10%。他們還廢棄了傳統(tǒng)的AdamW優(yōu)化器,引入Muon優(yōu)化器,獨(dú)創(chuàng)了mHC流形約束超連接。殘差映射被嚴(yán)格約束在雙隨機(jī)矩陣上,信號在數(shù)百層網(wǎng)絡(luò)中傳遞,既不衰減也不爆炸。
算法取巧通常有代價(jià)。但V4 Pro的實(shí)戰(zhàn)表現(xiàn)幾乎打破了這個預(yù)設(shè)。Codeforces全球天梯榜上,排名第23位,與GPT-5.4持平。開源模型歷史上第一次在這個榜單上與閉源頂尖模型并駕齊驅(qū)。DeepSeek內(nèi)部員工已全面用它做智能體編程,體驗(yàn)超越Claude Sonnet 4.5,接近Opus 4.6。
后訓(xùn)練層面也有創(chuàng)新。拋棄了成本高昂的傳統(tǒng)RLHF獎勵模型,提出OPD同策略蒸餾。數(shù)學(xué)、編程等領(lǐng)域的專家模型,通過逆KL散度無損融合進(jìn)V4 Pro。知識遷移完成了算法代際升級。
真正刺痛行業(yè)的,是定價(jià)。
V4 Pro輸出價(jià)格:人民幣24元每百萬token。同步發(fā)布的V4 Flash,輸出價(jià)只要2元。比前代更便宜,性能只是略遜于國內(nèi)頂尖模型。在性價(jià)比維度上,這條護(hù)城河短期內(nèi)很難被撼動。官方技術(shù)報(bào)告透露,下半年國產(chǎn)昇騰950超節(jié)點(diǎn)批量上市后,價(jià)格還會進(jìn)一步下調(diào)。
如果你認(rèn)為這僅僅是“促銷讓利”就過于天真了。本質(zhì)上,這將是一次直沖產(chǎn)業(yè)定價(jià)體系的結(jié)構(gòu)性狙擊。
潛臺詞很清楚。基礎(chǔ)模型服務(wù)的價(jià)值,不由算力的稀缺性來定義,該由算法的效率來決定。在硬件受限的市場,這條路必須走通。定價(jià)權(quán)的爭奪,本質(zhì)上就是市場準(zhǔn)入權(quán)的爭奪。
最后的 啟示
雅爾塔體系給歷史的真正教訓(xùn),不在于誰輸誰贏,而在于規(guī)則一旦被寫下,后來者的騰挪空間就被鎖定了大半。
今天,OpenAI用定價(jià)權(quán)劃下了一條線。這條線以上,是它定義的“頂級生產(chǎn)力”,按算力成本收租。這條線以下,是DeepSeek硬生生撕開的口子,用算法效率重新標(biāo)定普惠的門檻。
未來幾年的產(chǎn)業(yè)演進(jìn),大概率不會脫離這個框架。有人在高處制定標(biāo)準(zhǔn),有人在低處重構(gòu)規(guī)則。身處中間地帶的玩家,如果既沒有定價(jià)權(quán),又不肯在底層效率上死磕,最終的出路只能是在后臺調(diào)參數(shù)、降體驗(yàn),用體面的方式做不體面的事。
那個周四真正回答的問題只有一個,當(dāng)算力不再是你手里的牌,你還能不能上桌。DeepSeek給出了一個答案,但這個答案是否能持續(xù),取決于一個更深層的變量:當(dāng)對手下一次抬升標(biāo)準(zhǔn)時(shí),算法創(chuàng)新還能不能跟得上。
這才是雅爾塔時(shí)刻的冷峻之處。它遠(yuǎn)不是終局,它只是告訴每一個人:站隊(duì)的時(shí)刻到了。
責(zé)任編輯 | 汪鵬
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.