網易首頁 > 網易號 > 正文 申請入駐

5月5日5點55分,GPT-5.5自己選客人開派對!Codex反超Claude Code

0
分享至


新智元報道

編輯:定慧

【新智元導讀】5月5日下午5:55,GPT-5.5要給自己辦場party——時間是GPT-5.5自己挑的,客人由Codex從推文回復里挑。這場看起來像段子的活動背后,是一個真實的市場拐點:過去兩個月,AI編程工具圈發生了一次明顯的用戶遷移,開發者開始從Claude Code轉向Codex。

55日下午5:55,GPT-5.5決定自己給自己舉辦一個慶祝party。

(也就是北京時間5月6日星期三08:55-11:55)


這個時間不是Sam Altman定的——是GPT-5.5自己挑的。


Sam Altman讓這個模型自己策劃launch celebration,模型給的方案很具體:

5月5日5點55分開場,演講要短,現場設一個收集GPT-5.6建議的入口。


據說,當天現場可能要發布GPT-5.6(PolyMarket預測是六月底發布)。


值得一提的是派對的客人怎么定。

Sam讓Codex從推文回復里挑人。

剛剛,已經有用戶曬出了派對的邀請郵件。


Sam還在推文里加了一句:Elon Musk如果想來也可以來,the world needs more love.


「讓Codex挑人」這件事不是表演,是OpenAI內部對自家產品最直接的信任投票。


而這件事的背景,是過去兩個月AI編程工具市場最戲劇的一段窗口期——

開發者社區里發生了一次明顯的遷移,從Anthropic的Claude Code,轉向OpenAI的Codex。

Sam自己在4月29日發推:feels like codex is having a chatgpt moment.


如果你是Claude Code的重度用戶,是否最近也在考慮,還是已經用上了Codex?

Codex反超是真的嗎?

先看幾個維度。

Claude Code仍領先的幾條線:

  • 模型benchmark:SWE-bench Pro Claude Opus 4.7拿到64.3%,GPT-5.5是58.6%;Tom's Guide的7項實測Claude 7/7全勝

  • dev.to對500名Reddit開發者的盲測:代碼質量這一項,Claude Code在12輪中贏了8輪,勝率67%

  • 商業收入:Claude Code在2026年2月年化收入突破25億美元,是歷史上最快達到10億美元的AI編程產品

Codex已反超的幾條線:


  • 用戶偏好:同一份dev.to調研里,傾向Codex的開發者占65.3%,按點贊數加權達79.9%

  • 實際用量:開發者用量從2025年9月占Claude Code 5%,漲到2026年1月占40%。4月之后,這條曲線第一次穿過50%

  • 周活:Codex在2026年4月8日宣布周活破300萬,仍在快速增長

  • token效率:完成同一個Express.js重構任務,Codex用150萬token,Claude Code用620萬——約4倍

  • session穩定性:Codex三天只用了30%的周配額在r/codex已成常態;同期Claude Code3分鐘用掉60%的5小時配額成為r/ClaudeAI的高頻抱怨

  • 價格策略:Codex始終保留$20 Plus套餐;Claude Code在4月22日嘗試踢出$20 Pro被罵回滾


簡單說——模型還是Claude強,工具體感是Codex贏。

Sam那句chatgpt moment不是說技術超越,是說Codex這個產品正在完成從專業用戶工具到所有人都用的躍遷。

兩邊的產品定位也確實不一樣。

Claude Code走的是手術刀路線——處理復雜代碼庫、理解大型項目、做高難度重構,深度優先;

Codex走的是瑞士軍刀路線——簡潔交互、極低門檻、快速出活,廣度優先。手術刀的市場天花板,本來就比瑞士軍刀低。

順帶說一下,這兩周開發者社區瘋傳的Codex周下載4600萬 vs Claude Code 49萬、94倍那組數據,Sam Altman本人在轉發時明確補了一句:數據來源可能不準確。

真實情況是Codex的npm下載量已經全面碾壓Claude Code。


  • 日下載量:Codex 4433 萬 vs Claude Code 44 萬 = 100 倍

  • 周下載量:Codex 1.3 億 vs Claude Code 770 萬 = 17 倍


上周17倍、月度3倍這兩個差距,幾乎完全由4/30–5/3這4天的暴漲貢獻。

量級判斷沒錯:用戶偏好和實際打開率,正在快速向Codex這一邊傾斜。

這種傾斜在哪一天開始的?

故事要從一個月前說起。

裂縫

倒推到3月23日。

Reddit r/ClaudeAI上有一條不起眼的帖子。

一位Claude Pro用戶寫到:I've used 60% of my session in 3 minutes.

我3分鐘用掉了5小時session的60%配額???


那天是周末。沒人理。

一周后,類似的帖子在r/ClaudeAI和r/codex同步爆開。

一個Pro用戶發了句Hello,消耗2%配額。

一個Max 20×用戶發出單條prompt,使用率從21%跳到100%。

還有更荒謬的——一次`--resume`操作,單次session生成了652069個output token,用戶根本沒發任何prompt。

Reddit上一條被點贊388次的留言寫得很直白——One complex prompt to Claude and by the end you've burned 50-70% of your 5-hour limit.


一條復雜prompt發完,5小時配額掉了50到70%。

另一位用戶寫:I used it 8 hours a day... bought two $200/month accounts. Canceled both immediately.

我每天用8小時,買了兩個$200的賬號,全部立刻取消了。

3月26日,Anthropic工程師Thariq Shihipar在自己的X上承認:高峰時段限流了,影響約7%用戶。

非官方口徑,反而點燃了更大的憤怒。

3月31日,Anthropic才在Reddit上回應:

people are hitting usage limits in Claude Code way faster than expected. We're actively investigating... it's the top priority for the team.

同一天,The Register把這件事推上Hacker News首頁。136個贊,115條評論。

4月1日,GitHub用戶@marcuspuchalla提交了issue#41930。標題里直接寫:no formal communication issued.愚人節這一天,Anthropic仍在沉默。

一個sentinel字符串

社區開始自己挖原因。

Claude Code是用Bun打包的二進制,體積228 MB。一群開發者把它扔進Ghidra反編譯,又用MITM抓API流量。兩個根因被挖出來。

第一個是Anthropic的自定義Bun fork——每一個API請求,都會對一個內部billing sentinel字符串做替換。這個動作破壞了prompt cache的前綴完整性。Anthropic API的計費規則里,未緩存的token成本是緩存token的10到20倍。

第二個是--resume / --continue標志會讓整個對話的緩存失效。

合在一起的效果是——你以為自己只是發了一條prompt,后端把整段歷史重新算了一次錢。一個用來追蹤計費狀態的內部字符串,把整個prompt cache系統給吃掉了。

這件事的荒謬不在bug本身——大型軟件總有bug。荒謬在于一群外部開發者用反編譯工具,比這家世界級AI公司更早找出根因。

4月8日,Sam Altman在X上發推:Codex周活破300萬。

他承諾,每多100萬用戶就重置一次額度,直到1000萬。

同一時間,Anthropic的工程團隊還在調那個sentinel字符串。

4月22日的錯誤嘗試

Anthropic這邊,硬件和模型本身沒出問題。出問題的,是它對自己產品定位的判斷。

回到4月22日那場A/B測試。

把Claude Code從$20 Pro踢出去,邏輯是清楚的——Claude Code單用戶的真實token成本遠超$20,把它綁定到$100/$200的Max套餐,能讓收入和成本對齊。商業上完全合理。


但Anthropic沒算到的是,Claude Code的口碑,本來就是「$20就能用上Opus」這一句話撐起來的。

測試上線幾小時,Hacker News和Reddit上的怒火達到頂點。Simon Willison當天在博客里寫下一句話——

Anthropic inadvertently handed OpenAI a significant marketing advantage.Anthropic無意間,給OpenAI遞了一個營銷優勢。

這句話在那一周被反復轉發。

Anthropic幾小時之內回滾。但傷害已經發生——Claude Code用戶那條$20就能用的基礎信任,被它自己親手撬動了一次。

OpenAI那邊的反應快到讓人驚訝。

Sam當晚兩個字:ok boomer.


Anthropic的初衷可以理解:Opus 4.7單次推理的token單價是$15 / $75,單用戶實際消耗遠超$20上限。

增長團隊那個測試,本意是給套餐結構降壓。

但他們低估了一件事——用戶和Claude Code的關系不是產品關系,是信任關系。

$20套餐這一層已經從商品定價變成了社區共識。

撬動它,就是撬動信任本身。

Codex這兩個月在干什么

把鏡頭往回拉。

從2025年4月Codex CLI開源那天算起,OpenAI在Codex上做的事一直在加速。

每一步都不算驚天動地。但疊在一起就是另一回事。

到了4月16日的更新之后,Codex已經不是一個CLI,是一個能控制整臺電腦、內置瀏覽器、記住屏幕活動、和90多個第三方插件互通的AI Super App。


Greg Brockman在4月18日的推文里說:Codex已經從「代碼補全」演進為「完整的Agentic IDE」。

值得一提的是Greg自己的行為——這位OpenAI總裁在2月19日公開表態,他第一次從Emacs加終端的工作方式切換到Codex桌面。

對一個寫了二十年Emacs的人來說,這是一種公開站臺。

OpenAI這一階段的產品節奏有種近乎貪婪的均勻感。每一條線都在被同時推進。

在多個為Codex站臺的推文下面,Sam都甩過同一句話——much more to come.更多東西還在來。

兩位創始人同時、密集地為同一個產品搖旗,在OpenAI的歷史上不算常見。

上一次出現類似陣仗,還是ChatGPT剛發布的那陣子。

技術上Codex其實沒贏

下面這段可能讓一些讀者意外。

dev.to對500名Reddit開發者的調研——


  • 傾向Codex:65.3%


盲測代碼質量:Claude Code在12輪中贏了8輪,勝率67%。


token效率上,做同一個Express.js重構,Codex用150萬token,Claude Code用620萬——4倍。

把這些數字放一起看,故事就清楚了——

Codex反超的不是「代碼寫得更好」,是「代碼寫得更便宜,更快,更不被掐斷」。

Anthropic在過去六個月反復證明,自己的模型在「正確性」上仍是冠軍。

但今天打開終端這一刻,能不能不被掐斷地干完一件事這個問題上,Codex用一種近乎笨拙的方式贏了——把價格壓住,把額度撐開,把token用法做高效,然后等對手出錯。

Hacker News上一位ID叫@d-lo的用戶在4月中旬寫:

I've mostly switched to Codex (GPT-5.4 high) over Claude Code (Opus 4.6) in the last few weeks.

我過去幾周已經基本從Claude Code切到Codex了。

另一位@antoineMoPa寫得更直接:

Claude has become pretty slow in the last couple of weeks, so I switched to codex.

最近兩周Claude變得相當慢,所以我換到了codex。

這兩條留言都不是刻意的轉向聲明,是用戶體感的純粹報告。

4月29日,Sam Altman發了那條推文。

feels like codex is having a chatgpt moment.

ChatGPT moment這個詞,OpenAI自己最清楚意味著什么。

2022年11月30日那天的ChatGPT不是技術最強的產品。它只是第一個讓所有人都能上手用的產品。

把一個東西從專業用戶的工具變成所有人的下意識反射,這條線很難跨。一旦跨過去,市場結構就變了。

這條推文的發布時機也值得一提——4月29日,距離Anthropic那場Pro套餐風波剛好一周。

一周前Anthropic公開認錯回滾,一周后OpenAI的CEO用一句chatgpt moment宣告自己產品的臨界點。

Greg Brockman也在那一周持續發聲。4月26日他寫:codex empowers anyone to build.

關鍵不是造東西,是任何人。

半個月前,任何人這個詞還是Claude Code的——憑的就是任何人都能用$20用上Opus,F在,這個標簽易主了。

回到5月5日下午5:55

回頭看這場即將到來的GPT-5.5的party。

時間是模型自己挑的。客人由Codex挑。Sam邀請Elon Musk。

這場看起來像段子的活動,背后是一個非常具體的產品判斷——OpenAI已經把Codex放在自己產品體系的中央位置。連挑客人這種事,都交給它。

當Anthropic還在4月22日的回滾和后續解釋里反復磨合,OpenAI已經走到了下一個節奏——讓自己的產品給自己辦生日。

這就是過去兩個月發生的事。不是哪一家技術突然變好,是產品節奏被一方完全定義了。

編碼工具的終局不是誰的代碼寫得更漂亮,是誰能成為開發者日常工作流里那個關不掉的標簽頁。

這場仗,才剛剛開始。

參考資料:

https://x.com/sama/status/2046808114561974567

https://dev.to/_46ea277e677b888e0cd13/claude-code-vs-codex-2026-what-500-reddit-developers-really-think-31pb

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“預言帝”墨菲惜敗吳宜澤后自嘲:我現在很討厭自己

“預言帝”墨菲惜敗吳宜澤后自嘲:我現在很討厭自己

封面新聞
2026-05-05 10:24:05
開國十大元帥的另類排名:在黨的七大中央委員會的排名

開國十大元帥的另類排名:在黨的七大中央委員會的排名

阿器談史
2026-05-04 14:19:29
大師靠“美國崩潰論”卷走百億,跑路美國后,痛罵中國人

大師靠“美國崩潰論”卷走百億,跑路美國后,痛罵中國人

談史論天地
2026-04-25 11:00:08
看了長假全網破防的“8萬人集體自爆丑照”,我才頓悟什么是人生頂級心態!

看了長假全網破防的“8萬人集體自爆丑照”,我才頓悟什么是人生頂級心態!

脆皮先生
2026-05-04 19:42:03
14投10分!馬刺4首輪換來偽球星,硬仗就軟,還給2.2億續約虧麻了

14投10分!馬刺4首輪換來偽球星,硬仗就軟,還給2.2億續約虧麻了

你的籃球頻道
2026-05-05 12:58:26
記者:哈登和火箭過去幾年一直有意重聚,兩次機會最終均未達成

記者:哈登和火箭過去幾年一直有意重聚,兩次機會最終均未達成

懂球帝
2026-05-05 12:16:06
有一種痛苦叫做“回農村建房”!父母住不慣,自己回不去,太難受

有一種痛苦叫做“回農村建房”!父母住不慣,自己回不去,太難受

家居設計師蘇哥
2026-05-05 11:26:50
四名地下黨員吃面,一人見碗中面特少,悄悄對另兩人說:快撤……

四名地下黨員吃面,一人見碗中面特少,悄悄對另兩人說:快撤……

華人星光
2026-05-04 11:19:43
尺度在線,沖著顏值和肉體刷一部爽片,女神美極了

尺度在線,沖著顏值和肉體刷一部爽片,女神美極了

嘴角上翹的弧度
2026-05-05 08:53:48
歐冠|7日凌晨半決賽次回合上演,拜仁死磕大巴黎,看誰是幸運兒

歐冠|7日凌晨半決賽次回合上演,拜仁死磕大巴黎,看誰是幸運兒

齊魯壹點
2026-05-05 17:39:16
霍爾木茲上演“迷你戰爭”,特朗普威脅將伊朗“從地球表面抹去”!美伊劍拔弩張又要開打?

霍爾木茲上演“迷你戰爭”,特朗普威脅將伊朗“從地球表面抹去”!美伊劍拔弩張又要開打?

大風新聞
2026-05-05 10:37:15
陳都靈,瘦的讓人心疼

陳都靈,瘦的讓人心疼

陳意小可愛
2026-05-01 10:53:54
母親除夕夜拋下她,父親唐國強閃婚不養她,42歲的唐莉活成這樣

母親除夕夜拋下她,父親唐國強閃婚不養她,42歲的唐莉活成這樣

暖心萌阿菇涼
2026-05-04 13:13:34
三星系統更新提速,用戶卻更焦慮了

三星系統更新提速,用戶卻更焦慮了

Ping值焦慮
2026-05-05 16:17:06
黃博文:青島西海岸密集賽程優先保障體能恢復 全隊盼主場全取三分

黃博文:青島西海岸密集賽程優先保障體能恢復 全隊盼主場全取三分

林子說事
2026-05-05 10:18:18
李帥+老蒯缺練,“印度人”出戰成疑!王燊超:為隊徽和球迷而戰

李帥+老蒯缺練,“印度人”出戰成疑!王燊超:為隊徽和球迷而戰

刀鋒體育
2026-05-05 17:42:28
未經證實的伊朗聲明

未經證實的伊朗聲明

西樓飲月
2026-05-04 22:27:14
史上最嚴控煙來了,哪座城市的煙味最淡?

史上最嚴控煙來了,哪座城市的煙味最淡?

新周刊
2026-05-05 16:06:33
脫發藥里的“核武器”,終于來了

脫發藥里的“核武器”,終于來了

醫學界
2026-05-03 14:50:42
早上為什么不建議吃饅頭?忠告:不止饅頭,這5類食物,盡量少吃

早上為什么不建議吃饅頭?忠告:不止饅頭,這5類食物,盡量少吃

白話電影院
2026-04-05 22:37:36
2026-05-05 19:27:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15135文章數 66836關注度
往期回顧 全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

伊朗發射導彈襲擊美軍艦船和商船及阿聯酋 特朗普表態

頭條要聞

伊朗發射導彈襲擊美軍艦船和商船及阿聯酋 特朗普表態

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

英皇25周年演唱會 張敬軒被救護車拉走

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

本地
游戲
時尚
旅游
公開課

本地新聞

用青花瓷的方式,打開西溪濕地

日本玩家瘋搶!Steam手柄開售即售罄 官網臨時關閉

夏天最經典的銀色,貴氣十足!

旅游要聞

文旅融合點燃假日消費熱潮,上海“五一”接待游客超1690萬人次

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版