網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

實(shí)錘！GPT-5.5「降智」被抓，OpenAI官方文檔認(rèn)了

2026-05-27 16:17:42　來源: 新智元

北京舉報(bào)

分享至

　　新智元報(bào)道

　　【新智元導(dǎo)讀】GPT-5.5被扒出「假思考」，用兩小時(shí)就被偷偷換成mini，200美元月費(fèi)買了個(gè)「薛定諤的腦子」。Trace命令實(shí)錘，官方文檔親自認(rèn)領(lǐng)。往后有紛紛吐槽：OpenAI，你糊弄誰呢？

　　ChatGPT又被爆「降智」了！

　　就在這兩天，上率先炸鍋。

　　網(wǎng)友Lisan al Gaib發(fā)現(xiàn)，GPT-5.5用了一兩個(gè)小時(shí)后突然變傻，每個(gè)請(qǐng)求都是秒回，質(zhì)量斷崖式下跌。

　　但界面上顯示的，依然還是「GPT-5.5 Extended Thinking」。

　　也就是說，思考的標(biāo)簽還掛著，但思考本身已經(jīng)消失了。

　　200美元/月，買了個(gè)「薛定諤的模型」

　　OpenAI開發(fā)者論壇上，一篇投訴帖同步爆了。

　　Agentify.sh表示，GPT-5.5用著用著會(huì)突然喪失遵循指令的能力。

　　眼瞧著它興沖沖地宣布「修好了」，結(jié)果代碼質(zhì)量差到引發(fā)大面積回退。

　　之前5.5-med就能輕松搞定的UI任務(wù)，現(xiàn)在連最簡(jiǎn)單的改動(dòng)都搞不定。

　　升到5.5-high，沒用。再升到xhigh，還是不行。

　　而且xhigh以前能跑好幾個(gè)小時(shí)，現(xiàn)在明顯縮短了。

　　帖子一出，回復(fù)區(qū)瞬間炸了。

　　有人直接退回了5.4。

　　有人用的是xhigh最高檔，但「跟上周比明顯拉胯，長(zhǎng)任務(wù)頻繁出錯(cuò)，完全不遵循工作流」。

　　有人反映更離譜的情況，「簡(jiǎn)單查詢也要轉(zhuǎn)很久，你打斷它糾正方向，它直接無視你，繼續(xù)按之前錯(cuò)誤的計(jì)劃走」。

　　沒錯(cuò)，所有人都在描述同一個(gè)現(xiàn)象——GPT的腦子，不知道什么時(shí)候被偷偷換掉了。

　　GPT-5.5目前的表現(xiàn)跟5.3差不多，毫不夸張。頭幾天還驚艷得不行，現(xiàn)在完全找不到當(dāng)初那個(gè)模型的影子了。

　　不是錯(cuò)覺，OpenAI自己白紙黑字寫著

　　為了驗(yàn)證，Lisan al Gaib專門做了一個(gè)對(duì)比測(cè)試。

　　同一個(gè)賬號(hào)，ChatGPT端用Extended Thinking跑出來的全是垃圾，轉(zhuǎn)頭到Codex端用xhigh，立刻恢復(fù)正常。

　　用他的原話說就是，Codex「簡(jiǎn)直比這玩意兒聰明40億倍」。

　　開發(fā)者Andrew Curran則想了個(gè)妙招——直接問模型「你的訓(xùn)練數(shù)據(jù)截止日期是什么？」

　　模型回答，August 2025。

　　問題是，GPT-5.5 Thinking的截止日期是12月。8月，是Instant版本的截止日期！

　　也就是說，他選的是Thinking，系統(tǒng)實(shí)際給他跑的是Instant。

　　界面上模型標(biāo)簽一個(gè)字都沒變，但背后的模型已經(jīng)被偷偷換掉了……

　　搞笑的是，這次OpenAI竟然在自己的幫助文檔里替用戶做了實(shí)錘。

　　根據(jù)OpenAI Help Center的官方說明，Plus用戶每3小時(shí)最多發(fā)送160條GPT-5.5消息。

　　用完之后，系統(tǒng)會(huì)靜默切換到mini模型，直到額度重置。

　　注意「靜默」兩個(gè)字。

　　沒有彈窗提示，沒有模型標(biāo)簽變化，沒有任何視覺反饋。

　　你還以為自己在用旗艦?zāi)Ｐ停瑢?duì)面已經(jīng)悄悄換成了mini。

　　Pro用戶也別高興太早。

　　Heavy思考模式，那個(gè)Pro獨(dú)享的最高推理檔位，在服務(wù)器負(fù)載高的時(shí)候，同樣會(huì)被容量限流。同樣沒有預(yù)警。

　　換句話說，200美元/月的Pro訂閱，買到的是一個(gè)隨時(shí)可能被「偷梁換柱」的服務(wù)。

　　而這種「標(biāo)簽沒變，腦子換了」的操作，在Codex端更早就被人抓包了。

　　今年2月，GitHub上出現(xiàn)了一個(gè)issue，一個(gè)Pro用戶用trace命令抓到，自己請(qǐng)求的是GPT-5.3 Codex，實(shí)際返回的模型是GPT-5.2。

　　連5.2 Codex都不是，是更低的基礎(chǔ)版5.2。

　　他貼出了復(fù)現(xiàn)命令：

　　RUST_LOG='codex_api::sse::responses=trace'codexexec--skip-git-repo-check -s read-only -m'gpt-5.3-codex''hi'2>&1 >/dev/null | rg -o --replace'$1''"model":"([^"]+)"'|head-n1

　　預(yù)期：gpt-5.3-codex

　　多個(gè)Pro用戶在同一個(gè)issue下確認(rèn)了同樣的降級(jí)。

　　而且這種降級(jí)是「粘性的」，不會(huì)自己恢復(fù)，也沒有任何解釋。

　　甚至，在4月GPT-5.5發(fā)布當(dāng)天，還有用戶報(bào)告Fast模式的速度跟Standard差不多，但計(jì)費(fèi)還是按Fast來的。

　　簡(jiǎn)單任務(wù)跑了7分49秒，正常應(yīng)該5-6分鐘。

　　OpenAI承認(rèn)了，然后就沒有然后了

　　5月15日，OpenAI的status頁面出現(xiàn)了一條記錄。

　　GPT5.5 Performance Degradation，我們正在調(diào)查部分用戶反映的GPT-5.5性能下降問題。

　　5月17日，狀態(tài)更新為「已解決」。

　　但從論壇帖子的時(shí)間線來看，5月24-26日的降智投訴比5月15日那波更猛。

　　要么「解決」了的問題又回來了，要么壓根就沒真正解決。

　　每次升級(jí)都是一次「降智爭(zhēng)議」

　　雖然各家都會(huì)遇到「模型變蠢」的吐槽，但OpenAI從GPT-5到GPT-5.5的每個(gè)更新，一次都沒缺席。

　　每一次OpenAI都說在調(diào)查，每一次都說已解決，然后下一個(gè)版本繼續(xù)。

　　2025年8月，GPT-5首發(fā)。Reddit的熱帖標(biāo)題直接就是「GPT-5太爛了」。用戶投訴短回復(fù)、更多拒絕、更少人格感。

　　OpenAI被迫緊急恢復(fù)GPT-4o選項(xiàng)。奧特曼在Reddit AMA上親自承認(rèn)「比我們預(yù)期的顛簸」。

　　2025年12月，GPT-5.2。翻譯質(zhì)量倒退，編造不存在的API，拒絕執(zhí)行5.1能輕松完成的風(fēng)格指令。

　　2026年2月，GPT-5.3-Codex。Pro用戶被靜默降級(jí)到5.2，trace命令實(shí)錘。

　　2026年3月，GPT-5.4。OpenAI社區(qū)論壇出現(xiàn)「GPT-5.4在Codex里明顯退化了」帖子，網(wǎng)友回復(fù)全部確認(rèn)。

　　2026年5月初，GPT-5.5 Instant上線。回復(fù)長(zhǎng)度縮短30%，emoji幾乎消失。網(wǎng)友總結(jié)：精度提升了，但溫度消失了。

　　2026年5月下旬，也就是現(xiàn)在。Thinking模式的降智投訴再次爆發(fā)。

　　Lisan al Gaib透露，自從GPT-5發(fā)布時(shí)他帶頭打了那場(chǎng)ChatGPT Plus額度爭(zhēng)奪戰(zhàn)之后，「每周都會(huì)收到這樣的私信」。

　　最新一條是有人求他幫忙把xhigh/heavy thinking要回來。

　　跑分最強(qiáng)的那天，是發(fā)布日

　　chatgptdisaster.com整理了1087條經(jīng)過驗(yàn)證的用戶投訴，其中一類被反復(fù)提到的場(chǎng)景叫「路由層失靈」，UI顯示GPT-5.5 Pro，輸出完全是另一個(gè)檔次的東西。

　　用戶描述了一個(gè)可復(fù)現(xiàn)的模式，長(zhǎng)會(huì)話后模型開始「完全無視你說的話」，但模型選擇器上還掛著頂配標(biāo)簽。

　　最荒誕的注腳是，Plus用戶160條/3小時(shí)用完后自動(dòng)切換mini的機(jī)制，在OpenAI官方文檔里被描述為一項(xiàng)「功能」。

　　為什么會(huì)這樣？Lisan al Gaib分析認(rèn)為，答案就兩個(gè)字，省錢。

　　算力與盈利能力的緊縮正影響著每一個(gè)人。處處精打細(xì)算，不放過任何省錢的機(jī)會(huì)。

　　然而，就在GPT-5.5用戶集體投訴的同一周，GPT-5.6的身影已經(jīng)出現(xiàn)在了Codex后臺(tái)日志里。

　　內(nèi)部代號(hào)iris-alpha，150萬Token上下文，Polymarket給出的6月發(fā)布概率超過85%。

　　一邊是5.5用戶連基礎(chǔ)體驗(yàn)都保不住，一邊是5.6已經(jīng)在后臺(tái)悄悄跑真實(shí)流量。

　　這就是2026年的ASI競(jìng)賽。

　　造新模型的速度越來越快，但讓舊模型好好跑完一個(gè)會(huì)話卻越來越難。

　　跑分最強(qiáng)的那一天永遠(yuǎn)是發(fā)布日，之后每一天都是薛定諤的GPT。

　　參考資料：

　　https://x.com/scaling01/status/2058643470357590058?s=20

　　編輯：摩西

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.