OpenAI 用戶報告 GPT-5.5 表現下降，模型被默默降級

【導讀】GPT-5.5 被揭發「假思考」，兩小時內就被偷偷換成 mini，花 200 美元月費買了個「薛定諤的腦子」。Trace 命令實錘，官方文件親自認領。隨後紛紛遭到吐槽：OpenAI，你糊弄誰呢？

ChatGPT 再次被曝「降智」！

就在這兩天，𝕏 上率先炸鍋。

網友 Lisan al Gaib 發現，GPT-5.5 使用一兩個小時後突然變傻，每個請求都是秒回，品質斷崖式下跌。

但界面上顯示的，依然還是「GPT-5.5 Extended Thinking」。

In other words, the tag of thinking is still hanging, but thinking itself has disappeared.

ChatGPT

每月 200 美元，買了個「薛定諤的模型」

在 OpenAI 開發者論壇上，一篇投訴帖同時爆紅。

Agentify.sh 表示，GPT-5.5 在使用過程中會突然喪失遵循指令的能力。

眼看它興沖沖地宣布「已修復」，結果代碼品質低劣，導致大範圍回退。

以前 5.5-med 就能輕鬆完成的 UI 任務，現在連最簡單的修改都搞不定。

升到 5.5-high 沒用。再升到 xhigh，還是不行。

而且 xhigh 以前能跑好幾個小時，現在明顯縮短了。

ChatGPT

貼文一出，回覆區瞬間炸了。

有人直接退回了 5.4。

有人使用的是 Xhigh 最高檔，但「與上周相比明顯拉胯，長任務頻繁出錯，完全不遵循工作流」。

有人反映更離譜的情況：「簡單查詢也要轉很久，你打斷它糾正方向，它直接無視你，繼續按之前錯誤的計劃走」。

沒錯，所有人都在描述同一個現象——GPT 的腦子，不知道什麼時候被偷偷換掉了。

GPT-5.5 目前的表現與 5.3 差不多，毫不誇張。前幾天還驚豔不已，現在完全找不到當初那個模型的影子了。

ChatGPT

不是錯覺，OpenAI 自己白紙黑字寫著

為進行驗證，Lisan al Gaib 專門做了一個對比測試。

同一個賬號，ChatGPT 端使用 Extended Thinking 跑出來的全是垃圾，轉頭到 Codex 端使用 xhigh，立刻恢復正常。

用他的原話說就是，Codex「簡直比這玩意兒聰明40億倍」。

ChatGPT

開發者 Andrew Curran 則想了个妙招——直接問模型「你的訓練數據截止日期是什麼？」

2025 年 8 月

問題是，GPT-5.5 Thinking 的截止日期是 12 月。8 月，是 Instant 版本的截止日期！

也就是說，他選擇的是 Thinking，但系統實際為他執行的是 Instant。

介面上的模型標籤一個字都沒變，但背後的模型已經被偷偷換掉了……

ChatGPT

諷刺的是，這次 OpenAI 竟然在自己的幫助文檔中為用戶提供了實證。

根據 OpenAI 幫助中心的官方說明，Plus 用戶每 3 小時最多可發送 160 條 GPT-5.5 消息。

使用完後，系統會自動切換至 mini 模型，直至配額重置。

ChatGPT

注意「靜默」兩個字。

沒有彈窗提示，沒有模型標籤變化，沒有任何視覺反饋。

你還以為自己在用旗艦模型，對方已經悄悄換成了 mini。

專業用戶也別太高興。

Heavy 思考模式，那個 Pro 獨享的最高推理檔位，在伺服器負載高時，同樣會被容量限流。同樣沒有預警。

換句話說，每月 200 美元的 Pro 訂閱，買到的是一個隨時可能被「偷梁換柱」的服務。

ChatGPT

而這種「標籤沒變，腦子換了」的操作，在 Codex 端更早就被人抓包了。

今年2月，GitHub 上出現了一個 issue，一名 Pro 用戶使用 trace 命令發現，自己請求的是 GPT-5.3 Codex，實際返回的模型是 GPT-5.2。

連 5.2 Codex 都不是，是更低的基礎版 5.2。

ChatGPT

他貼出了重現命令：

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
gpt-5.2-2025-12-11
預期：gpt-5.3-codex

多位 Pro 用戶在同一個 issue 下確認了相同的降級。

而且這種降級是「黏性的」，不會自行恢復，也沒有任何解釋。

ChatGPT

甚至在4月GPT-5.5發布當天，仍有用戶報告Fast模式的速度與Standard差不多，但計費仍按Fast計算。

簡單任務跑了 7 分 49 秒，正常應為 5–6 分鐘。

OpenAI 承認了，然後就沒有然後了

5 月 15 日，OpenAI 的 status 頁面出現了一條記錄。

GPT5.5 性能下降，我們正在調查部分用戶反映的 GPT-5.5 性能下降問題。

May 17, status updated to "Solved".

但從論壇帖子的時間線來看，5 月 24-26 日的降智投訴比 5 月 15 日那波更猛。

問題要么重新出現，要么根本從未真正解決。

ChatGPT

每次升級都是一次「降智爭議」

雖然各家都會遇到「模型變蠢」的吐槽，但 OpenAI 從 GPT-5 到 GPT-5.5 的每個更新，一次都沒缺席。

每次 OpenAI 都說在調查，每次都说已解決，然後下一個版本繼續。

2025年8月，GPT-5 首發。Reddit 的熱帖標題直接就是「GPT-5 太爛了」。用戶投訴短回覆、更多拒絕、更少人格感。

OpenAI 被迫緊急恢復 GPT-4o 選項。奧特曼在 Reddit AMA 上親自承認「比我們預期的顛簸」。

ChatGPT

2025年12月，GPT-5.2。翻譯品質倒退，編造不存在的API，拒絕執行5.1能輕鬆完成的風格指令。

2026 年 2 月，GPT-5.3-Codex。Pro 用戶被靜默降級至 5.2，trace 命令實錘。

2026年3月，GPT-5.4。OpenAI 社區論壇出現「GPT-5.4 在 Codex 裡明顯退化了」帖子，網友回覆全部確認。

2026 年 5 月初，GPT-5.5 Instant 上線。回覆長度縮短 30%，emoji 幾乎消失。網友總結：精度提升了，但溫度消失了。

ChatGPT

2026年5月下旬，也就是現在。Thinking模式的降智投訴再次爆發。

Lisan al Gaib 表示，自從 GPT-5 發布時他帶頭爭奪 ChatGPT Plus 配額後，「每週都會收到這樣的私訊」。

最新一條是有人請求他幫忙要回 xhigh/heavy thinking。

ChatGPT

跑分最強的那天，是發佈日

chatgptdisaster.com 整理了 1087 條經過驗證的用戶投訴，其中一類被反覆提到的場景叫「路由層失靈」，UI 顯示 GPT-5.5 Pro，輸出完全是另一個檔次的東西。

用戶描述了一種可重現的模式：在長時間對話後，模型開始「完全忽視你的話」，但模型選擇器上仍標有頂級標籤。

ChatGPT

最荒謬的註腳是，Plus 用戶在 160 條/3 小時用完後自動切換至 mini 的機制，在 OpenAI 官方文件中被描述為一項「功能」。

為什麼會這樣？Lisan al Gaib 分析認為，答案就兩個字，省錢。

算力與盈利能力的緊縮正影響著每一個人。處處精打細算，不放過任何省錢的機會。

ChatGPT

然而，就在 GPT-5.5 用戶集體投訴的同一週，GPT-5.6 的身影已經出現在了 Codex 後台日誌裡。

內部代號 iris-alpha，150 萬 Token 上下文，Polymarket 給出的 6 月發布機率超過 85%。

一邊是 5.5 用戶連基本體驗都保不住，一邊是 5.6 已經在後台悄悄運行真實流量。

這就是2026年的ASI競賽。

建立新模型的速度越來越快，但讓舊模型完整執行一個對話卻越來越困難。

跑分最強的那一天永遠是發布日，之後每一天都是薛定諤的 GPT。

ChatGPT

參考資料：https://x.com/scaling01/status/2058643470357590058?s=20

本文來自微信公眾號「新智元」，作者：ASI 啟示錄；編輯：摩西