【導讀】GPT-5.5 被揭發「假思考」,兩小時內就被偷偷換成 mini,花 200 美元月費買了個「薛定諤的腦子」。Trace 命令實錘,官方文件親自認領。隨後紛紛遭到吐槽:OpenAI,你糊弄誰呢?
ChatGPT 再次被曝「降智」!
就在這兩天,𝕏 上率先炸鍋。
網友 Lisan al Gaib 發現,GPT-5.5 使用一兩個小時後突然變傻,每個請求都是秒回,品質斷崖式下跌。
但界面上顯示的,依然還是「GPT-5.5 Extended Thinking」。
In other words, the tag of thinking is still hanging, but thinking itself has disappeared.

每月 200 美元,買了個「薛定諤的模型」
在 OpenAI 開發者論壇上,一篇投訴帖同時爆紅。
Agentify.sh 表示,GPT-5.5 在使用過程中會突然喪失遵循指令的能力。
眼看它興沖沖地宣布「已修復」,結果代碼品質低劣,導致大範圍回退。
以前 5.5-med 就能輕鬆完成的 UI 任務,現在連最簡單的修改都搞不定。
升到 5.5-high 沒用。再升到 xhigh,還是不行。
而且 xhigh 以前能跑好幾個小時,現在明顯縮短了。

貼文一出,回覆區瞬間炸了。
有人直接退回了 5.4。
有人使用的是 Xhigh 最高檔,但「與上周相比明顯拉胯,長任務頻繁出錯,完全不遵循工作流」。
有人反映更離譜的情況:「簡單查詢也要轉很久,你打斷它糾正方向,它直接無視你,繼續按之前錯誤的計劃走」。
沒錯,所有人都在描述同一個現象——GPT 的腦子,不知道什麼時候被偷偷換掉了。
GPT-5.5 目前的表現與 5.3 差不多,毫不誇張。前幾天還驚豔不已,現在完全找不到當初那個模型的影子了。

不是錯覺,OpenAI 自己白紙黑字寫著
為進行驗證,Lisan al Gaib 專門做了一個對比測試。
同一個賬號,ChatGPT 端使用 Extended Thinking 跑出來的全是垃圾,轉頭到 Codex 端使用 xhigh,立刻恢復正常。
用他的原話說就是,Codex「簡直比這玩意兒聰明40億倍」。

開發者 Andrew Curran 則想了个妙招——直接問模型「你的訓練數據截止日期是什麼?」
2025 年 8 月
問題是,GPT-5.5 Thinking 的截止日期是 12 月。8 月,是 Instant 版本的截止日期!
也就是說,他選擇的是 Thinking,但系統實際為他執行的是 Instant。
介面上的模型標籤一個字都沒變,但背後的模型已經被偷偷換掉了……

諷刺的是,這次 OpenAI 竟然在自己的幫助文檔中為用戶提供了實證。
根據 OpenAI 幫助中心的官方說明,Plus 用戶每 3 小時最多可發送 160 條 GPT-5.5 消息。
使用完後,系統會自動切換至 mini 模型,直至配額重置。

注意「靜默」兩個字。
沒有彈窗提示,沒有模型標籤變化,沒有任何視覺反饋。
你還以為自己在用旗艦模型,對方已經悄悄換成了 mini。
專業用戶也別太高興。
Heavy 思考模式,那個 Pro 獨享的最高推理檔位,在伺服器負載高時,同樣會被容量限流。同樣沒有預警。
換句話說,每月 200 美元的 Pro 訂閱,買到的是一個隨時可能被「偷梁換柱」的服務。

而這種「標籤沒變,腦子換了」的操作,在 Codex 端更早就被人抓包了。
今年2月,GitHub 上出現了一個 issue,一名 Pro 用戶使用 trace 命令發現,自己請求的是 GPT-5.3 Codex,實際返回的模型是 GPT-5.2。
連 5.2 Codex 都不是,是更低的基礎版 5.2。

他貼出了重現命令:
- RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
- gpt-5.2-2025-12-11
- 預期:gpt-5.3-codex
多位 Pro 用戶在同一個 issue 下確認了相同的降級。
而且這種降級是「黏性的」,不會自行恢復,也沒有任何解釋。

甚至在4月GPT-5.5發布當天,仍有用戶報告Fast模式的速度與Standard差不多,但計費仍按Fast計算。
簡單任務跑了 7 分 49 秒,正常應為 5–6 分鐘。
OpenAI 承認了,然後就沒有然後了
5 月 15 日,OpenAI 的 status 頁面出現了一條記錄。
GPT5.5 性能下降,我們正在調查部分用戶反映的 GPT-5.5 性能下降問題。
May 17, status updated to "Solved".
但從論壇帖子的時間線來看,5 月 24-26 日的降智投訴比 5 月 15 日那波更猛。
問題要么重新出現,要么根本從未真正解決。

每次升級都是一次「降智爭議」
雖然各家都會遇到「模型變蠢」的吐槽,但 OpenAI 從 GPT-5 到 GPT-5.5 的每個更新,一次都沒缺席。
每次 OpenAI 都說在調查,每次都说已解決,然後下一個版本繼續。
2025年8月,GPT-5 首發。Reddit 的熱帖標題直接就是「GPT-5 太爛了」。用戶投訴短回覆、更多拒絕、更少人格感。
OpenAI 被迫緊急恢復 GPT-4o 選項。奧特曼在 Reddit AMA 上親自承認「比我們預期的顛簸」。

2025年12月,GPT-5.2。翻譯品質倒退,編造不存在的API,拒絕執行5.1能輕鬆完成的風格指令。
2026 年 2 月,GPT-5.3-Codex。Pro 用戶被靜默降級至 5.2,trace 命令實錘。
2026年3月,GPT-5.4。OpenAI 社區論壇出現「GPT-5.4 在 Codex 裡明顯退化了」帖子,網友回覆全部確認。
2026 年 5 月初,GPT-5.5 Instant 上線。回覆長度縮短 30%,emoji 幾乎消失。網友總結:精度提升了,但溫度消失了。

2026年5月下旬,也就是現在。Thinking模式的降智投訴再次爆發。
Lisan al Gaib 表示,自從 GPT-5 發布時他帶頭爭奪 ChatGPT Plus 配額後,「每週都會收到這樣的私訊」。
最新一條是有人請求他幫忙要回 xhigh/heavy thinking。

跑分最強的那天,是發佈日
chatgptdisaster.com 整理了 1087 條經過驗證的用戶投訴,其中一類被反覆提到的場景叫「路由層失靈」,UI 顯示 GPT-5.5 Pro,輸出完全是另一個檔次的東西。
用戶描述了一種可重現的模式:在長時間對話後,模型開始「完全忽視你的話」,但模型選擇器上仍標有頂級標籤。

最荒謬的註腳是,Plus 用戶在 160 條/3 小時用完後自動切換至 mini 的機制,在 OpenAI 官方文件中被描述為一項「功能」。
為什麼會這樣?Lisan al Gaib 分析認為,答案就兩個字,省錢。
算力與盈利能力的緊縮正影響著每一個人。處處精打細算,不放過任何省錢的機會。

然而,就在 GPT-5.5 用戶集體投訴的同一週,GPT-5.6 的身影已經出現在了 Codex 後台日誌裡。
內部代號 iris-alpha,150 萬 Token 上下文,Polymarket 給出的 6 月發布機率超過 85%。
一邊是 5.5 用戶連基本體驗都保不住,一邊是 5.6 已經在後台悄悄運行真實流量。
這就是2026年的ASI競賽。
建立新模型的速度越來越快,但讓舊模型完整執行一個對話卻越來越困難。
跑分最強的那一天永遠是發布日,之後每一天都是薛定諤的 GPT。

參考資料:https://x.com/scaling01/status/2058643470357590058?s=20
本文來自微信公眾號「新智元」,作者:ASI 啟示錄;編輯:摩西
