OpenAI 用戶報告 GPT-5.5 表現下降,模型被默默降級

icon MarsBit
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
OpenAI 使用者報告 GPT-5.5 性能下降,該模型被默默降級為較弱的版本。儘管介面顯示為「GPT-5.5 Extended Thinking」,實際使用的模型往往是 GPT-5.5 Instant 或迷你版本。包括 Plus 和 Pro 使用者在內的訂閱用戶面臨回應變慢和行為不一致的問題。OpenAI 已承認此問題,但尚未提供解決方案。評估 AI 工具的交易者在評估模型可靠性時,必須考慮支撐位和阻力位。不良的風險報酬比可能影響實時交易情境中的決策。

【導讀】GPT-5.5 被揭發「假思考」,兩小時內就被偷偷換成 mini,花 200 美元月費買了個「薛定諤的腦子」。Trace 命令實錘,官方文件親自認領。隨後紛紛遭到吐槽:OpenAI,你糊弄誰呢?

ChatGPT 再次被曝「降智」!

就在這兩天,𝕏 上率先炸鍋。

網友 Lisan al Gaib 發現,GPT-5.5 使用一兩個小時後突然變傻,每個請求都是秒回,品質斷崖式下跌。

但界面上顯示的,依然還是「GPT-5.5 Extended Thinking」。

In other words, the tag of thinking is still hanging, but thinking itself has disappeared.

ChatGPT

每月 200 美元,買了個「薛定諤的模型」

在 OpenAI 開發者論壇上,一篇投訴帖同時爆紅。

Agentify.sh 表示,GPT-5.5 在使用過程中會突然喪失遵循指令的能力。

眼看它興沖沖地宣布「已修復」,結果代碼品質低劣,導致大範圍回退。

以前 5.5-med 就能輕鬆完成的 UI 任務,現在連最簡單的修改都搞不定。

升到 5.5-high 沒用。再升到 xhigh,還是不行。

而且 xhigh 以前能跑好幾個小時,現在明顯縮短了。

ChatGPT

貼文一出,回覆區瞬間炸了。

有人直接退回了 5.4。

有人使用的是 Xhigh 最高檔,但「與上周相比明顯拉胯,長任務頻繁出錯,完全不遵循工作流」。

有人反映更離譜的情況:「簡單查詢也要轉很久,你打斷它糾正方向,它直接無視你,繼續按之前錯誤的計劃走」。

沒錯,所有人都在描述同一個現象——GPT 的腦子,不知道什麼時候被偷偷換掉了。

GPT-5.5 目前的表現與 5.3 差不多,毫不誇張。前幾天還驚豔不已,現在完全找不到當初那個模型的影子了。

ChatGPT

不是錯覺,OpenAI 自己白紙黑字寫著

為進行驗證,Lisan al Gaib 專門做了一個對比測試。

同一個賬號,ChatGPT 端使用 Extended Thinking 跑出來的全是垃圾,轉頭到 Codex 端使用 xhigh,立刻恢復正常。

用他的原話說就是,Codex「簡直比這玩意兒聰明40億倍」。

ChatGPT

開發者 Andrew Curran 則想了个妙招——直接問模型「你的訓練數據截止日期是什麼?」

2025 年 8 月

問題是,GPT-5.5 Thinking 的截止日期是 12 月。8 月,是 Instant 版本的截止日期!

也就是說,他選擇的是 Thinking,但系統實際為他執行的是 Instant。

介面上的模型標籤一個字都沒變,但背後的模型已經被偷偷換掉了……

ChatGPT

諷刺的是,這次 OpenAI 竟然在自己的幫助文檔中為用戶提供了實證。

根據 OpenAI 幫助中心的官方說明,Plus 用戶每 3 小時最多可發送 160 條 GPT-5.5 消息。

使用完後,系統會自動切換至 mini 模型,直至配額重置。

ChatGPT

注意「靜默」兩個字。

沒有彈窗提示,沒有模型標籤變化,沒有任何視覺反饋。

你還以為自己在用旗艦模型,對方已經悄悄換成了 mini。

專業用戶也別太高興。

Heavy 思考模式,那個 Pro 獨享的最高推理檔位,在伺服器負載高時,同樣會被容量限流。同樣沒有預警。

換句話說,每月 200 美元的 Pro 訂閱,買到的是一個隨時可能被「偷梁換柱」的服務。

ChatGPT

而這種「標籤沒變,腦子換了」的操作,在 Codex 端更早就被人抓包了。

今年2月,GitHub 上出現了一個 issue,一名 Pro 用戶使用 trace 命令發現,自己請求的是 GPT-5.3 Codex,實際返回的模型是 GPT-5.2。

連 5.2 Codex 都不是,是更低的基礎版 5.2。

ChatGPT

他貼出了重現命令:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • gpt-5.2-2025-12-11
  • 預期:gpt-5.3-codex

多位 Pro 用戶在同一個 issue 下確認了相同的降級。

而且這種降級是「黏性的」,不會自行恢復,也沒有任何解釋。

ChatGPT

甚至在4月GPT-5.5發布當天,仍有用戶報告Fast模式的速度與Standard差不多,但計費仍按Fast計算。

簡單任務跑了 7 分 49 秒,正常應為 5–6 分鐘。

OpenAI 承認了,然後就沒有然後了

5 月 15 日,OpenAI 的 status 頁面出現了一條記錄。

GPT5.5 性能下降,我們正在調查部分用戶反映的 GPT-5.5 性能下降問題。

May 17, status updated to "Solved".

但從論壇帖子的時間線來看,5 月 24-26 日的降智投訴比 5 月 15 日那波更猛。

問題要么重新出現,要么根本從未真正解決。

ChatGPT

每次升級都是一次「降智爭議」

雖然各家都會遇到「模型變蠢」的吐槽,但 OpenAI 從 GPT-5 到 GPT-5.5 的每個更新,一次都沒缺席。

每次 OpenAI 都說在調查,每次都说已解決,然後下一個版本繼續。

2025年8月,GPT-5 首發。Reddit 的熱帖標題直接就是「GPT-5 太爛了」。用戶投訴短回覆、更多拒絕、更少人格感。

OpenAI 被迫緊急恢復 GPT-4o 選項。奧特曼在 Reddit AMA 上親自承認「比我們預期的顛簸」。

ChatGPT

2025年12月,GPT-5.2。翻譯品質倒退,編造不存在的API,拒絕執行5.1能輕鬆完成的風格指令。

2026 年 2 月,GPT-5.3-Codex。Pro 用戶被靜默降級至 5.2,trace 命令實錘。

2026年3月,GPT-5.4。OpenAI 社區論壇出現「GPT-5.4 在 Codex 裡明顯退化了」帖子,網友回覆全部確認。

2026 年 5 月初,GPT-5.5 Instant 上線。回覆長度縮短 30%,emoji 幾乎消失。網友總結:精度提升了,但溫度消失了。

ChatGPT

2026年5月下旬,也就是現在。Thinking模式的降智投訴再次爆發。

Lisan al Gaib 表示,自從 GPT-5 發布時他帶頭爭奪 ChatGPT Plus 配額後,「每週都會收到這樣的私訊」。

最新一條是有人請求他幫忙要回 xhigh/heavy thinking。

ChatGPT

跑分最強的那天,是發佈日

chatgptdisaster.com 整理了 1087 條經過驗證的用戶投訴,其中一類被反覆提到的場景叫「路由層失靈」,UI 顯示 GPT-5.5 Pro,輸出完全是另一個檔次的東西。

用戶描述了一種可重現的模式:在長時間對話後,模型開始「完全忽視你的話」,但模型選擇器上仍標有頂級標籤。

ChatGPT

最荒謬的註腳是,Plus 用戶在 160 條/3 小時用完後自動切換至 mini 的機制,在 OpenAI 官方文件中被描述為一項「功能」。

為什麼會這樣?Lisan al Gaib 分析認為,答案就兩個字,省錢。

算力與盈利能力的緊縮正影響著每一個人。處處精打細算,不放過任何省錢的機會。

ChatGPT

然而,就在 GPT-5.5 用戶集體投訴的同一週,GPT-5.6 的身影已經出現在了 Codex 後台日誌裡。

內部代號 iris-alpha,150 萬 Token 上下文,Polymarket 給出的 6 月發布機率超過 85%。

一邊是 5.5 用戶連基本體驗都保不住,一邊是 5.6 已經在後台悄悄運行真實流量。

這就是2026年的ASI競賽。

建立新模型的速度越來越快,但讓舊模型完整執行一個對話卻越來越困難。

跑分最強的那一天永遠是發布日,之後每一天都是薛定諤的 GPT。

ChatGPT

參考資料:https://x.com/scaling01/status/2058643470357590058?s=20

本文來自微信公眾號「新智元」,作者:ASI 啟示錄;編輯:摩西

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露