OpenAIユーザー、GPT-5.5のパフォーマンス低下を報告、モデルが静かに降格される

【導読】GPT-5.5が「偽思考」であることが暴露され、わずか2時間でminiに置き換えられた。200ドルの月額料金で「シュレーディンガーの脳」を購入した形に。Traceコマンドで実証され、公式ドキュメントが自ら認めた。その後、次々と批判が噴出：OpenAI、誰をだましているの？

ChatGPTがまた「頭が悪くなった」と話題に！

この2日間で、𝕏上でまず大騒ぎになった。

ユーザーLisan al Gaibは、GPT-5.5を1〜2時間使用した後、突然性能が低下し、すべてのリクエストに即座に返信するようになったが、質が急激に低下したことを発見した。

しかし、画面に表示されているのは依然として「GPT-5.5 Extended Thinking」です。

つまり、思考のタグはまだ付いたままだが、思考そのものはすでに消えている。

ChatGPT

月額200ドルで「シュレーディンガーのモデル」を購入

OpenAI開発者フォーラムで、不満の投稿が同時に拡散した。

Agentify.shは、GPT-5.5を使用していると、突然指示に従う能力を失うと述べています。

「修復された」と喜々として発表したものの、コードの品質が悪く、広範囲なバックラッシュを引き起こした。

以前5.5-medで簡単にこなせていたUIタスクが、今では最も簡単な変更さえできなくなっている。

5.5-highまで上げても意味がない。xhighまで上げても、まだだめだ。

かつてxhighは数時間走れていましたが、今は明らかに短くなりました。

ChatGPT

投稿が掲載されると、コメント欄が一瞬で盛り上がった。

誰かが直接5.4を返金しました。

誰かがXHighの最高ランクを使用していますが、「先週と比べて明らかに劣化し、長期タスクで頻繁にエラーが発生し、ワークフローをまったく無視しています」。

一部のユーザーから、より極端な状況が報告されています。「簡単な照会でも長時間待たされ、方向を修正しようと中断しても、システムは無視して以前の誤った計画をそのまま継続します。」

没错、すべての人が同じ現象を描述している——GPTの脳が、いつの間にか勝手に取り替えられてしまった。

GPT-5.5の現在のパフォーマンスは5.3とほぼ同じです、冗談ではなく。最初の数日は驚異的でしたが、今では当初のモデルの影も見当たりません。

ChatGPT

錯覚ではない、OpenAIが自ら白紙黒字で記している

検証のために、Lisan al Gaibは特別に比較テストを実施しました。

同じアカウントで、ChatGPT側でExtended Thinkingを使用するとすべてゴミが出るが、Codex側でxhighを使用するとすぐに正常に戻る。

彼の言葉を借りれば、Codexは「このものより40億倍賢い」。

ChatGPT

開発者のアンドリュー・カーランは、モデルに「あなたのトレーニングデータの最終日付はいつですか？」と直接尋ねるという妙案を考えました。

モデルの回答、2025年8月。

問題は、GPT-5.5 Thinkingの締め切りが12月であることですが、8月はInstantバージョンの締め切りです！

つまり、彼が選んだのはThinkingですが、システムが実際に実行したのはInstantです。

インターフェース上のモデルラベルは一字も変わっていないが、裏ではモデルが勝手に変更されていた……

ChatGPT

面白いことに、今回はOpenAIが自らのヘルプドキュメントでユーザーを実証してしまった。

OpenAIヘルプセンターの公式説明によると、Plusユーザーは3時間あたり最大160件のGPT-5.5メッセージを送信できます。

使用完了後、システムは自動的にminiモデルに切り替わり、クォータがリセットされるまでその状態が続きます。

ChatGPT

「静默」の二字にご注意ください。

ポップアップ通知なし、モデルラベルの変化なし、任何のビジュアルフィードバックなし。

あなたはまだフラッグシップモデルを使っていると思い込んでいるが、相手はすでにミニに切り替えている。

Proユーザーも油断しないでください。

Heavy思考モード、Pro限定の最高推論レベルは、サーバー負荷が高くなった場合も容量制限の対象となります。同様に警告は発せられません。

言い換えれば、月額200ドルのProサブスクリプションは、いつでも「すり替えられる」可能性のあるサービスを購入することになります。

ChatGPT

この「ラベルはそのままで、脳が変わった」という操作は、Codex側ではより早く発覚されていた。

今年2月、GitHub上に1つのイシューが投稿され、Proユーザーがtraceコマンドを使用して、自身が要求したモデルがGPT-5.3 Codexであるにもかかわらず、実際にはGPT-5.2が返却されたことを確認しました。

5.2 Codexではなく、より低い基本版5.2です。

ChatGPT

彼は再現コマンドを掲載しました：

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
gpt-5.2-2025-12-11
予想：gpt-5.3-codex

複数のProユーザーが同じイシューの下で同じ降格を確認しました。

そしてこの降格は「粘着性」であり、自動的に回復することもなく、任何の説明もありません。

ChatGPT

さらに、4月にGPT-5.5がリリースされた当日、ユーザーの中にはFastモードの速度がStandardとほぼ同じだが、課金はFastモードで行われたと報告した人もいました。

簡単なタスクが7分49秒かかりました。通常は5〜6分です。

OpenAIは認めたが、その後は何もなかった

5月15日、OpenAIのステータスページに1つの記録が表示されました。

GPT5.5のパフォーマンス低下について、一部のユーザーから報告されているGPT-5.5のパフォーマンス低下の問題を調査中です。

5月17日、ステータスが「解決済み」に更新されました。

しかし、フォーラムの投稿のタイムラインを見ると、5月24〜26日の馬鹿げた苦情は、5月15日のものよりもさらに激しかった。

解決されたはずの問題が再び現れたか、あるいは全く解決されていなかった。

ChatGPT

毎回のアップグレードは「知能低下の議論」になる

各社が「モデルが馬鹿になる」という批判に直面する中、OpenAIはGPT-5からGPT-5.5までのすべての更新に一度も欠かしていない。

毎回OpenAIは調査中だと述べ、次に解決したと発表するが、次のバージョンではまた同じ問題が続く。

2025年8月、GPT-5がリリース。Redditのホット投稿のタイトルはそのまま「GPT-5はひどい」だった。ユーザーは短い返答、拒否の増加、人格性の低下を不満に挙げた。

OpenAIはGPT-4oオプションを緊急に復元せざるを得なくなった。オットマンはRedditのAMAで「予想以上に不安定だった」と自ら認めた。

ChatGPT

2025年12月、GPT-5.2。翻訳品質の低下、存在しないAPIの捏造、5.1が簡単に実行できたスタイル指示の拒否。

2026年2月、GPT-5.3-Codex。Proユーザーが静かに5.2に降格され、traceコマンドで確認された。

2026年3月、GPT-5.4。OpenAIコミュニティフォーラムに「GPT-5.4はCodexで明らかに退化している」という投稿が現れ、投稿への返信はすべてその確認を示した。

2026年5月初、GPT-5.5 Instantがリリース。返信の長さが30%短縮され、絵文字はほぼ消えた。ネットユーザーのまとめ：精度は向上したが、温度が失われた。

ChatGPT

2026年5月下旬、現在。Thinkingモードのバカにされるという苦情が再び噴出している。

Lisan al Gaibは、GPT-5のリリース時に彼が先頭に立ってChatGPT Plusのクォータ争いを仕掛けた以来、「毎週このようなDMが届く」と明かした。

最新の投稿は、誰かがxhigh/heavy thinkingを取り戻すよう彼に助けを求めていることだ。

ChatGPT

最も跑分が強い日はリリース日です。

chatgptdisaster.comは1,087件の検証済みユーザーの苦情を整理し、そのうち繰り返し言及されたシナリオの一つに「ルーティング層の不具合」があり、UIにはGPT-5.5 Proと表示されるが、出力はまったく別のレベルのものである。

ユーザーは、長時間の会話の後、モデルが「あなたの言葉を完全に無視し始める」再現可能なパターンを説明しましたが、モデルセレクターにはトップパフォーマンスのラベルが付いたままです。

ChatGPT

最も馬鹿げた注釈は、Plusユーザーが3時間で160件の使用上限に達した後、自動的にminiに切り替わる仕組みが、OpenAIの公式ドキュメントで「機能」として記述されていることである。

なぜこうなるのか？Lisan al Gaibの分析によると、答えはたった二つの文字、「節約」である。

採掘パワーと収益性の縮小が、すべての人に影響を及ぼしています。あらゆる場面で節約を心がけ、節約できる機会を逃さないでください。

ChatGPT

しかし、GPT-5.5のユーザーが一斉に苦情を申し立てたのと同じ週、GPT-5.6の姿がCodexのバックエンドログに現れていた。

内部コードはiris-alpha、150万トークンのコンテキスト、Polymarketが示す6月リリース確率は85％以上。

一方では5.5ユーザーが基本的な体験さえ保てない一方で、5.6は既にバックグラウンドで実際のトラフィックを走らせている。

これが2026年のASIコンテストです。

新しいモデルの構築速度はますます速くなっているが、古いモデルを1つの会話で完璧に動作させるのはますます難しくなっている。

最も強力なランニングの日は常にリリース日であり、その後の毎日はシュレーディンガーのGPTである。

ChatGPT

参考資料：https://x.com/scaling01/status/2058643470357590058?s=20

本文は微信公众号「新智元」より、著者：ASI启示録；編集：モーセ