Pengguna OpenAI Melaporkan Penurunan Kinerja GPT-5.5, Model Diturunkan Secara diam-diam

【Pendahuluan】 GPT-5.5 terungkap memiliki "pemikiran palsu", diganti secara diam-diam dengan versi mini dalam dua jam, Anda membayar $200 per bulan untuk membeli "otak Schrödinger". Perintah Trace membuktikannya, dokumen resmi mengakuinya. Setelah itu, banyak yang mengeluh: OpenAI, kau mengibuli siapa?

ChatGPT kembali diketahui mengalami penurunan kecerdasan!

Dalam dua hari ini, 𝕏 langsung menjadi heboh.

Pengguna Lisan al Gaib menemukan bahwa GPT-5.5 setelah digunakan selama satu atau dua jam tiba-tiba menjadi bodoh, setiap permintaan langsung dijawab dalam hitungan detik, kualitasnya anjlok drastis.

Namun, yang ditampilkan di antarmuka tetap 「GPT-5.5 Extended Thinking」.

Artinya, label pemikiran masih tergantung, tetapi pemikirannya sendiri telah hilang.

ChatGPT

$200/bulan, membeli sebuah "model Schrödinger"

Di forum pengembang OpenAI, sebuah posting keluhan secara bersamaan menjadi viral.

Agentify.sh menyatakan bahwa GPT-5.5 tiba-tiba kehilangan kemampuan untuk mengikuti perintah saat digunakan.

Melihatnya dengan semangat mengumumkan "telah diperbaiki", ternyata kualitas kode buruk hingga menyebabkan rollback luas.

Tugas UI yang sebelumnya bisa diselesaikan dengan mudah menggunakan 5.5-med, sekarang bahkan perubahan paling sederhana pun tidak bisa diselesaikan.

Naik ke 5.5-high, tidak berguna. Naik lagi ke xhigh, tetap tidak berhasil.

Dan xhigh sebelumnya bisa berjalan selama beberapa jam, sekarang jelas lebih singkat.

ChatGPT

Setelah postingan itu muncul, kolom komentar langsung ramai.

Seseorang langsung mengembalikan 5.4.

Ada yang menggunakan xhigh level tertinggi, tetapi "jauh lebih buruk dibandingkan minggu lalu, tugas panjang sering gagal, sama sekali tidak mengikuti alur kerja".

Beberapa pengguna melaporkan kasus yang lebih parah, "Pencarian sederhana saja butuh waktu lama, saat Anda menghentikannya dan mengoreksi arah, sistem langsung mengabaikan Anda dan terus mengikuti rencana salah sebelumnya."

Benar, semua orang sedang menggambarkan fenomena yang sama—otak GPT, entah kapan, telah diganti secara diam-diam.

Kinerja GPT-5.5 saat ini hampir sama dengan 5.3, tanpa berlebihan. Beberapa hari pertama benar-benar menakjubkan, sekarang sama sekali tidak terlihat jejak model awalnya.

ChatGPT

Bukan ilusi, OpenAI sendiri menuliskannya secara jelas dan nyata

Untuk verifikasi, Lisan al Gaib melakukan pengujian perbandingan khusus.

Akun yang sama, hasil dari ChatGPT dengan Extended Thinking semuanya sampah, tapi begitu beralih ke Codex dengan xhigh, langsung kembali normal.

Dengan kata-katanya sendiri, Codex 「jauh lebih cerdas 4 miliar kali daripada hal ini».

ChatGPT

Pengembang Andrew Curran pun punya ide cerdas—langsung bertanya ke model, "Apa tanggal batas data pelatihan Anda?"

Model menjawab, Agustus 2025.

Masalahnya, batas waktu GPT-5.5 Thinking adalah Desember. Agustus adalah batas waktu versi Instant!

Artinya, ia memilih Thinking, tetapi sistem sebenarnya menjalankan Instant.

Label model di antarmuka tidak berubah sedikit pun, tetapi model di belakangnya telah diganti secara diam-diam...

ChatGPT

Yang lucu adalah, kali ini OpenAI justru memberikan bukti nyata untuk pengguna di dokumen bantuan mereka sendiri.

Menurut penjelasan resmi dari Pusat Bantuan OpenAI, pengguna Plus dapat mengirim hingga 160 pesan GPT-5.5 setiap 3 jam.

Setelah habis, sistem akan secara diam-diam beralih ke model mini hingga kuota direset.

ChatGPT

Perhatikan kata " diam ".

Tidak ada popup, tidak ada perubahan label model, tidak ada umpan balik visual apa pun.

Kamu masih mengira kamu menggunakan model unggulan, sementara lawan sudah diam-diam beralih ke versi mini.

Pengguna Pro jangan terlalu senang dulu.

Mode Heavy Thinking, tingkat inferensi tertinggi yang eksklusif untuk Pro, tetap akan mengalami pembatasan kapasitas saat beban server tinggi. Juga tanpa peringatan.

Dengan kata lain, langganan Pro senilai $200/bulan membeli layanan yang sewaktu-waktu bisa saja diganti secara licik.

ChatGPT

Operasi "label tetap, otak diganti" ini sudah lebih dulu terungkap di sisi Codex.

Pada Februari tahun ini, sebuah issue muncul di GitHub, di mana pengguna Pro menemukan melalui perintah trace bahwa permintaannya adalah GPT-5.3 Codex, tetapi model yang dikembalikan sebenarnya adalah GPT-5.2.

Bukan Codex 5.2, tetapi versi dasar yang lebih rendah, 5.2.

ChatGPT

Dia memposting perintah replikasi:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
gpt-5.2-2025-12-11
Prediksi: gpt-5.3-codex

Beberapa pengguna Pro mengonfirmasi penurunan yang sama di bawah issue yang sama.

Dan penurunan ini bersifat "melekat", tidak akan pulih sendiri, dan tidak ada penjelasan apa pun.

ChatGPT

Bahkan, pada hari peluncuran GPT-5.5 pada bulan April, beberapa pengguna melaporkan bahwa kecepatan mode Fast hampir sama dengan Standard, tetapi tetap dibebankan biaya seperti mode Fast.

Tugas sederhana berjalan selama 7 menit 49 detik, seharusnya normal 5-6 menit.

OpenAI mengakui, lalu tidak ada lagi yang terjadi

Pada 15 Mei, halaman status OpenAI menampilkan catatan.

Penurunan Kinerja GPT-5.5, kami sedang menyelidiki masalah penurunan kinerja GPT-5.5 yang dilaporkan oleh sebagian pengguna.

On May 17, the status was updated to "Solved".

Namun, berdasarkan garis waktu postingan forum, keluhan tentang penurunan kecerdasan pada 24-26 Mei lebih kuat daripada gelombang pada 15 Mei.

Masalah yang sudah "diselesaikan" kembali muncul, atau memang tidak pernah benar-benar terselesaikan.

ChatGPT

Setiap pembaruan adalah "kontroversi penurunan kecerdasan"

Meskipun semua pihak menghadapi kritik tentang "model menjadi bodoh", OpenAI tidak pernah melewatkan setiap pembaruan dari GPT-5 hingga GPT-5.5.

Setiap kali OpenAI mengatakan sedang menyelidiki, setiap kali mengatakan telah diselesaikan, lalu versi berikutnya tetap berlanjut.

Pada Agustus 2025, GPT-5 diluncurkan. Judul postingan populer di Reddit langsung berbunyi "GPT-5 sangat buruk". Pengguna mengeluh tentang respons yang singkat, lebih banyak penolakan, dan kurangnya感 kepribadian.

OpenAI dipaksa untuk segera memulihkan opsi GPT-4o. Altman secara pribadi mengakui di Reddit AMA bahwa "lebih bergelombang dari yang kami perkirakan".

ChatGPT

Desember 2025, GPT-5.2. Kualitas terjemahan menurun, menciptakan API yang tidak ada, menolak menjalankan perintah gaya yang bisa dengan mudah diselesaikan oleh 5.1.

Pada Februari 2026, GPT-5.3-Codex. Pengguna Pro secara diam-diam diturunkan ke versi 5.2, perintah trace membuktikannya.

Pada Maret 2026, GPT-5.4. Postingan "GPT-5.4 jelas mengalami penurunan di Codex" muncul di forum komunitas OpenAI, dan semua tanggapan pengguna mengonfirmasi hal ini.

Pada awal Mei 2026, GPT-5.5 Instant diluncurkan. Panjang respons berkurang 30%, emoji hampir hilang. Netizen merangkum: akurasi meningkat, tetapi suhu hilang.

ChatGPT

Akhir Mei 2026, sekarang ini. Keluhan tentang mode Thinking yang menurunkan kecerdasan kembali meledak.

Lisan al Gaib mengungkapkan bahwa sejak ia memimpin perang merebut kuota ChatGPT Plus saat peluncuran GPT-5, "setiap minggu menerima pesan pribadi semacam ini."

Postingan terbaru adalah seseorang meminta bantuannya untuk mengembalikan xhigh/heavy thinking.

ChatGPT

Hari terkuat dalam running score adalah hari peluncuran.

chatgptdisaster.com mengumpulkan 1.087 keluhan pengguna yang telah diverifikasi, di mana salah satu skenario yang sering disebut adalah "kegagalan lapisan routing", antarmuka menampilkan GPT-5.5 Pro, tetapi output sama sekali berbeda tingkatannya.

Pengguna menggambarkan pola yang dapat direproduksi, setelah sesi panjang, model mulai "benar-benar mengabaikan apa yang Anda katakan", tetapi label top tier masih terpasang di pemilih model.

ChatGPT

Catatan paling absurd adalah bahwa mekanisme beralih otomatis ke mini setelah pengguna Plus kehabisan 160 pesan/3 jam dijelaskan dalam dokumentasi resmi OpenAI sebagai sebuah "fitur".

Mengapa ini terjadi? Analisis Lisan al Gaib menyimpulkan bahwa jawabannya hanya dua kata: hemat uang.

Pengencangan daya komputasi dan profitabilitas sedang memengaruhi setiap orang. Hemat di mana-mana, jangan lewatkan peluang untuk menghemat uang.

ChatGPT

Namun, pada minggu yang sama ketika pengguna GPT-5.5 secara kolektif mengajukan keluhan, sosok GPT-5.6 sudah muncul di log latar belakang Codex.

Kode internal iris-alpha, konteks 1,5 juta Token, probabilitas peluncuran Juni yang diberikan Polymarket melebihi 85%.

Di satu sisi, pengguna 5.5 bahkan tidak bisa mempertahankan pengalaman dasar, di sisi lain, 5.6 sudah berjalan diam-diam dengan lalu lintas nyata di latar belakang.

Ini adalah kompetisi ASI tahun 2026.

Semakin cepat membuat model baru, tetapi semakin sulit membuat model lama menyelesaikan satu sesi dengan baik.

Hari terkuat dalam running score selalu hari peluncuran, dan setiap hari setelahnya adalah GPT Schrödinger.

ChatGPT

Referensi: https://x.com/scaling01/status/2058643470357590058?s=20

Artikel ini berasal dari akun WeChat "Sinzhiyuan", penulis: ASI Revelation; editor: Musa