Người dùng OpenAI báo cáo hiệu suất GPT-5.5 giảm, mô hình bị hạ cấp lặng lẽ

[Giới thiệu] GPT-5.5 bị phanh phui “giả suy nghĩ”, chỉ sau hai giờ đã bị thay thế bí mật bằng phiên bản mini, bỏ 200 USD/tháng để mua một “bộ não Schrödinger”. Lệnh Trace xác thực, tài liệu chính thức tự nhận trách nhiệm. Sau đó, hàng loạt lời phàn nàn nổ ra: OpenAI, bạn đang lừa ai vậy?

ChatGPT lại bị phanh phui “giả ngu”!

Trong hai ngày qua, 𝕏 đã nổ tung đầu tiên.

Người dùng Lisan al Gaib phát hiện, sau khi sử dụng GPT-5.5 trong một đến hai giờ, nó đột nhiên trở nên ngu ngốc, mọi yêu cầu đều phản hồi ngay lập tức, chất lượng giảm sút nghiêm trọng.

Nhưng trên giao diện, vẫn hiển thị là «GPT-5.5 Extended Thinking».

Nói cách khác, nhãn suy nghĩ vẫn còn treo, nhưng sự suy nghĩ đã biến mất.

ChatGPT

200 đô la Mỹ/tháng, mua một “mô hình Schrödinger”

Trên diễn đàn nhà phát triển của OpenAI, một bài đăng phàn nàn đã đồng thời bùng nổ.

Agentify.sh cho biết, GPT-5.5 đang sử dụng thì đột ngột mất khả năng tuân theo lệnh.

Chỉ mới thấy nó hăng hái tuyên bố “đã sửa xong”, nhưng chất lượng mã lại kém đến mức gây ra sự lùi bước rộng rãi.

Trước đây, các nhiệm vụ UI với 5.5-med có thể dễ dàng xử lý, nhưng giờ đây ngay cả những thay đổi đơn giản nhất cũng không thể thực hiện được.

Tăng lên 5.5-high, không có tác dụng. Tăng thêm lên xhigh, vẫn không được.

Và trước đây xhigh có thể chạy vài giờ, giờ rõ ràng đã rút ngắn đáng kể.

ChatGPT

Ngay khi bài đăng được đăng, phần bình luận lập tức bùng nổ.

Có người đã hoàn trả trực tiếp 5.4.

Một số người đang dùng xhigh ở cấp độ cao nhất, nhưng “so với tuần trước thì rõ ràng kém hơn, các nhiệm vụ dài thường xuyên gặp lỗi, hoàn toàn không tuân theo quy trình làm việc”.

Một số người dùng phản ánh tình huống còn nghiêm trọng hơn: “Ngay cả việc tra cứu đơn giản cũng phải chờ rất lâu; nếu bạn ngắt nó để điều chỉnh hướng đi, nó sẽ hoàn toàn bỏ qua bạn và tiếp tục theo kế hoạch sai lầm trước đó.”

Đúng vậy, tất cả mọi người đều đang mô tả cùng một hiện tượng — bộ não của GPT đã bị thay thế bí mật vào một thời điểm nào đó.

Hiện tại, hiệu suất của GPT-5.5 tương đương với 5.3, không hề phóng đại. Những ngày đầu còn khiến người ta kinh ngạc, nhưng giờ hoàn toàn không còn thấy bóng dáng của mô hình lúc trước nữa.

ChatGPT

Không phải ảo giác, OpenAI đã ghi rõ ràng bằng chữ viết trắng đen

Để xác minh, Lisan al Gaib đã thực hiện một bài kiểm tra so sánh đặc biệt.

Cùng một tài khoản, kết quả chạy bằng Extended Thinking trên ChatGPT toàn bộ là rác, nhưng chuyển sang Codex với xhigh thì lập tức trở lại bình thường.

Theo lời anh ấy, Codex “thông minh hơn thứ này tới 4 tỷ lần”.

ChatGPT

Nhà phát triển Andrew Curran đã nghĩ ra một mẹo hay – trực tiếp hỏi mô hình: “Ngày kết thúc dữ liệu huấn luyện của bạn là gì?”

Mô hình trả lời, tháng 8 năm 2025.

Vấn đề là, hạn chót của GPT-5.5 Thinking là tháng 12. Tháng 8 là hạn chót của phiên bản Instant!

Nói cách khác, anh ấy chọn Thinking, nhưng hệ thống thực tế chạy cho anh ấy là Instant.

Nhãn mô hình trên giao diện không thay đổi một chữ, nhưng mô hình phía sau đã bị thay thế bí mật...

ChatGPT

Điều hài hước là lần này, OpenAI đã tự xác nhận cho người dùng trong tài liệu trợ giúp của chính mình.

Theo thông báo chính thức từ Trung tâm Trợ giúp của OpenAI, người dùng Plus có thể gửi tối đa 160 tin nhắn GPT-5.5 mỗi 3 giờ.

Sau khi sử dụng hết, hệ thống sẽ tự động chuyển sang mô hình mini cho đến khi hạn mức được đặt lại.

ChatGPT

Lưu ý hai chữ “tĩnh lặng”.

Không có thông báo pop-up, không có thay đổi nhãn mô hình, không có phản hồi trực quan nào.

Bạn vẫn tưởng mình đang dùng mô hình cao cấp, trong khi đối phương đã lặng lẽ chuyển sang phiên bản mini.

Người dùng Pro cũng đừng vui mừng quá sớm.

Chế độ Heavy Thinking, cấp độ suy luận cao nhất chỉ dành cho Pro, cũng sẽ bị giới hạn dung lượng khi tải máy chủ cao. Cũng không có cảnh báo trước.

Nói cách khác, gói đăng ký Pro 200 USD/tháng mà bạn mua là một dịch vụ có thể bị "đánh tráo" bất cứ lúc nào.

ChatGPT

Việc thao tác “nhãn không đổi, não đã thay” này đã bị phát hiện sớm hơn trên nền tảng Codex.

Tháng Hai năm nay, trên GitHub xuất hiện một issue, một người dùng Pro đã sử dụng lệnh trace để phát hiện rằng yêu cầu của họ là GPT-5.3 Codex, nhưng mô hình thực tế trả về là GPT-5.2.

Không phải là Codex 5.2, mà là phiên bản cơ sở thấp hơn 5.2.

ChatGPT

Anh ấy đã đăng lệnh tái hiện:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
gpt-5.2-2025-12-11
Dự kiến: gpt-5.3-codex

Nhiều người dùng Pro đã xác nhận cùng một mức hạ cấp dưới cùng một issue.

Hơn nữa, sự giảm cấp này mang tính "dính", không tự phục hồi và không có bất kỳ giải thích nào.

ChatGPT

Thậm chí, vào ngày GPT-5.5 ra mắt tháng 4, một số người dùng báo cáo rằng tốc độ chế độ Fast gần như tương đương với Standard, nhưng vẫn bị tính phí theo chế độ Fast.

Nhiệm vụ đơn giản chạy mất 7 phút 49 giây, bình thường nên là 5-6 phút.

OpenAI đã thừa nhận, rồi không có gì thêm

Ngày 15 tháng 5, trang trạng thái của OpenAI xuất hiện một bản ghi.

Suy giảm hiệu suất GPT-5.5, chúng tôi đang điều tra vấn đề suy giảm hiệu suất GPT-5.5 mà một số người dùng đã phản ánh.

On May 17, the status was updated to "Solved".

Tuy nhiên, theo dòng thời gian của các bài đăng trên diễn đàn, các khiếu nại về giảm trí tuệ từ ngày 24-26 tháng 5 còn dữ dội hơn đợt vào ngày 15 tháng 5.

Vấn đề đã được “giải quyết” nay lại quay trở lại, hoặc thực ra chưa bao giờ được giải quyết.

ChatGPT

Mỗi lần nâng cấp đều là một cuộc tranh cãi "giảm trí tuệ"

Mặc dù mọi công ty đều gặp phải những lời phàn nàn về “mô hình trở nên ngu ngốc”, nhưng OpenAI chưa bao giờ bỏ lỡ bất kỳ bản cập nhật nào từ GPT-5 đến GPT-5.5.

Mỗi lần OpenAI đều nói đang điều tra, mỗi lần đều nói đã giải quyết, rồi phiên bản tiếp theo lại tiếp tục.

Tháng 8 năm 2025, GPT-5 ra mắt lần đầu. Tiêu đề bài viết nổi bật trên Reddit là “GPT-5 tệ quá”. Người dùng phàn nàn về các câu trả lời ngắn gọn, nhiều từ chối hơn và ít cảm giác cá tính hơn.

OpenAI buộc phải khôi phục tùy chọn GPT-4o khẩn cấp. Altman đã thừa nhận trực tiếp trên Reddit AMA rằng “khó khăn hơn dự kiến”.

ChatGPT

Tháng 12 năm 2025, GPT-5.2. Chất lượng dịch thuật suy giảm, bịa đặt API không tồn tại, từ chối thực hiện các lệnh phong cách mà GPT-5.1 có thể dễ dàng hoàn thành.

Tháng 2 năm 2026, GPT-5.3-Codex. Người dùng Pro bị hạ cấp lặng lẽ xuống phiên bản 5.2, lệnh trace xác nhận.

Tháng 3 năm 2026, GPT-5.4. Trên diễn đàn cộng đồng OpenAI xuất hiện bài viết “GPT-5.4 rõ ràng bị suy giảm trong Codex”, tất cả phản hồi của người dùng đều xác nhận điều này.

Đầu tháng 5 năm 2026, GPT-5.5 Instant ra mắt. Độ dài phản hồi giảm 30%, emoji gần như biến mất. Người dùng mạng tóm tắt: độ chính xác được nâng cao, nhưng nhiệt độ thì biến mất.

ChatGPT

Cuối tháng 5 năm 2026, tức là hiện tại. Các khiếu nại về chế độ Thinking bị giảm trí tuệ lại bùng phát.

Lisan al Gaib tiết lộ rằng kể từ khi ông dẫn đầu cuộc cạnh tranh giành hạn mức ChatGPT Plus khi GPT-5 ra mắt, “mỗi tuần đều nhận được những tin nhắn riêng như vậy”.

Bài mới nhất là có người yêu cầu anh ấy giúp lấy lại xhigh/heavy thinking.

ChatGPT

Ngày mạnh nhất để chạy phân là ngày ra mắt.

chatgptdisaster.com đã tổng hợp 1.087 khiếu nại của người dùng đã được xác minh, trong đó một tình huống được nhắc lại nhiều lần là “sự cố lớp định tuyến”, giao diện hiển thị GPT-5.5 Pro nhưng đầu ra hoàn toàn không tương xứng.

Người dùng mô tả một mô hình có thể lặp lại: sau các cuộc hội thoại dài, mô hình bắt đầu “hoàn toàn bỏ qua những gì bạn nói”, nhưng trên bộ chọn mô hình vẫn hiển thị nhãn cao cấp.

ChatGPT

Ghi chú hài hước nhất là cơ chế tự động chuyển sang mini sau khi người dùng Plus sử dụng hết 160 lần trong 3 giờ được mô tả trong tài liệu chính thức của OpenAI như một “tính năng”.

Tại sao lại như vậy? Phân tích của Lisan al Gaib cho rằng câu trả lời chỉ gồm hai chữ: tiết kiệm.

Sự thu hẹp của công suất tính toán và khả năng sinh lời đang ảnh hưởng đến mọi người. Hãy tiết kiệm từng đồng, không bỏ lỡ bất kỳ cơ hội nào để tiết kiệm chi phí.

ChatGPT

Tuy nhiên, ngay trong tuần cùng lúc người dùng GPT-5.5 đồng loạt khiếu nại, hình bóng của GPT-5.6 đã xuất hiện trong nhật ký nền tảng Codex.

Mã nội bộ là iris-alpha, ngữ cảnh 1,5 triệu Token, xác suất ra mắt vào tháng 6 do Polymarket đưa ra vượt quá 85%.

Một bên là 5.5 người dùng còn không giữ được trải nghiệm cơ bản, một bên là 5.6 đã âm thầm chạy lưu lượng thật ở nền sau.

Đây là cuộc thi ASI năm 2026.

Ngày càng nhanh hơn trong việc tạo mô hình mới, nhưng ngày càng khó hơn để cho các mô hình cũ hoàn thành một phiên giao dịch.

Ngày mạnh nhất để chạy phân luôn là ngày ra mắt, những ngày sau đều là GPT của Schrödinger.

ChatGPT

Tài liệu tham khảo: https://x.com/scaling01/status/2058643470357590058?s=20

Bài viết này đến từ tài khoản WeChat “New Intelligence Yuan”, tác giả: Apocalypses of ASI; biên tập: Moses