Một mô hình AI có trọng số mở vừa vượt qua GPT-5.5 trên các bài kiểm tra mã hóa quan trọng, với chi phí chỉ khoảng một phần sáu so với mức phí mà OpenAI tính. GLM-5.2 của Z.AI, được công bố giữa ngày 13 và 16 tháng Sáu, được thiết kế cho các tác vụ mã hóa dài và phức tạp, phân biệt rõ ràng giữa các bản demo đơn giản và các công cụ sẵn sàng cho sản xuất.
Mô hình vượt trội GPT-5.5 khoảng 1% trên FrontierSWE và đứng đầu trong tất cả các mô hình mã nguồn mở trên các bộ kiểm tra mã hóa thời gian dài. Nó cũng đạt kết quả ấn tượng trên PostTrainBench và SWE-Marathon, hai bộ kiểm tra đánh giá khả năng của mô hình trong việc xử lý các vấn đề kỹ thuật nhiều bước diễn ra qua các tương tác kéo dài.
GLM-5.2 thực sự mang lại những gì
GLM-5.2 sử dụng kiến trúc Mixture-of-Experts (MoE). Thay vì thực thi tất cả 744 đến 753 tỷ tham số cho mỗi truy vấn, nó kích hoạt khoảng 40 tỷ tham số cùng một lúc, định tuyến từng tác vụ đến các chuyên gia được trang bị tốt nhất để xử lý nó.
Cửa sổ ngữ cảnh đã tăng từ 200.000 token có sẵn trong phiên bản tiền nhiệm GLM-5.1 lên 1 triệu token. Để tham khảo, 1 triệu token tương đương với việc cung cấp toàn bộ một cơ sở mã lớn cho mô hình và yêu cầu nó suy luận về toàn bộ nội dung cùng một lúc.
Trên các tiêu chuẩn chuẩn, GLM-5.2 đạt 81.0 trên Terminal-Bench 2.1 và 62.1 trên SWE-bench Pro. Mô hình cũng hỗ trợ hai mức độ nỗ lực, được ghi nhãn “High” và “Max”, cho phép các nhà phát triển đánh đổi giữa tốc độ và hiệu suất tùy theo nhiệm vụ.
Các trọng số đầy đủ đã được triển khai trên Hugging Face dưới tên zai-org/GLM-5.2, được phát hành với giấy phép nguồn mở MIT, có nghĩa là các nhà phát triển có thể sử dụng, sửa đổi và triển khai thương mại mô hình này với gần như không có hạn chế nào.
Chiến lược lặp lại nhanh của Z.AI
Z.AI, công ty từng được biết đến với tên Zhipu AI, đã có sự bùng nổ mạnh mẽ vào đầu năm 2026. GLM-5.2 ra mắt sau GLM-5 và GLM-5.1 với chu kỳ phát hành nhanh chóng. Truy cập API và các trọng số mở hoàn toàn đã được triển khai ngay sau khi công bố lần đầu, cùng với các mức giá cụ thể dành cho các nhà phát triển ưa chuộng truy cập được lưu trữ thay vì tự chạy mô hình.
