ChainThink thông báo, vào ngày 20 tháng 5, Google sẽ ra mắt mô hình nhẹ mới nhất Gemini 3.2 Flash tại sự kiện I/O. Theo Bindu Reddy, CEO của Abacus.AI, mô hình này đạt 92% hiệu suất của GPT-5.5 trong các nhiệm vụ mã hóa và suy luận, chi phí suy luận chỉ bằng một phần mười lăm đến một phần hai mươi so với GPT-5.5, độ trễ của hầu hết các truy vấn dưới 200 miligiây, hiệu suất tổng thể tương đương GPT-5.5 nhưng rõ ràng không bằng Mythos của Anthropic.
Bindu Reddy, CEO của Abacus.AI, bổ sung rằng kỹ thuật chưng cất và thưa thớt của Google đã nén các mô hình tiên tiến xuống mức Flash mà không gây ra sự sụt giảm hiệu năng thông thường.
Gemini 3.2 Flash trước đây đã có các dấu hiệu rò rỉ, vào đầu tháng 5, dấu vết của nó xuất hiện trong gói xây dựng ứng dụng iOS và dữ liệu siêu của AI Studio, sau đó xuất hiện dưới danh tính ẩn danh trên LM Arena, các người dùng thử nghiệm sớm phản hồi rằng nó thể hiện xuất sắc trong các nhiệm vụ mã hóa sáng tạo, với một số kết quả kiểm tra chuẩn vượt trội so với Gemini 3.1 Pro.
