Pesan dari ChainThink, pada 20 Mei, Google akan meluncurkan model ringan generasi baru Gemini 3.2 Flash di konferensi I/O, menurut Bindu Reddy, CEO Abacus.AI, model ini mencapai 92% kinerja GPT-5.5 dalam tugas pemrograman dan penalaran, dengan biaya penalaran hanya sepuluh hingga dua puluh kali lebih rendah, latensi sebagian besar permintaan di bawah 200 milidetik, kinerja keseluruhan setara dengan GPT-5.5, tetapi jelas tidak sebanding dengan Mythos dari Anthropic.
Bindu Reddy, CEO Abacus.AI, menambahkan bahwa teknik distilasi dan sparsifikasi Google telah mengompresi model mutakhir hingga level Flash tanpa mengalami penurunan kinerja yang biasa terjadi.
Gemini 3.2 Flash sebelumnya telah menunjukkan tanda-tanda kebocoran; pada awal Mei, jejaknya muncul di paket build aplikasi iOS dan metadata AI Studio, kemudian muncul secara anonim dalam evaluasi LM Arena, dengan umpan balik dari pengujian awal yang menyatakan kinerjanya unggul dalam tugas pemrograman kreatif, dan hasil sebagian tes benchmark melebihi Gemini 3.1 Pro.
