ChainThinkのメッセージによると、5月20日、GoogleはI/Oカンファレンスで次世代軽量モデル「Gemini 3.2 Flash」を発表する予定です。Abacus.AIのCEOであるBindu Reddy氏によると、このモデルはコーディングおよび推論タスクにおいてGPT-5.5の92%の性能を達成し、推論コストはGPT-5.5の1/15~1/20に抑えられ、ほとんどのクエリのレイテンシーは200ミリ秒以下です。全体的なパフォーマンスはGPT-5.5と同等ですが、AnthropicのMythosには明確に及ばないとのことです。
Abacus.AIのCEOであるBindu Reddyは、Googleの蒸留とスパース化技術により、最先端モデルがFlashレベルに圧縮され、通常見られる性能の急激な低下が発生していないと補足した。
Gemini 3.2 Flashは以前から漏洩の兆しがあり、5月初頭にiOSアプリのビルドパッケージおよびAI Studioのメタデータにその痕跡が確認され、その後LM Arenaの評価で匿名として登場した。早期のテスト者は、創造的コーディングタスクでの性能が優れていると評価しており、一部のベンチマーク結果はGemini 3.1 Proを上回った。
