Mensagem da ChainThink, 20 de maio: o Google lançará o novo modelo leve Gemini 3.2 Flash na conferência I/O. Segundo Bindu Reddy, CEO da Abacus.AI, o modelo alcança 92% do desempenho do GPT-5.5 em tarefas de codificação e raciocínio, com custo de inferência apenas de um quinze a vinte avos do GPT-5.5, latência de maioria das consultas abaixo de 200 milissegundos, desempenho geral equivalente ao GPT-5.5, mas claramente inferior ao Mythos da Anthropic.
Bindu Reddy, CEO da Abacus.AI, acrescentou que a técnica de destilação e esparsificação do Google compactou modelos de ponta até o nível Flash, sem apresentar o precipício de desempenho usual.
O Gemini 3.2 Flash já apresentava sinais de vazamento; no início de maio, suas marcas apareceram nos pacotes de construção do aplicativo iOS e nos metadados do AI Studio, posteriormente aparecendo anonimamente nas avaliações do LM Arena, com testadores iniciais relatando desempenho notável em tarefas de codificação criativa, com resultados em alguns benchmarks superando o Gemini 3.1 Pro.
