ChainThink повідомляє, що 20 травня Google представить нову легковагову модель Gemini 3.2 Flash на конференції I/O. За словами генерального директора Abacus.AI Бінду Редді, ця модель досягає 92% продуктивності GPT-5.5 у завданнях кодування та міркування, при цьому витрати на висновки становлять лише п’ятнадцять до двадцяти разів менше, а затримка більшості запитів нижча за 200 мілісекунд. Загальна продуктивність на рівні GPT-5.5, але явно нижче, ніж у Mythos від Anthropic.
Генеральний директор Abacus.AI Бінду Редді додала, що технологія дистиляції та розрідження від Google зменшила передові моделі до рівня Flash без звичайного падіння продуктивності.
Gemini 3.2 Flash раніше мав ознаки витоку: у травні його сліди з’явилися в збірках iOS-додатків та метаданих AI Studio, а потім він з’явився в оцінках LM Arena під анонімним ім’ям. Ранні тести показали, що він відмінно впорався з творчими завданнями кодування, і результати деяких тестів перевищили показники Gemini 3.1 Pro.
