ChainThink сообщает, 20 мая Google представит на конференции I/O новую легковесную модель Gemini 3.2 Flash. По словам генерального директора Abacus.AI Бинду Редди, эта модель достигает 92% производительности GPT-5.5 в задачах программирования и рассуждения, при этом стоимость рассуждения составляет лишь одну пятнадцатую до одной двадцатой от стоимости GPT-5.5, задержка большинства запросов ниже 200 миллисекунд, общая производительность сопоставима с GPT-5.5, но явно уступает Mythos от Anthropic.
Bindu Reddy, CEO Abacus.AI, добавила, что технология дистилляции и разреживания Google сжала передовые модели до уровня Flash без типичного падения производительности.
Ранее были признаки утечки Gemini 3.2 Flash: в начале мая его следы появились в сборках iOS-приложений и метаданных AI Studio, а затем он появился в оценках LM Arena под анонимным именем. Ранние тестировщики отметили его выдающиеся результаты в творческих задачах программирования, некоторые результаты на базовых тестах превзошли Gemini 3.1 Pro.
