ChainThink 消息,5月20日,Google 將在 I/O 大會發布新一代輕量模型 Gemini 3.2 Flash,據 Abacus.AI 執行長 Bindu Reddy 表示,該模型在編碼和推理任務上可達 GPT-5.5 的 92%,推理成本僅為後者的十五至二十分之一,多數查詢延遲低於 200 毫秒,整體性能與 GPT-5.5 同級,但明確不及 Anthropic 的 Mythos。
Abacus.AI 執行長 Bindu Reddy 補充稱,Google 的蒸餾加稀疏化技術將前沿模型壓縮至 Flash 級別,未出現通常的性能懸崖。
Gemini 3.2 Flash 此前已有洩露跡象,5 月初其痕跡出現在 iOS 應用構建包及 AI Studio 元數據中,後以匿名身份出現在 LM Arena 評測中,早期測試者反饋其在創意編碼任務表現突出,部分基準測試結果超過 Gemini 3.1 Pro。
