رسالة من BlockBeats، في 4 مارس، أطلقت جوجل النسخة التجريبية من Gemini 3.1 Flash-Lite، المُصممة كأسرع نموذج وأقل تكلفة في سلسلة Gemini 3. يستند هذا النموذج إلى بنية Gemini 3 Pro، ويستخدم تصميم الخبراء المختلطين (MoE) لتفعيل جزء فقط من المعلمات لتقليل تكلفة الاستنتاج. سعر واجهة برمجة التطبيقات هو 0.25 دولار للدخل لكل مليون رمز، و1.50 دولار للإخراج لكل مليون رمز، أي حوالي 1/8 من سعر Gemini 3.1 Pro ($2/$18).
من حيث الأداء، تم تقليل تأخير الرمز الأول بنسبة 2.5 مرة مقارنة بـ Gemini 2.5 Flash، وزيادة سرعة الإخراج بنسبة 45% لتصل إلى 363 رمزًا في الثانية. يدعم إدخالًا أقصاه 1,000,000 رمز وإخراجًا أقصاه 64,000 رمز، ويتقبل مدخلات نصية وصور وصوت وفيديو. في 11 اختبارًا داخليًا، تفوق Flash-Lite على GPT-5 mini وClaude 4.5 Haiku في 6 اختبارات، مع تحقيق 86.9% في GPQA Diamond (أسئلة علمية على مستوى الدكتوراه)، و76.8% في MMMU-Pro (الاستدلال متعدد الوسائط)، و72.0% في LiveCodeBench (توليد الكود).
يحتوي هذا النموذج على مستوى تفكير قابل للضبط، حيث يمكن للمطورين التحكم في عمق الاستدلال الخاص بالنموذج عبر AI Studio وVertex AI لتحقيق توازن بين الجودة والتكلفة في السيناريوهات عالية التردد. يتوفر الإصدار التجريبي حاليًا عبر Gemini API (Google AI Studio) وVertex AI.
