BlockBeats সংবাদ, ৩ মার্চ, গুগল গেমিনি ৩.১ ফ্ল্যাশ-লাইট প্রিভিউ প্রকাশ করেছে, যা গেমিনি ৩ সিরিজের সবচেয়ে দ্রুত এবং সবচেয়ে কম খরচের মডেল হিসেবে অবস্থান করে। এই মডেলটি গেমিনি ৩ প্রো আর্কিটেকচারের উপর ভিত্তি করে তৈরি, যা মিক্সড এক্সপার্ট (MoE) ডিজাইন ব্যবহার করে, যাতে অনুমান খরচ কমানোর জন্য শুধুমাত্র কিছু প্যারামিটার সক্রিয় হয়। API-এর মূল্যনির্ধারণ: ইনপুট $0.25/মিলিয়ন টোকেন, আউটপুট $1.50/মিলিয়ন টোকেন, যা গেমিনি ৩.১ প্রো ($2/$18)-এর প্রায় 1/8।
পারফরম্যান্সের ক্ষেত্রে, জেমিনি 2.5 ফ্ল্যাশের তুলনায় প্রথম টোকেন ল্যাটেন্সি 2.5 গুণ কমেছে, আউটপুট স্পিড 45% বৃদ্ধি পেয়েছে এবং এখন প্রতি সেকেন্ডে 363 টোকেন প্রদান করে। এটি সর্বোচ্চ 100 লক্ষ টোকেন ইনপুট এবং 64,000 টোকেন আউটপুট সমর্থন করে, টেক্সট, ইমেজ, অডিও এবং ভিডিও ইনপুট গ্রহণ করে। 11টি অভ্যন্তরীণ বেঞ্চমার্কের মধ্যে, Flash-Lite GPT-5 mini এবং Claude 4.5 Haiku-এর চেয়ে 6টিতে বেশি পারফর্ম করে, GPQA Diamond (ডক্টরেট-লেভেল বিজ্ঞান প্রশ্নোত্তর) 86.9%, MMMU-Pro (মাল্টিমোডাল রিজনিং) 76.8%, LiveCodeBench (কোড জেনারেশন) 72.0%।
এই মডেলে একটি সামঞ্জস্যযোগ্য "চিন্তার স্তর" (thinking levels) অন্তর্ভুক্ত রয়েছে, যেখানে ডেভেলপাররা AI Studio এবং Vertex AI-এ মডেলের যুক্তিগত গভীরতা নিয়ন্ত্রণ করতে পারেন এবং হাই-ফ্রিকোয়েন্সি সিনেরিওতে গুণমান এবং খরচের মধ্যে ভারসাম্য বজায় রাখতে পারেন। বর্তমানে Gemini API (Google AI Studio) এবং Vertex AI-এর মাধ্যমে প্রিভিউ অ্যাক্সেস প্রদান করা হচ্ছে।
