গুগল সম্প্রতি জেমিনি API-এর বিলিং কাঠামো আপডেট করে পাঁচটি সার্ভিস লেভেল—স্ট্যান্ডার্ড, ফ্লেক্সিবল, প্রায়োরিটাইজড, ব্যাচ এবং ক্যাশ—চালু করেছে। ফ্লেক্সিবল এবং ব্যাচ লেভেলগুলি স্ট্যান্ডার্ড হারের 50% ছাড় প্রদান করে, যা যথাক্রমে ল্যাটেন্সির প্রতি অসংবেদনশীল (1–15 মিনিট) এবং অতি-বৃহৎ ডেটা প্রসেসিং (24 ঘন্টা পর্যন্ত ল্যাটেন্সি) পরিস্থিতির জন্য উপযুক্ত; ক্যাশ লেভেলটি টোকেন সংখ্যা এবং সঞ্চয়ের সময়কালের উপর ভিত্তি করে বিলিং করে, যা পুনরাবৃত্তি এবং জটিল কমান্ড কলের জন্য উপযুক্ত; প্রায়োরিটাইজড লেভেলটি 75%–100% প্রিমিয়ামের সাথে মিলিসেকেন্ড থেকে সেকেন্ডের মধ্যে রিসপন্স নিশ্চিত করে, যা কাস্টমার সার্ভিস বট, রিয়েল-টাইম ফ্রড ডিটেকশনের মতো কী-কীভাবের অ্যাপ্লিকেশনগুলির জন্য। এই পরিবর্তনটি AI ইনফারেন্স সার্ভিসগুলির জন্য রিসোর্স-গ্রেডিংড স্কিডিউলিংয়ের ক্ষমতা শক্তিশালী করেছে, এবং বিভিন্ন ল্যাটেন্সি-সংবেদনশীলতা এবং খরচ-সীমা সহ AI-অ্যাপ্লিকেশনগুলির জন্য আরও সূক্ষ্মভাবে AI-কমপিউটিংয়ের মূল্যনির্ধারণের মডেল প্রদান করেছে।
লেখক এবং উৎস: AIBase
গুগল সম্প্রতি তাদের Gemini API-এর বিলিং কাঠামো আপডেট করেছে, যা ব্যবহারকারীদের ইনফারেন্স ব্যবহারের প্রয়োজনীয়তা পূরণের জন্য ডিজাইন করা হয়েছে। এই আপডেটে স্ট্যান্ডার্ড, ফ্লেক্সিবল, প্রায়োরিটি, ব্যাচ এবং ক্যাশ ভার্সনসহ বিভিন্ন নতুন সার্ভিস লেভেল যোগ করা হয়েছে। ব্যবহারকারীরা তাদের প্রকৃত প্রয়োজনীয়তা অনুযায়ী সবচেয়ে উপযুক্ত লেভেলটি বাছাই করতে পারেন।
প্রথমত, স্ট্যান্ডার্ড টিয়ার মৌলিক রিজনিং সার্ভিস প্রদান করে, যা ব্যবহারকারীরা তাদের ব্যবহারের পরিস্থিতি অনুযায়ী বেছে নিতে পারেন। ইলাস্টিক টিয়ার হল একটি নতুন বিকল্প, যা অ-শীর্ষ সময়ের অব্যবহৃত কম্পিউটিং রিসোর্সগুলির ব্যবহার করে ব্যবহারকারীদের স্ট্যান্ডার্ড মূল্যের 50% ছাড় প্রদান করে। এই টিয়ারের লক্ষ্য ল্যাটেন্সি 1 থেকে 15 মিনিটের মধ্যে, তবে এটি নির্দিষ্ট ল্যাটেন্সির গ্যারান্টি দেয় না, যা সময়ের প্রতি কম সংবেদনশীল অ্যাপ্লিকেশনগুলির জন্য উপযুক্ত।
এছাড়াও, ব্যাচ লেভেল ব্যবহারকারীদের জন্য স্ট্যান্ডার্ড ফির 50% ছাড় প্রদান করে, যা বড় পরিমাণ ডেটা প্রক্রিয়াকরণের প্রয়োজনীয়তা থাকা ব্যবহারকারীদের জন্য উপযুক্ত, যার দেরি 24 ঘন্টা পর্যন্ত হতে পারে। এই লেভেলটি বড় পরিসরের ডেটা প্রক্রিয়াকরণের পরিস্থিতিতে বিশেষভাবে উপযুক্ত, যেখানে ব্যবহারকারীরা বড় পরিমাণ তথ্য অনুসন্ধানের সময় খরচ উল্লেখযোগ্যভাবে কমাতে পারেন।
ক্যাশিং টিয়ারে, বিলিং ক্যাশেড টোকেনের সংখ্যা এবং সংরক্ষণের সময়কালের উপর ভিত্তি করে করা হবে, যা প্রায়শই জটিল নির্দেশাবলী কল করার প্রয়োজন হওয়া ডায়ালগ বট, দীর্ঘ ভিডিও বিশ্লেষণ বা বড় ডকুমেন্ট সেটের জন্য অত্যন্ত উপযুক্ত। এই টিয়ারটি ব্যবহারকারীদের সংরক্ষণ এবং কম্পিউটেশনাল সম্পদ প্রভাবীভাবে পরিচালনা করতে এবং সিস্টেমের কার্যক্ষমতা বাড়াতে সক্ষম করে।
প্রাধান্য স্তরের মূল্য স্ট্যান্ডার্ড মূল্যের চেয়ে ৭৫% থেকে ১০০% বেশি, কিন্তু মিলিসেকেন্ড থেকে সেকেন্ড স্তরে ল্যাটেন্সি নিয়ন্ত্রণ করতে পারে। এই স্তরটি রিয়েল-টাইম রিসপন্স প্রয়োজনীয় অ্যাপ্লিকেশনগুলির জন্য আদর্শ, যেমন কাস্টমার সাপোর্ট চ্যাটবট, রিয়েল-টাইম প্রতারণা শনাক্তকরণ এবং কী-বিজনেস ইনটেলিজেন্ট অ্যাসিস্ট্যান্ট। গুগল অনুরোধকারীদের তাদের অ্যাপ্লিকেশনের প্রতিক্রিয়া গতি এবং দক্ষতার সর্বোত্তম পারফরম্যান্স নিশ্চিত করতে প্রাধান্য স্তরটি বেছে নিতে পরামর্শ দেয়।
গুরুত্বপূর্ণ বিষয়গুলি:
🌟 বিভিন্ন ব্যবহারকারীর প্রয়োজন পূরণের জন্য গেমিনি API সার্ভিস লেভেলের সংখ্যা বৃদ্ধি করা হয়েছে।
⏳ ফ্লেক্সিবল এবং ব্যাচ লেভেলগুলি 50% ছাড় প্রদান করে, যা বড় পরিমাণে ডেটা প্রসেসিংয়ের জন্য উপযুক্ত।
⚡ প্রাথমিক স্তরটি মিলিসেকেন্ড লেভেলের রেসপন্স নিশ্চিত করে, যা রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য উপযুক্ত।
