گوگل نے حالیہ طور پر جیمنی API کی فیس ڈھانچہ اپڈیٹ کیا ہے، جس میں معیاری، لچکدار، ترجیحی، بیچ اور کیش پانچ سطحیں شامل ہیں۔ لچکدار اور بیچ سطحیں معیاری شرح پر 50 فیصد کی چھوٹ فراہم کرتی ہیں، جو تاخیر کے لحاظ سے غیر حساس (1–15 منٹ) اور فوق العادہ بڑے پیمانے پر ڈیٹا پروسیسنگ (تاہم 24 گھنٹے تاخیر) کے مناظر کے لیے مناسب ہیں؛ کیش سطح تعداد الفاظ اور محفوظ رکھنے کے وقت کے حساب سے فیس لیتی ہے، جو اکثر اور پیچیدہ حکمات کے استعمال کے لیے موزوں ہے؛ ترجیحی سطح 75%–100% اضافی فیس کے ساتھ ملکر ملی سیکنڈ سے سیکنڈ کے اندر جواب کی ضمانت دیتی ہے، جو کسٹمر سپورٹ روبوٹس، ریل ٹائم جعلسازی کی تشخیص جیسے اہم اطلاقات کے لیے استعمال ہوتی ہے۔ اس تبدیلی نے AI استدلال خدمات کی وسائل کی درجہ بندی اور شیڈولنگ کابILITIES کو مضبوط کیا ہے، جس سے مختلف تاخیر کی حساسیت اور لاگت کے تقاضوں والے AI اطلاقات کے لیے زیادہ دقیق کمپوٹنگ قیمت ڈھانچہ فراہم ہوا ہے۔
مضمون کے مصنف، ذریعہ: AIBase
گوگل نے حالیہ طور پر اپنے جیمینی API کی بلنگ ساخت کو اپڈیٹ کیا ہے تاکہ صارفین کی استدلال کی ضروریات کو بہتر طریقے سے پورا کیا جا سکے۔ اس اپڈیٹ کے تحت متعدد نئے سروس لیولز شامل کیے گئے ہیں، جن میں معیاری، لچکدار، ترجیحی، بیچ اور کیش ورژن شامل ہیں۔ صارفین اپنی حقیقی ضروریات کے مطابق سب سے مناسب لیول منتخب کر سکتے ہیں۔
سب سے پہلے، معیاری لیول بنیادی استدلال سروس فراہم کرتا ہے، جسے صارف اپنے استعمال کے مطابق منتخب کر سکتا ہے۔ لچکدار لیول ایک نوٹیشن ہے جو غیر چوٹی کے اوقات کے غیر استعمال شدہ کمپوٹنگ وسائل کا استعمال کرتا ہے اور صارفین کو معیاری قیمت پر 50 فیصد کی چھوٹ فراہم کرتا ہے۔ اس لیول کا مقصد تاخیر 1 سے 15 منٹ کے درمیان ہے، لیکن مستقل تاخیر کی ضمانت نہیں دی جاتی، جو وقت کے لحاظ سے کم سخت شرائط والے اطلاقات کے لیے مناسب ہے۔
اس کے علاوہ، بیچ گریڈ صارفین کو معیاری شرح پر 50 فیصد کی چھوٹ فراہم کرتا ہے، جو بڑی مقدار میں ڈیٹا کے معاملات کے لیے موزوں ہے اور اس کی تاخیر 24 گھنٹے تک ہو سکتی ہے۔ یہ گریڈ بڑے پیمانے پر ڈیٹا پروسیسنگ کے مناظر کے لیے خاص طور پر موزوں ہے، جہاں صارفین بڑی مقدار میں معلومات کی تلاش کرتے وقت لاگت میں بڑی بچت کر سکتے ہیں۔
کیش اسٹیج کے لیے فیس کیش میں محفوظ ٹوکنز کی تعداد اور محفوظ رہنے کے وقت کے مطابق لی جائے گی، جو تکراری طور پر پیچیدہ کمانڈس کا استعمال کرنے والے ڈائیلاگ روبوٹس، لمبے ویڈیو تجزیہ یا بڑے دستاویزات کے مجموعوں کے لیے مثالی ہے۔ یہ اسٹیج صارفین کو ذخیرہ اور کمپوٹیشن وسائل کو مؤثر طریقے سے منظم کرنے اور سسٹم کی کارکردگی بڑھانے کی اجازت دیتا ہے۔
پریمیم لیول کی قیمت معیاری قیمت سے 75% سے 100% تک زیادہ ہوتی ہے، لیکن اس سے ملی سیکنڈ سے سیکنڈ کے اندر لیٹنسی کو کنٹرول کیا جا سکتا ہے۔ یہ لیول ایسے اطلاقات کے لیے بہت مناسب ہے جیسے کہ صارف خدمت چیٹ روبوٹس، ریل ٹائم دھوکہ ڈالنے کی تشخیص، اور اہم کاروباری انسٹیگنٹ اسسٹنٹس۔ گوگل صارفین کو اپنے اطلاقات کے لیے بہترین ریسپانس سپیڈ اور کارکردگی کے لیے پریمیم لیول کا انتخاب کرنے کی تجویز کرتا ہے۔
اہم نکات:
🌟 مختلف صارفین کی ضروریات کے مطابق جیمینی API سروس کے متعدد لیولز شامل کیے گئے۔
⏳ فلیکس اور بلک لیولز پر 50 فیصد ڈسکاؤنٹ دیا جا رہا ہے، جو بڑے پیمانے پر ڈیٹا پروسیسنگ کے لیے موزوں ہے۔
⚡ پریمیم لیول سے ملی سیکنڈ کی ریسپانس ملتی ہے، جو ریل ٹائم ایپلیکیشنز کے لیے موزوں ہے۔
