قامت جوجل مؤخرًا بتحديث هيكل التسعير لـ Gemini API، وطرح خمسة مستويات خدمة: قياسي، مرن، أولوية، دفعي، وتخزين. توفر المستويان المرن والدفعي خصمًا قدره 50٪ على السعر القياسي، ويُستخدمان على التوالي في السيناريوهات غير الحساسة للتأخير (1–15 دقيقة) ومعالجة كميات هائلة من البيانات (تأخير يصل إلى 24 ساعة)؛ ويتم تسعير مستوى التخزين بناءً على عدد الرموز ومدة التخزين، مما يجعله مناسبًا للاستدعاءات المتكررة والمعقدة؛ بينما يوفر مستوى الأولوية زيادة في التكلفة تتراوح بين 75٪ و100٪ لضمان استجابة على مقياس الملي ثانية إلى الثواني، ويُستخدم في تطبيقات حيوية مثل روبوتات خدمة العملاء وكشف الاحتيال في الوقت الفعلي. يعزز هذا التعديل قدرة النظام على توزيع الموارد بشكل مُصنّف لخدمات الاستدلال الذكي، ويوفر نموذج تسعير أكثر دقة للقوى الحسابية يتناسب مع مستويات حساسية التأخير والقيود التكلفة المختلفة للتطبيقات الذكية.
مؤلف المقال، المصدر: AIBase
قامت جوجل مؤخرًا بتحديث هيكل التسعير لـ Gemini API بهدف تلبية احتياجات المستخدمين للاستدلال بشكل أفضل. وجاء هذا التحديث مع عدة مستويات خدمة جديدة، تشمل القياسي، والمرن، والأولوية، والدُفعات، والنسخة المخزنة. يمكن للمستخدمين اختيار المستوى الأنسب وفقًا لاحتياجاتهم الفعلية.
أولاً، توفر فئة المعيار خدمات استدلال أساسية، ويمكن للمستخدمين اختيار ما يناسب استخدامهم. أما الفئة المرنة فهي خيار مبتكر يستخدم موارد قوة الحوسبة غير المستغلة خلال فترات خارج الذروة، ويوفر للمستخدمين خصمًا بنسبة 50٪ على السعر القياسي. الهدف من وقت التأخير في هذه الفئة يتراوح بين 1 إلى 15 دقيقة، لكنه لا يضمن وقت تأخير ثابت، وهو مناسب للتطبيقات التي لا تتطلب متطلبات زمنية صارمة.
بالإضافة إلى ذلك، توفر مستويات الدفع الجماعي خصمًا بنسبة 50٪ على الأسعار القياسية، وهي مناسبة للمستخدمين الذين يحتاجون إلى معالجة كميات كبيرة من البيانات، مع أقصى تأخير يصل إلى 24 ساعة. هذه المستويات مثالية لسيناريوهات معالجة البيانات الضخمة، حيث يمكن للمستخدمين تقليل التكاليف بشكل كبير عند إجراء استعلامات كثيرة للبيانات.
في مستوى التخزين المؤقت، سيتم فرض التكلفة بناءً على عدد الرموز المخزنة مؤقتًا ومدة التخزين، وهو مثالي بشكل خاص للروبوتات المحادثة التي تتطلب استدعاءات متكررة لتعليمات معقدة، أو تحليل الفيديوهات الطويلة، أو استعلامات مجموعات وثائق كبيرة. يسمح هذا المستوى للمستخدمين بإدارة موارد التخزين والحساب بكفاءة، وتحسين كفاءة تشغيل النظام.
تزيد أسعار المستوى الأولوية بنسبة 75% إلى 100% مقارنة بالسعر القياسي، لكنها تتيح التحكم في التأخير على مقياس ملي ثانية إلى ثانية. هذا المستوى مثالي للتطبيقات التي تتطلب استجابة فورية، مثل روبوتات الدردشة للخدمة العملاء، وكشف الاحتيال في الوقت الفعلي، ومساعدين ذكيين حيويين للأعمال. توصي جوجل المستخدمين الذين لديهم احتياجات من هذا القبيل باختيار مستوى الأولوية لضمان أفضل أداء من حيث سرعة الاستجابة وكفاءة تطبيقاتهم.
النقاط الرئيسية:
🌟 تم إضافة عدة مستويات خدمة Gemini API لتلبية احتياجات المستخدمين المختلفة.
⏳ توفر مستويات المرونة والكمية خصمًا بنسبة 50٪، مثالية لمعالجة كميات كبيرة من البيانات.
⚡ تأكد من مستوى الأولوية للحصول على استجابة على مستوى الملي ثانية، مناسب للتطبيقات الزمنية الحقيقية.
