Google, Gemini API ücretlendirme yapısını güncelleyerek standart, esnek, öncelikli, toplu ve önbellek olmak üzere beş hizmet seviyesi tanıttı. Esnek ve toplu seviyeler, standart tarifin %50 indirimli fiyatlarıyla, gecikmeye duyarlı olmayan (1–15 dakika) ve çok büyük ölçekli veri işleme (en fazla 24 saat gecikme) senaryoları için uygun; önbellek seviyesi, token sayısı ve saklama süresine göre ücretlendirilerek yüksek frekanslı karmaşık komut çağrıları için idealdir; öncelikli seviye, %75–100 ek ücretle milisaniye ile saniye düzeyinde yanıt garantisi sunar ve müşteri hizmetleri robotları, gerçek zamanlı dolandırıcılık tespiti gibi kritik uygulamalara hizmet eder. Bu düzenleme, AI çıkarım hizmetlerinin kaynak sınıflandırma ve yönlendirme yeteneğini güçlendirerek, farklı gecikme duyarlılığı ve maliyet kısıtlamalarına sahip AI uygulamaları için daha ince ayarlı hesaplama fiyatlandırması sunar.
Yazan: AIBase
Google, Gemini API için faturalama yapısını, kullanıcıların çıkarım kullanım ihtiyaçlarını daha iyi karşılamayı amaçlayarak güncellemiştir. Bu güncelleme, standart, esnek, öncelikli, toplu ve önbellek sürümlerini içeren çeşitli yeni hizmet seviyeleri getirmiştir. Kullanıcılar, kendi gerçek ihtiyaçlarına göre en uygun seviyeyi seçebilir.
Öncelikle, standart seviye temel bir çıkarım hizmeti sunar ve kullanıcılar kullanım ihtiyaçlarına göre seçim yapabilir. Esnek seviye ise yenilikçi bir seçenektir; düşük kullanım saatlerindeki boşta kalan hesaplama kaynaklarını kullanarak kullanıcılara standart fiyatın yüzde elli indirimi sunar. Bu seviyenin hedef gecikmesi 1 ile 15 dakika arasındadır, ancak sabit bir gecikme garantisi verilmez ve zaman açısından esnek olan uygulamalar için uygundur.
Ayrıca, toplu seviyesi, büyük veri işleme ihtiyaçları olan kullanıcılar için standart ücretlerin %50 indirimini sunar ve gecikme süresi en fazla 24 saat olabilir. Bu seviye, büyük ölçekli veri işleme senaryoları için özellikle uygundur ve kullanıcılar yoğun bilgi sorgulamalarında maliyetlerini önemli ölçüde azaltabilir.
Önbellekleme seviyesinde, faturalandırma, önbelleğe alınan jeton sayısı ve depolama süresine göre yapılacaktır; bu, karmaşık komutları sıkça çağıran diyalog botları, uzun video analizleri veya büyük belge kümeleri için idealdir. Bu seviye, kullanıcıların depolama ve hesaplama kaynaklarını etkili bir şekilde yönetmesini ve sistemin verimliliğini artırmalarını sağlar.
Öncelikli kategorinin fiyatı, standart fiyattan %75 ila %100 daha yüksektir, ancak milisaniye ile saniye aralığında gecikme kontrolü sağlar. Bu kategori, müşteri hizmetleri sohbet botları, gerçek zamanlı dolandırıcılık tespiti ve kritik iş akışı akıllı asistanları gibi gerçek zamanlı tepki gerektiren uygulamalar için idealdir. Google, kullanıcıların uygulamalarının tepki hızı ve verimlilik açısından en iyi performansı elde etmeleri için öncelikli kategoriyi seçmelerini önerir.
Öne Çıkanlar:
🌟 Farklı kullanıcı ihtiyaçlarını karşılamak için Gemini API hizmet seviyeleri artırıldı.
⏳ Esnek ve toplu seviyeler, büyük ölçekli veri işleme için %50 indirim sunuyor.
⚡ Öncelikli pozisyon, milisaniye düzeyinde yanıt süresi sağlar ve gerçek zamanlı uygulamalar için uygundur.
