Недавно Google оновила структуру ціноутворення для Gemini API, запровадивши п’ять рівнів послуг: стандартний, гнучкий, пріоритетний, пакетний та кешований. Гнучкий та пакетний рівні надають знижку 50% на стандартну тарифну ставку і призначені відповідно для сценаріїв, де не критичною є затримка (1–15 хвилин), та для обробки надвеликих об’ємів даних (затримка до 24 годин). Кешований рівень оплачується за кількість токенів та тривалість зберігання, що ідеально підходить для частих та складних викликів інструкцій. Пріоритетний рівень має надбавку 75–100%, забезпечуючи відповідь у мілісекунди до секунд, що робить його ідеальним для критичних застосунків, таких як чат-боти для служби підтримки та детекція шахрайства в реальному часі. Ця зміна підсилює здатність розподілу ресурсів для AI-виведення, надаючи більш точну модель ціноутворення для AI-застосунків з різними вимогами до затримки та обмеженнями за витратами.
Автор статті, джерело: AIBase
Google недавно оновила структуру ціноутворення для свого API Gemini, щоб краще задовольнити потреби користувачів у виведенні. Це оновлення внесло кілька нових рівнів сервісу: стандартний, гнучкий, пріоритетний, пакетний та кешований. Користувачі можуть вибрати найбільш підходящий рівень залежно від своїх реальних потреб.
Спочатку стандартний рівень надає базові сервіси висновку, і користувачі можуть вибирати залежно від своїх потреб. Гнучкий рівень — це інноваційний варіант, який використовує простою обчислювальну потужність у поза пікові години, надаючи користувачам знижку 50% на стандартну ціну. Цільовий час затримки для цього рівня становить від 1 до 15 хвилин, але фіксована затримка не гарантується, що робить його ідеальним для сценаріїв, де вимоги до часу не є критичними.
Крім того, пакетний рівень також надає користувачам знижку 50% на стандартну тарифну ставку, що ідеально підходить для користувачів, яким потрібно обробляти великий обсяг даних, з максимальною затримкою до 24 годин. Цей рівень особливо підходить для сценаріїв масштабної обробки даних, дозволяючи користувачам значно зекономити витрати під час масового запиту інформації.
Щодо кешованих рівнів, оплата здійснюється на основі кількості кешованих токенів та тривалості їх зберігання, що ідеально підходить для діалогових ботів, які часто викликають складні команди, аналізу довгих відео або запитів до великих наборів документів. Цей рівень дозволяє користувачам ефективно керувати ресурсами зберігання та обчислення, підвищуючи ефективність роботи системи.
Ціни на пріоритетний рівень на 75–100 % вищі за стандартні, але забезпечують затримку на рівні мілісекунд до секунд. Цей рівень ідеально підходить для застосунків, що вимагають миттєвої відповіді, таких як чат-боти для служби підтримки, реальний час виявлення шахрайства та критичні бізнес-асистенти. Google рекомендує користувачам, які мають такі потреби, обирати пріоритетний рівень, щоб забезпечити оптимальну швидкість та ефективність їхніх додатків.
Виділити основне:
🌟 Додано кілька рівнів сервісів Gemini API, щоб задовольнити потреби різних користувачів.
⏳ Гнучкі та пакетні рівні зі знижкою 50% ідеально підходять для обробки великих обсягів даних.
⚡ Пріоритетний рівень забезпечує відповідь у мілісекундах, ідеально підходить для реальних застосунків.
