Google запускає нову стратегію ціноутворення для Gemini API зі схемою рівневих послуг

iconMetaEra
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Google запускає нові ціни на API Gemini з п’ятьма рівнями: Standard, Flexible, Batch, Priority та Cache. Flexible та Batch пропонують знижку 50% для низької затримки (1–15 хв) та пакетної обробки (до 24 годин). Cache оплачується за кількість токенів та час зберігання. Priority, на 75–100% дорожчий, призначений для реального часу. Оновлення узгоджено з новими лістингами токенів та трендами інфляційних даних, що покращує планування AI-висновків для різних вимог до вартості та затримки.
Недавно Google оновила структуру ціноутворення для Gemini API, запровадивши п’ять рівнів послуг: стандартний, гнучкий, пріоритетний, пакетний та кешований. Гнучкий та пакетний рівні надають знижку 50% на стандартну тарифну ставку і призначені відповідно для сценаріїв, де не критичною є затримка (1–15 хвилин), та для обробки надвеликих об’ємів даних (затримка до 24 годин). Кешований рівень оплачується за кількість токенів та тривалість зберігання, що ідеально підходить для частих та складних викликів інструкцій. Пріоритетний рівень має надбавку 75–100%, забезпечуючи відповідь у мілісекунди до секунд, що робить його ідеальним для критичних застосунків, таких як чат-боти для служби підтримки та детекція шахрайства в реальному часі. Ця зміна підсилює здатність розподілу ресурсів для AI-виведення, надаючи більш точну модель ціноутворення для AI-застосунків з різними вимогами до затримки та обмеженнями за витратами.

Автор статті, джерело: AIBase

Google недавно оновила структуру ціноутворення для свого API Gemini, щоб краще задовольнити потреби користувачів у виведенні. Це оновлення внесло кілька нових рівнів сервісу: стандартний, гнучкий, пріоритетний, пакетний та кешований. Користувачі можуть вибрати найбільш підходящий рівень залежно від своїх реальних потреб.

Спочатку стандартний рівень надає базові сервіси висновку, і користувачі можуть вибирати залежно від своїх потреб. Гнучкий рівень — це інноваційний варіант, який використовує простою обчислювальну потужність у поза пікові години, надаючи користувачам знижку 50% на стандартну ціну. Цільовий час затримки для цього рівня становить від 1 до 15 хвилин, але фіксована затримка не гарантується, що робить його ідеальним для сценаріїв, де вимоги до часу не є критичними.

Крім того, пакетний рівень також надає користувачам знижку 50% на стандартну тарифну ставку, що ідеально підходить для користувачів, яким потрібно обробляти великий обсяг даних, з максимальною затримкою до 24 годин. Цей рівень особливо підходить для сценаріїв масштабної обробки даних, дозволяючи користувачам значно зекономити витрати під час масового запиту інформації.

Щодо кешованих рівнів, оплата здійснюється на основі кількості кешованих токенів та тривалості їх зберігання, що ідеально підходить для діалогових ботів, які часто викликають складні команди, аналізу довгих відео або запитів до великих наборів документів. Цей рівень дозволяє користувачам ефективно керувати ресурсами зберігання та обчислення, підвищуючи ефективність роботи системи.

Ціни на пріоритетний рівень на 75–100 % вищі за стандартні, але забезпечують затримку на рівні мілісекунд до секунд. Цей рівень ідеально підходить для застосунків, що вимагають миттєвої відповіді, таких як чат-боти для служби підтримки, реальний час виявлення шахрайства та критичні бізнес-асистенти. Google рекомендує користувачам, які мають такі потреби, обирати пріоритетний рівень, щоб забезпечити оптимальну швидкість та ефективність їхніх додатків.

Виділити основне:

🌟 Додано кілька рівнів сервісів Gemini API, щоб задовольнити потреби різних користувачів.

⏳ Гнучкі та пакетні рівні зі знижкою 50% ідеально підходять для обробки великих обсягів даних.

⚡ Пріоритетний рівень забезпечує відповідь у мілісекундах, ідеально підходить для реальних застосунків.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.