Зростання вартості токенів AI змушує компанії зосередитися на контролі витрат

CoinDesk повідомляє:

Після масового впровадження інструментів ШІ компаніями, почали масово виявлятися нові проблеми: не в тому, що моделі недостатньо потужні, а в тому, що рахунки зростають занадто швидко. Кілька технологічних та інтернет-компаній виявили, що навіть за умови зниження ціни за окремий токен, загальний обсяг споживання швидко зростає завдяки поширенню ШІ для кодування, автоматизованих асистентів та інтелектуальних агентів.

Кілька компаній витратили бюджет раніше терміну

TechCrunch повідомляє, що деякі компанії витратили весь річний бюджет на ШІ до 2026 року. Uber використав весь річний бюджет на ШІ-кодування до квітня; Microsoft скасувала доступ до Claude Code для деяких розробників після кількох місяців відкритого доступу; працівник Priceline зазначив, що звичайна пропозиція продовження підписки на Cursor зросла в 4–5 разів.

Ці зміни пов’язані з випуском потужніших моделей протягом останніх місяців. Anthropic, OpenAI та Google після листопада минулого року поступово запустили нові моделі, краще підходящі для сценаріїв агентів, що сприяло подальшому зростанню обсягу викликів. Одна компанія навіть отримала рахунок за Claude на суму до 500 мільйонів доларів США через відсутність обмежень на використання співробітниками.

Зростання продуктивності не завжди покриває витрати

Олександр Ембр, керівник підприємницького напрямку OpenAI, зазначив, що шість місяців тому клієнти більше хвилювалися про те, чи достатньо потужні моделі, а зараз акцент змістився на видимість витрат, здатність до аудиту, контроль над токенами та ефективність моделей. Проблеми корпоративного придбання ШІ перетворюються з «що вони можуть робити» на «скільки вони витратили і чи варто це».

Щодо рентабельності інструментів AI для кодування, галузь також починає перераховувати показники. Дослідження Faros AI від березня серед 20 000 розробників показало, що продуктивність зростає, але кількість багів і необхідність повторної роботи також збільшується. Дослідження платформи управління інженерними процесами Jellyfish показало, що інженери, які активно використовують AI, мають продуктивність приблизно вдвічі вищу, ніж ті, хто використовує їх рідко, але споживають у 10 разів більше токенів.

Виробничість користувачів з високим рівнем використання ШІ приблизно вдвічі вища, ніж у користувачів з низьким рівнем використання
Відповідний токен споживає приблизно в 10 разів більше
Один розробник за 9 місяців збільшив споживання приблизно в 18,6 раза

Інструменти управління витратами швидко набирають форму

Зі збільшенням проблем з рахунками ринок інструментів для управління витратами на ШІ також розгортається. На тижні Фонд Linux оголосив про створення Tokenomics Foundation, метою якого є створення єдиної мови та стандартів управління витратами на AI Token, подібно до FinOps у сфері хмарних витрат.

Організація планує розробити відкриті стандарти використання та оплати токенів, єдині показники та нові метрики ефективності витрат, такі як «розрахунок розумної вартості на одиницю» або «кількість токенів на ват». Офіційний запуск передбачено на липень, а додаткові учасники будуть оголошені на конференції FinOps X наступного тижня.

Тим часом стартапи та зрілі виробники прискорюють свої зусилля. Компанії Pay-i, Paid та інші спеціалізуються на відстеженні, вимірюванні та оптимізації витрат на ШІ; Jellyfish, Waydev, Faros AI надають сервіси моніторингу з використанням AI-агентів; Ramp, Datadog та New Relic також розширюють функції керування витратами на ШІ, спостережуваністю на рівні токенів та моніторингом GPU.

Маршрутизація моделей стає напрямком зниження витрат

Деякі інвестори та керівники компаній вважають, що такі можливості в майбутньому частіше з’являтимуться на рівні застосунків або роутингу моделей. Наприклад, цього тижня стартап у сфері штучного інтелекту Factory запустив роутер моделей, який автоматично вибирає найбільш підходящу модель залежно від завдання, щоб знизити витрати на виклик. Деякі компанії вже застосовують подібний підхід у своїх рахунках: навіть якщо викликається високопродуктивна модель, система розподіляє частину запитів на більш дешеві моделі.

Додаткова інформація: Goldman Sachs передбачає, що до 2030 року глобальне використання токенів зросте у 24 рази. Для компаній, які вже перейшли на етап високих інвестицій, питання контролю витрат при розширенні використання ШІ стає практичною проблемою на наступному етапі розгортання.