После масштабного внедрения ИИ-инструментов компаниями начали массово проявляться новые проблемы: проблема не в недостаточной мощности моделей, а в слишком быстром росте счетов. Несколько технологических и интернет-компаний обнаружили, что, несмотря на снижение цены за отдельный токен, общий объем потребления продолжает быстро расти из-за распространения ИИ-кодирования, автоматизированных помощников и инструментов агентов.
Несколько компаний превысили свои бюджеты заранее
TechCrunch сообщает, что некоторые компании уже исчерпали свои AI-бюджеты на 2026 год задолго до конца года. Uber израсходовал весь годовой бюджет на AI-кодирование уже к апрелю; Microsoft отозвала у部分 разработчиков доступ к Claude Code спустя несколько месяцев после открытия; сотрудник Priceline заявил, что обычное предложение по продлению подписки на Cursor стало в 4–5 раз дороже.
Эти изменения связаны с выпуском более мощных моделей в последние месяцы. Anthropic, OpenAI и Google после ноября прошлого года последовательно запустили новые модели, лучше подходящие для сценариев с агентами, что способствовало дальнейшему росту объема запросов. Одна компания даже получила счет за использование Claude на сумму до 500 миллионов долларов из-за отсутствия ограничений на использование сотрудниками.
Рост производительности не всегда покрывает затраты
Alexander Embr, руководитель корпоративного бизнеса OpenAI, отметил, что полгода назад клиенты больше беспокоились о том, достаточно ли мощны модели, а теперь фокус перешел на видимость расходов, возможность аудита, контроль над токенами и эффективность моделей. Вопросы корпоративного приобретения ИИ переходят от «что они могут делать» к «сколько они стоят и оправданы ли расходы».
Относительно рентабельности инструментов AI для программирования отрасль也开始 пересчитывать. Исследование Faros AI от марта, охватившее 20 000 разработчиков, показало, что производительность растет, но количество ошибок и переделок также увеличивается. Исследование платформы управления инженерными процессами Jellyfish показало, что производительность инженеров, активно использующих AI, примерно в два раза выше, чем у мало использующих, но потребление токенов в десять раз выше.
- Производительность интенсивных пользователей ИИ примерно в два раза выше, чем у мало использующих
- Соответствующий токен потребляет примерно в 10 раз больше
- За 9 месяцев потребление одним разработчиком увеличилось примерно в 18,6 раза
Инструменты управления затратами стремительно формируются
По мере расширения проблем с счетами, рынок инструментов для управления расходами на ИИ также начинает активизироваться. На этой неделе Фонд Linux объявил о создании Tokenomics Foundation с целью разработать единый язык и стандарты управления расходами на AI-токены, подобно тому, как FinOps работает в области управления облачными расходами.
Организация планирует разработать открытые стандарты для использования и начисления токенов, единые метрики и новые показатели эффективности затрат, такие как «умный токен на единицу» или «токен на ватт». Официальный запуск запланирован на июль, а дополнительные участники будут объявлены на конференции FinOps X на следующей неделе.
В то же время стартапы и зрелые производители ускоряют свои усилия. Компании Pay-i, Paid и другие фокусируются на отслеживании, измерении и оптимизации затрат на ИИ; Jellyfish, Waydev и Faros AI предлагают услуги мониторинга с использованием ИИ-агентов; Ramp, Datadog и New Relic также расширяют функции управления расходами на ИИ, наблюдаемостью на уровне токенов и мониторингом GPU.
Маршрутизация моделей становится направлением снижения затрат
Некоторые инвесторы и корпоративные руководители считают, что подобные возможности в будущем будут чаще встречаться на уровне приложений или на уровне маршрутизации моделей. Например, на этой неделе стартап в области ИИ Factory выпустил маршрутизатор моделей, который автоматически выбирает наиболее подходящую модель в зависимости от задачи, чтобы снизить стоимость вызовов. Некоторые компании уже применяют подобные подходы в своих счетах: даже при вызове высококлассных моделей система распределяет часть запросов на более дешевые модели для обработки.
Дополнительная информация: Goldman Sachs прогнозирует, что к 2030 году глобальное использование токенов вырастет в 24 раза. Для компаний, уже находящихся на этапе высоких инвестиций, управление затратами при масштабировании использования ИИ становится актуальной задачей следующего этапа внедрения.
