Токены ИИ взрываются: 500 млн, 1,3 млн и 18 тыс. за одну ночь

icon MarsBit
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Новости об ИИ и криптовалюте достигли нового пика, поскольку стоимость токенов взлетела в результате недавних инцидентов. Одна компания получила счет на 500 миллионов долларов за месяц из-за ненаблюдаемого аккаунта Claude. Бюджет пользователя Google Cloud в 7 долларов вырос до 18 000 долларов после утечки ключа API. Питер Штейнбергер из OpenClaw сообщил о счете в 1,3 миллиона долларов за использование API OpenAI за 30 дней. Количество новых списаний токенов растет, но вместе с этим увеличиваются риски неконтролируемых расходов, поскольку платформы переходят на токен-ориентированную систему оплаты.

За один месяц сожжено 500 миллионов долларов счетов!

Недавно в технологической сфере произошел громкий казус. Согласно Axios, одна компания за один месяц потратила на Claude более 500 миллионов долларов!

Причина вызывает и смех, и слёзы: менеджмент забыл установить лимит использования при выдаче сотрудникам доступа к аккаунтам Claude.

GitHub

На самом деле, это не единственная компания, чей AI-счет был закрыт.

В апреле этого года пользователь Google Cloud получил счет на 18 000 долларов за одну ночь из-за того, что оставшийся в публичном сервисе API-ключ был использован в злонамеренных целях; изначальный бюджет аккаунта составлял всего 7 долларов.

GitHub

Этот неудачливый пользователь по имени Jesse Davies — австралийский консультант по ИИ и основатель Agentic Labs. Он установил две меры защиты для своей учетной записи Google Cloud: предупреждение о бюджете в 10 австралийских долларов (около 7 долларов США) и жесткий лимит расходов в 1400 долларов США.

Согласно Tom's Hardware, злоумышленник обнаружил Cloud Run-сервис, который он опубликовал несколько месяцев назад в AI Studio, и отправил более 60 000 запросов; оба уровня защиты не сработали: задержка в расчете счета привела к тому, что, когда система наконец среагировала, сумма уже достигла 18 000 долларов США.

В середине мая основатель открытого проекта OpenClaw Питер Штейнбергер опубликовал в X скриншот: счет за API OpenAI за 30 дней — 1,3 миллиона долларов.

GitHub

Его команда состоит всего из трех человек, но они управляют 100 интеллектуальными агентами Codex, работающими параллельно: за 30 дней было сожжено 60,3 миллиарда токенов и выполнено 7,6 миллиона запросов. К счастью, эти 1,3 миллиона долларов не были потрачены за его счет.

Штейнбергер присоединился к OpenAI в феврале этого года, и эти 1,3 миллиона долларов были использованы в качестве внутреннего эксперимента:

Тест, если не учитывать стоимость токенов, показывает, до каких пределов может дойти AI-программирование. Он добавил, что это результат работы Codex в «Fast Mode» (быстрый режим с тарификацией), после отключения которого стоимость составляет около 300 000 долларов США.

Ранее исполнительный технический директор Uber Правин Неппалли Нага также признал перед The Information, что компания израсходовала весь годовой бюджет на Claude Code уже в апреле, а ее главный операционный директор открыто заявил, что затраты на ИИ становятся все более «трудно оправдываемыми».

500 миллионов, 1,3 миллиона, 18 тысяч — суммы различаются на несколько порядков, но указывают на одну и ту же реальность:

В эпоху агентов потеря ключей, непрерывно работающие агенты и аккаунты без установленного лимита — любой из этих факторов может привести к тому, что ваш счет с токенами взлетит за одну ночь.

Почему счет ИИ может быть закрыт?

Ответ в основном скрыт в изменении способа начисления платы.

С апреля этого года OpenAI перешла с абонентской платы на оплату по количеству использованных токенов.

2 апреля система оплаты Codex была изменена с расчета по количеству сообщений на расчет по использованию токенов: токены ввода, кэшированного ввода и вывода учитываются отдельно. 23 апреля эта система была распространена на все тарифные планы Enterprise, Edu, Health и Gov: скрытая скидка в ежемесячной оплате была отменена.

GitHub также последовал за этим, недавно объявив: все пакеты Copilot с 1 июня 2026 года перейдут на оплату по использованию. Старая логика запросов высокого уровня отменяется, вместо нее вводятся AI-кредиты, которые начисляются на основе фактического потребления входящих токенов, исходящих токенов и кэшированных токенов с учетом тарифов API для каждой модели.

GitHub

GitHub официально объяснил причину этого:

Сейчас пользователь тратит одинаковую сумму денег на быстрый чат-запрос и на автономную задачу кодирования, длящуюся несколько часов. GitHub всё это время оплачивал расходы пользователей, выполняющих интенсивные задачи, но эта модель уже неустойчива.

До подъема AI-агентов стоимость чатов и дополнений была примерно одинаковой, и ежемесячная плата покрывала ее.

После восхождения агентов одна задача может выполняться несколько часов подряд и изменять всю кодовую базу; разница в затратах между тяжелыми и легкими пользователями может достигать нескольких порядков величины. Месячная подписка при таком разрыве полностью теряет смысл.

После объявления новости в Reddit и X последовала бурная реакция.

Разработчик с ID JBusu опубликовал скриншот счета, назвав новую цену «смехотворной». Ранее расходы составляли 28,12 доллара в месяц, а по новой системе нужно платить 746,01 доллара; он уже решил отменить подписку: «За эту цену я себе облачный сервер арендую дешевле».

GitHub

GitHub

Другой пользователь сделал скриншот с еще более впечатляющими данными: комиссия взлетела с 50 долларов до 3000 долларов. Он выразил удивление такой нереальной ценой: «Кто-нибудь еще продолжает подписку?»

GitHub

Однако некоторые давние пользователи Copilot возразили: эти экстремальные счета, скорее всего, возникли из-за того, что vibe-coders (программисты, пишущие код на интуиции) не придают значения расходованию токенов, и не отражают обычное использование.

Один из опытных пользователей оставил комментарий: «Я использую это весь день, и в конце месяца почти никогда не превышаю лимит — трудно поверить, что это разница в сложности работы». Другой пользователь выразился еще прямее: «Просто кто-то хочет полностью автоматизированный режим YOLO, чтобы ИИ работал как попало. Устранение такого рода расточительства — это благо для остальных».

Одно должно быть ясно: GitHub не отменил ежемесячную плату, базовая цена подписки не изменилась. Изменились только дополнительные объемы использования, задачи агентов и более дорогие вызовы моделей — теперь началась оплата по объему использования.

Наиболее сильно пострадали тяжелые пользователи агентов, которые использовали Copilot для выполнения длинных цепочек задач.

Рейтинг, испорченный своими же

Месячная плата ушла за пределы, с одной стороны, платформа изменила правила оплаты, с другой — те, кто использует ИИ, сами активно тратят.

В мае Business Insider сообщила, что Amazon отключила внутренний рейтинг использования ИИ под названием KiroRank.

Согласно сообщению, со ссылкой на осведомленные источники, этот рейтинг тайно породил странную форму работы: некоторые сотрудники, чтобы подняться выше в рейтинге, намеренно тратят токены на задачи, не решающие реальных проблем, исключительно ради повышения позиций.

GitHub

После того как инцидент стал известен, старший вице-президент Amazon Дэйв Тредвелл обратился ко всем с заявлением: «Не используйте ИИ ради самого ИИ. Используйте его для решения проблем клиентов, решения бизнес-задач, для инноваций».

Хотя это немного абсурдно, но не удивительно. Когда «сжигание токенов» может попасть в рейтинг, сотрудники естественно будут сжигать токены.

В Силиконовой долине этому явлению дали специальное название: Tokenmaxxing (экстремальный сжигание токенов), где объем сжигания считается показателем производительности.

В отчете Axios также упоминается, что CTO обнаружил, что сотрудники используют модели ИИ для проверки погоды и написания повседневных писем — простейшие задачи, для которых применяются самые дорогие передовые модели, из-за чего счета могут незаметно взлететь.

KiroRank не является официальной системой оценки Amazon, а представляет собой неформальный инструмент, созданный сотрудниками. Однако он ясно демонстрирует классический закон менеджмента: когда KPI установлены неверно, люди находят самый умный способ их обойти.

Считать, сколько использовано, равным тому, насколько хорошо сделано — именно это является системной причиной нынешней траты на ИИ.

Те, кто считают токены, уже зарабатывают

С другой стороны тревоги, связанной с токен-счетами, кто-то тайно превратил это в бизнес.

The first path: Feed the AI with context.

Glean — это компания, основанная Арвиндом. Она создает корпоративные AI-ассистенты, объединяющие разрозненные знания компании в единую систему, чтобы сотрудники могли напрямую получать контекст от своего AI, не тратя время на поиски. AI меньше «бродит» — и, соответственно, тратит меньше токенов.

Эта система позволила Glean увеличить годовой доход в три раза за 15 месяцев, преодолев планку в 3 миллиарда долларов, при этом клиентами стали Databricks, Reddit, Samsung.

Второй путь: распределить задачи между подходящими моделями.

Стартап по маршрутизации моделей Factory AI занимается именно этим: автоматически направляет каждую задачу на наиболее подходящую модель — простые задачи идут на более дешевые варианты, сложные — на топовые. Арвинд также отмечал: если маршрутизация выполнена правильно, можно сэкономить в 10 раз.

Оба пути ведут к одной цели: заставить ИИ работать, но не давать ему бездумно тратить ресурсы.

Исследования в академической среде также закладывают основу для этого перехода.

GitHub

https://arxiv.org/pdf/2604.22750

Статья на arXiv от апреля 2026 года впервые систематически разобрала, как именно расходуются деньги при задачах кодирования агентов.

Вывод 1: Потребление токенов для задач агента может достигать тысяч раз больше, чем для обычного кодового вывода и кодового диалога; основной причиной роста затрат являются входные токены.

Вывод 2: При многократном выполнении одной и той же задачи расход токенов может отличаться в 30 раз.

Вывод 3: Более высокое потребление токенов не обязательно приводит к более высокой точности. Точность часто достигает пика при умеренных затратах — дальнейшее увеличение расходов не дает прироста эффективности.

Статья также обнаружила, что передовые модели не могут даже предсказать, сколько токенов они потратят, и обычно недооценивают реальные затраты.

Вы думаете, что чем больше денег потратите, тем больше дел успеете. На самом деле, деньги потрачены, а работа не обязательно стала лучше, и бюджет всё равно не удаётся точно спланировать.

Когда счета за ИИ начинают превышать затраты на персонал

Это первый раз в моей памяти, когда технологические затраты начали сравняться с затратами на персонал.

29 мая Глен CEO Арвинд Джайн заявил в интервью журналисту CNBC Дердре Босе.

GitHub

Наблюдения Брайана Катанзаро, вице-президента по глубокому обучению NVIDIA, также подтверждают это.

Он упомянул в интервью Axios: для его команды стоимость вычислительных мощностей уже значительно превысила зарплаты сотрудников.

Похожие явления возникают у нескольких компаний: от Glean, занимающейся корпоративным ИИ, до NVIDIA, продающей вычислительные мощности ИИ, и до Uber, использующей ИИ, — все они пересматривают эти расчеты.

По мнению Арвинда, ранее технологии составляли лишь небольшую часть общих расходов компании, но сейчас затраты на ИИ достигли уровня зарплатной ведомости, и многие компании тратят свой годовой бюджет на ИИ за один-два месяца.

GitHub

За последний год использование ИИ было показателем, вызывавшим восхищение: чем больше используется, тем более передовое, чем больше токенов сжигается, тем больше вера в будущее. Сейчас многие компании начинают переосмысливать простую фразу: что же на самом деле было получено за эти сожженные токены?

Период бесплатного месячного доступа как раз закрывается сейчас.

Далее перед всеми разработчиками встаёт вопрос: как рационально использовать каждый токен, чтобы извлечь из него максимальную ценность.

Без сомнения, настоящими победителями в будущем станут те, кто первым научится вести учет токенов.

Справочные материалы:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Эта статья взята из официального аккаунта WeChat «Новознание», автор: АСИ, Откровение

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.