Облака-гиганты переходят на модель PTU на фоне роста стоимости токенов ИИ

Весной 2026 года отчетный сезон североамериканских гигантов облачных вычислений превратился в общий «день страданий».

Квартальная выручка подразделения Microsoft Cloud впервые превысила 50 миллиардов долларов, Azure вырос на 39% год к году, но после публикации отчета акции упали почти на 10%; выручка AWS Amazon достигла самого высокого темпа роста за 13 кварталов, а на следующий день акции упали на 11%; выручка Google Cloud выросла на 48%, но акции все равно сменили рост на падение после закрытия торгов.

Причина только одна: деньги. Или же безудержные счета за ИИ.

При анализе отчетов крупнейших компаний становится ясно, что Microsoft потратила 37,5 млрд долларов США на капитальные расходы за квартал, что на 66% больше по сравнению с прошлым годом. Хотя компания не предоставила прогноз на весь год, аналитики отмечают, что при сохранении текущего темпа капитальных расходов годовые затраты превысят уровень в 100 млрд долларов США. Amazon объявила о планах потратить 200 млрд долларов США в 2026 году, а Google планирует инвестировать от 175 до 185 млрд долларов США — почти в два раза больше, чем в 2025 году.

Три крупнейших игрока в совокупности потратили более 500 миллиардов долларов, что эквивалентно ВВП Норвегии за весь 2024 год.

Что беспокоит рынок капитала? Недостаточный рост облачного бизнеса? Очевидно, нет. Чем больше крупные клиенты используют облачные сервисы, тем выше вероятность «взрыва» счетов облачных провайдеров. В тихой Силиконовой долине разворачивается скрытая битва за то, как взимать плату. Исход этой битвы переформатирует распределение стоимости在整个 AI-индустрии.

01 Начинает ли режим Token наказывать глубоких пользователей?

Одним из неоспоримых фактов является то, что модель оплаты токенами стала одним из главных драйверов распространения ИИ.

В начале 2024 года среднесуточный объем запросов токенов в Китае составлял 100 миллиардов; к концу 2025 года он вырос до 100 триллионов; в марте этого года он превысил 140 триллионов, увеличившись более чем в тысячу раз за два года.

В то же время, с ростом популярности «ракообразных», ИИ превратился из «игрушки» в «производственный инструмент», и недостатки модели токенов начали проявляться.

На примере AI-агентов: традиционный чат-бот тратит от нескольких сотен до нескольких тысяч токенов на ответ на один вопрос. Однако AI-агент, способный самостоятельно выполнять задачи, требует множества этапов рассуждения, многократного вызова инструментов и чтения большого объема контекста. Специалисты отрасли подсчитали, что потребление токенов агентами может увеличиваться в десятки раз, а для сложных задач — в сотни и даже тысячи раз по сравнению с обычным диалогом.

В марте 2026 года OpenAI закрыла инструмент генерации видео Sora, одной из причин чего стала нерентабельность. По данным аналитической компании SemiAnalysis, цитируемым газетой «Синьцзиньбао», ежедневные операционные расходы Sora составляли около 15 миллионов долларов США, а годовые —高达 5,4 миллиарда долларов США.

Руководитель проекта OpenAI прямо заявил: «Текущая экономическая модель полностью неустойчива». Вычислительные ресурсы, потребляемые генерацией видео, намного превышают те, что требуются для генерации текста и изображений: ресурсы GPU, необходимые для одной генерации видео, достаточно для ответа ChatGPT на десятки вопросов, что серьезно сокращает ресурсы для основных бизнес-направлений.

В режиме токенов чем больше вы используете ИИ, тем больше расходы выходят из-под контроля. Генеральный директор NVIDIA Хуань Ренсюнь даже сказал, что в будущем у каждого инженера NVIDIA будет «годовой бюджет токенов», и если высокопрофессиональный инженер не потратит много токенов за год, это будет выглядеть странно.

Когда отрасль доходит до этапа «чем больше использования, тем больше страха», это говорит о фундаментальной проблеме модели ценообразования.

Чем больше вы используете, тем больше я зарабатываю — звучит отлично. Но крупные клиенты сталкиваются с огромными колебаниями в счетах за ИИ, и CFO не осмеливаются утверждать бюджет на масштабирование. Модель токенов наказывает тех, кого следует больше всего удерживать — ведущих клиентов с наибольшим объемом использования и наиболее глубокими сценариями. Это противоречит долгосрочным интересам облачных провайдеров по расширению рынка.

На этом фоне североамериканские облачные провайдеры внедрили новый инструмент, называемый PTU: предварительно выделенная единица пропускной способности.

Проще говоря, клиент заранее покупает определенный объем вычислительной мощности и платит фиксированную ежемесячную, ежеквартальную или ежегодную плату, независимо от фактического потребления токенов. Модель токенов — «плати за то, что съел», а PTU — «все включено по абонементу». Клиент получает предсказуемость затрат, а облачный провайдер — фиксацию клиентских отношений.

Логика игры за этим полностью изменилась.

В режиме токена стороны находятся в состоянии «игры с нулевой суммой»: когда клиент экономит, облако зарабатывает меньше, а когда клиент тратит больше, облако зарабатывает больше. Однако крупные клиенты, опасаясь потери контроля над расходами, сокращают объемы использования, что приводит к тому, что доходы облака не достигают ожидаемого уровня.

В режиме PTU игра превращается в «положительную сумму»: после фиксации бюджета клиенты смело увеличивают объем использования ИИ, а доходы облачных провайдеров становятся более устойчивыми. Суть заключается в переносе риска со стороны клиента на сторону облачного провайдера в обмен на глубокую привязку клиентов.

Guoxin Securities compared the evolution of mobile internet pricing in China.

В эпоху 2G трафик оплачивался за КБ по ставке 0,01 юаня/КБ, и пользователи чувствовали, будто платят кровью за использование трафика. В эпоху 3G тарифы перешли на оплату за МБ — 150 юаней за 3 ГБ, и пользователи начали свободнее расходовать трафик. В эпоху 4G инициатива «ускорение и снижение тарифов» привела к массовому распространению безлимитных тарифных планов, таких как «Карта Дао» от Tencent в 2016 году за 19 юаней в месяц с бесплатным трафиком для приложений Tencent, и пользователи полностью перешли от «покупки трафика» к «покупке сервиса». В эпоху 5G тарификация далее эволюционировала в «классификацию по скорости», и объем трафика больше не является основным фактором ценообразования.

Каждая смена модели ценообразования — это перераспределение влияния в цепочке создания стоимости. Операторы отказались от прибыльной модели взимания платы за КБ, в обмен на то, что среднемесячный трафик пользователей вырос с 30 МБ до более чем 10 ГБ, а общий объем рынка увеличился в сотни раз.

Выбор облачных провайдеров сегодня точно такой же, как у операторов в прошлом. Они готовы пожертвовать краткосрочной валовой маржой ради уверенности в долгосрочных контрактах. Согласно отчету China Securities Guoxin, переход на PTU изменит структуру валовой маржи облачного бизнеса с «высокой волатильности» на «высокую устойчивость» — то есть краткосрочное давление будет сопровождаться более здоровой и стабильной перспективой в долгосрочной перспективе.

02 Различия в стратегиях трех крупнейших игроков

Майкрософт, AWS и Google — три гиганта, которые на поверхности продвигают PTU, но их внутренние стратегии кардинально различаются.

Microsoft полагается на экосистемную интеграцию. Основным инструментом Microsoft является обширная экосистема, состоящая из Windows, Office 365 и GitHub. Она запустила программу «Обещание Azure AI», поощряя корпоративных клиентов заключать контракты на обязательства по расходам сроком на 1–3 года. В этом квартале коммерческие нереализованные обязательства Microsoft выросли до 625 миллиардов долларов США, увеличившись более чем вдвое по сравнению с прошлым годом. Из них 45% приходится на новые соглашения с OpenAI на сумму 250 миллиардов долларов США.

Майкрософт играет в умную игру: высшая степень ценообразования — заставить клиентов не вести отдельный учет затрат на ИИ. Когда ИИ превращается в одну кнопку в Word, бюджет естественным образом включается в стоимость подписки на программное обеспечение. Однако чрезмерная зависимость от одного клиента вызывает опасения на рынке: если у OpenAI возникнут финансовые трудности, это вызовет цепную реакцию, напрямую ударившую по Майкрософт.

AWS опирается на конкурентные преимущества по стоимости. Его уверенность основана на собственных чипах Trainium и Inferentia, а также на крупнейшей в мире инфраструктуре облачных сервисов. Он активно продвигает программу «Экономия на ИИ/МО», предлагая клиентам цены, значительно более выгодные, чем оплата по мере использования.

Генеральный директор Amazon Энди Яси заявил на конференции по финансовым результатам с исключительной жесткостью: «Достижение 24%-го годового роста на базе годового дохода в 142 миллиарда долларов США — это совершенно иное, чем достижение более высокого процентного роста конкурентами на значительно меньшей базе».

AWS строит конкурентное преимущество за счет максимальной эффективности цепочки поставок; он не боится ценовой войны, поскольку стоимость единицы вычислительной мощности уже самая низкая в отрасли. На конференции по результатам отчетного периода руководство неоднократно подчеркивало, что «новые вычислительные мощности могут быстро генерировать доход». Подразумевается, что компания делает ставку на то, что эффект масштаба в конечном итоге перекроет все остальное.

Google же опирается на премию за производительность. У Google наиболее глубокий опыт в накоплении технологий ИИ: собственные TPU уже достигли седьмого поколения, а ежемесячная аудитория модели Gemini составляет 750 миллионов пользователей. Выручка Google Cloud в четвертом квартале выросла на 48%, что значительно превышает темпы роста конкурентов.

Google расширяет обязательство использовать скидки на платформу ИИ, привлекая клиентов, предъявляющих экстремальные требования к производительности. Она придерживается стратегии технологической роскоши, не стремясь к максимальному количеству клиентов, а стремясь к тому, чтобы самые прибыльные клиенты высокого сегмента не могли обойтись без нее.

Партнерство с Apple — еще один ключевой шаг: Google стал предпочтительным облачным провайдером Apple, и обе компании совместно разрабатывают базовые модели, что обеспечит доступ к технологиям ИИ Google через устройства Apple для пользователей по всему миру.

Три стратегии представляют три разных экономических барьера: Microsoft — за счет стоимости переключения, AWS — за счет эффекта масштаба, Google — за счет технологического лидерства. Чтобы определить, какая компания получит наибольшую выгоду от перехода на PTU, ключевым является оценка, сможет ли тип ее экономического барьера оставаться эффективным в течение срока действия долгосрочных контрактов.

Однако влияние перехода PTU не ограничится облачными провайдерами и крупными клиентами — оно будет передаваться вверх по цепочке поставок к производителям чипов и вниз к прикладным компаниям.

Первыми受益的是上游芯片厂商. В модели токена закупка вычислительных мощностей облачными провайдерами носит «импульсный» характер — при резком росте трафика они срочно делают дополнительные заказы, а в периоды спада ресурсы простаивают. В модели PTU долгосрочные контракты позволяют облачным провайдерам делать более плавные и предсказуемые заказы上游.

Microsoft планирует увеличить вычислительную мощность ИИ более чем на 80% в течение 2026 года и удвоить масштабы центров обработки данных в ближайшие два года. Производственные планы производителей чипов, таких как NVIDIA, станут более уверенными, а эффективность цепочки поставок значительно возрастет.

Поставщики AI-приложений на нижнем уровне ускоряют перераспределение: в модели PTU после блокировки ресурсов крупными клиентами ресурсный пул мелких клиентов может быть сжат. Барьеры для входа в стартапы в области AI растут: проекты, которые ранее могли запуститься за счет оплаты по токенам по мере необходимости, в будущем могут столкнуться с более высокими стартовыми затратами. В то же время компании на уровне инструментов, которые помогают клиентам оптимизировать использование PTU — такие как управление AI-нагрузками и SaaS-решения для управления затратами — получат структурные возможности.

Отчет Guoxin Securities указывает, что изменение модели ценообразования находится на переломном этапе; после завершения адаптации к этим изменениям в течение следующего года тенденция к заключению долгосрочных контрактов на заказы значительно повысит уверенность в росте доходов и прибыли.

03 Заключение

Преобразование из токена в PTU ознаменовало переход индустрии ИИ от экспериментальной стадии «дикого роста» к коммерчески зрелой стадии «тщательного развития».

Вспоминая путь мобильного интернета от тарификации по килобайтам до безлимитного трафика, именно созревание модели ценообразования породило триллионные рынки коротких видео, прямых эфиров и облачных игр. Сегодня боли, связанные с тарификацией ИИ, прокладывают путь для следующего приложения уровня «Дынь», созданного на основе ИИ.

Конечно, PTU не будет конечной точкой. С ростом модели как услуги (MaaS), оплата ИИ может далее эволюционировать в направлении «оплата по результатам бизнеса». Борьба за ценовое влияние остается ключевым ориентиром для наблюдения за эволюцией ИИ-индустрии.

В этом процессе настоящими победителями станут те, кто превратит «привязку клиентов» в «обслуживание клиентов»; когда власть над ценообразованием перейдет от нулевой суммы к взаимовыгодному результату, взросление AI-коммерциализации будет действительно завершено.

Эта статья взята из официального аккаунта WeChat «Shizhibang» (ID: shizhibang2021), автор: команда Shizhibang