Хмурі гіганти переходять на модель PTU на тлі зростання вартості токенів AI

Весною 2026 року звітний квартал північноамериканських гігантів хмарних обчислень перетворився на спільний «день страждань».

Квартальний дохід відділу інтелектуальних хмарних сервісів Microsoft вперше перевищив 50 мільярдів доларів США, Azure зростав на 39% рік до року, але після публікації фінансових результатів акції впали майже на 10%; дохід AWS від Amazon досяг найвищого темпу зростання за 13 кварталів, а на наступний день акції впали на 11%; дохід Google Cloud збільшився на 48%, але після закриття ринку акції все ж перейшли з зростання до падіння.

Причина лише одна: гроші. Або ж непідконтрольні рахунки штучного інтелекту.

При аналізі фінансових звітів великих компаній видно, що Microsoft витратила 37,5 мільярда доларів США на капітальні витрати за один квартал, що на 66% більше, ніж у попередній період. Хоча компанія не надала прогноз на рік, аналітики вважають, що за поточними темпами квартальних капітальних витрат річні витрати перевищать 100 мільярдів доларів США. Amazon оголосила про планові витрати в розмірі 200 мільярдів доларів США у 2026 році, а Google планує інвестувати 175–185 мільярдів доларів США — майже вдвічі більше, ніж у 2025 році.

Три гіганти разом витратили понад 500 мільярдів доларів США, що дорівнює ВВП Норвегії за 2024 рік.

Що тривожить ринок капіталу? Чи недостатній ріст хмарних послуг? Звичайно, ні. Чим більше великих клієнтів використовують хмарні сервіси, тим більше ймовірність «вибуху» рахунків провайдерів хмари. У Сіліконовій долині тихо відбувається битва за те, «як отримувати гроші». Перемога в цій битві перетворить розподіл вартості в усьому AI-ланцюжку.

Чи починає модель 01 Token покарувати глибоких користувачів?

Однією з незаперечних істин є те, що модель оплати за токени стала одним із найбільших внесків у поширення ШІ.

На початку 2024 року середньодобовий обсяг викликів токенів у Китаї становив 100 мільярдів; до кінця 2025 року він зріс до 100 трильйонів; у березні цього року він перевищив 140 трильйонів, збільшившись більше ніж у тисячу разів за два роки.

Тим часом, з поширенням «ракоподібних», штучний інтелект перетворився з «іграшки» на «інструмент виробництва», і недоліки моделі токенів почали проявлятися.

Наприклад, з AI-агентом: традиційний чат-бот витрачає кілька сотень до тисяч токенів на відповідь на один запит. Але AI-агент, здатний самостійно виконувати завдання, під час кожного виконання потребує кількох етапів міркувань, багаторазового виклику інструментів та читання великої кількості контексту. За оцінками фахівців, споживання токенів агентами може збільшуватися в десятки разів, а для складних завдань — у сотні та тисячі разів більше, ніж у звичайній діалозі.

У 2026 році OpenAI припинила роботу інструменту генерації відео Sora, однією з причин чого була нерентабельність. За даними аналітичної компанії SemiAnalysis, цитованими «Цзиньхуа жибао», щоденна вартість експлуатації Sora становила майже 15 мільйонів доларів США, а річна вартість — понад 5,4 мільярда доларів США.

Керівник проекту OpenAI відкрито заявив: «Поточна економічна модель повністю непостійна». Витрати обчислювальних ресурсів на генерацію відео значно перевищують такі для тексту та зображень: один запит на генерацію відео використовує стільки GPU-ресурсів, скільки ChatGPT потрібно для відповіді на десятки запитів, що серйозно стискає ресурси основних напрямків бізнесу.

У режимі токенів чим більше ви використовуєте AI, тим більше розбігається рахунок. Навіть генеральний директор NVIDIA Дженсен Хуанг сказав, що майбутні інженери NVIDIA отримають власний «річний бюджет токенів» — і якщо високооплачуваний інженер за рік не витратить багато токенів, це буде виглядати дивно.

Коли галузь дійшла до стадії «чим більше використовується, тим більше страху», це свідчить про фундаментальні проблеми з моделлю ціноутворення.

Чим більше ви використовуєте, тим більше я заробляю — звучить чудово. Але великих клієнтів, які стикаються зі значними коливаннями рахунків за AI, CFO не дозволяють затверджувати бюджет на масштабування. Модель токенів карає тих, кого найбільше потрібно зберегти: головних клієнтів із найбільшим обсягом використання та найглибшими сценаріями. Це суперечить довгостроковим інтересам хмарних провайдерів щодо збільшення ринку.

На цьому тлі північноамериканські хмарні провайдери ввели новий інструмент, який називається PTU: передбачений обсяг пропускної здатності.

Просто кажучи, клієнти попередньо купують певну кількість обчислювальної потужності та сплачують фіксовану щомісячну, щоквартальну або щорічну плату, незалежно від фактичної кількості спожитих токенів. Модель токенів — «їж, скільки з’їси», а PTU — це «все включено за місяць». Клієнти отримують передбачувані витрати, а хмарні провайдери — залученість клієнтів.

Логіка гри за цим повністю змінилася.

У режимі токена обидві сторони перебувають у «гри з нульовою сумою»: клієнт економить гроші — хмарний провайдер заробляє менше; клієнт витрачає більше — хмарний провайдер заробляє більше. Але великі клієнти через страх втрати контролю над витратами зменшують використання, що призводить до того, що дохід хмарного провайдера не досягає очікуваних рівнів.

У режимі PTU гра перетворюється на «позитивну суму»: після фіксації бюджету клієнти сміліше збільшують використання ШІ, а дохід хмарних провайдерів стає більш стійким. Суть полягає у перенесенні ризику з боку клієнта на бік хмарного провайдера для досягнення глибшого зв’язку з клієнтом.

Guoxin Securities порівняв зміни тарифів на мобільний інтернет у Китаї.

У епоху 2G трафік оплачувався за кілобайти — 0,01 юаня за КБ, користувачі витрачали трафік наче краплі крові. У епоху 3G тарифи перейшли на мегабайти — 150 юанів за 3 ГБ, і користувачі почали розслабитися. У епоху 4G «прискорення та зниження цін» сприяло повномасштабному розвитку безлімітних тарифних планів, наприклад, у 2016 році Tencent «Велика карта» за 19 юанів на місяць з безкоштовним трафіком для додатків Tencent — користувачі повністю перейшли від «покупки трафіку» до «покупки сервісу». У епоху 5G тарифікація далі еволюціонувала до «класифікації за швидкістю», і кількість трафіку більше не є ключовим фактором ціноутворення.

Кожна зміна моделі оплати — це перерозподіл влади в ланцюжку постачання. Оператори відмовилися від прибуткової моделі «оплата за КБ», що призвело до зростання середньомісячного трафіку користувачів з 30 МБ до понад 10 ГБ, загальний розмір ринку збільшився в сотні разів.

Вибір хмарних провайдерів сьогодні такий самий, як і вибір операторів у той час. Вони готові пожертвувати короткостроковою валовою маржею, щоб забезпечити довгострокову стабільність контрактів. Згідно з дослідженням China Securities Guoxin, трансформація PTU змінить структуру валової маржі хмарного бізнесу з «високої еластичності та коливань» на «високу стійкість» — тобто короткостроковий тиск, але довгострокова більш здоровa та стабільна модель.

02 Різниця в стратегіях трьох великих гравців

Мікрософт, AWS і Google — три гіганти, які на поверхні підтримують PTU, але їхні стратегії насправді кардинально відрізняються.

Майкрософт опирається на екосистемні зв’язки. Її інструментом є велика екосистема, що складається з Windows, Office 365 та GitHub. Вона запровадила програму «Зобов’язання Azure AI», що заохочує корпоративних клієнтів до підписання контрактів на обсяг споживання на 1–3 роки. У цьому кварталі комерційні залишки зобов’язань Майкрософт стрімко зросли до 625 мільярдів доларів США, що більше ніж у два рази порівняно з попереднім періодом. З них 45% припадає на нові угоди з OpenAI на суму 250 мільярдів доларів США.

У Microsoft дуже розраховані плани: найвищий ступінь ціноутворення — це зробити так, щоб клієнти не могли окремо обчислити витрати на ШІ. Коли ШІ перетворюється на кнопку у Word, бюджет автоматично включається до вартості підписки на програмне забезпечення. Але надмірна залежність від одного клієнта викликає занепокоєння на ринку: якщо OpenAI зіткнеться з фінансовими труднощами, ланцюгова реакція безпосередньо вплине на Microsoft.

AWS ґрунтується на перевагах у витратах. Його впевненість базується на власних чіпах Trainium та Inferentia, а також найбільшій у світі хмарній інфраструктурі. Він активно просуває «Плани економії на AI/ML», пропонуючи клієнтам ціни, значно нижчі за тарифи за використанням.

Генеральний директор Amazon Андрі Джасі висловився дуже жорстко на зустрічі з інвесторами: «Досягнення 24% річного зростання на основі річного доходу в 142 мільярди доларів США — це абсолютно інше, ніж конкуренти досягають більш високих процентних показників з явно меншою базою.»

AWS будує оборонні позиції за рахунок екстремальної ефективності ланцюга поставок, він не боїться цінової війни, оскільки вартість одиниці обчислювальної потужності вже найнижча в галузі. На зустрічі з інвесторами керівництво неодноразово підкреслювало: «нові обчислювальні потужності можна швидко монетизувати». Це означає, що вони роблять ставку на те, що ефект масштабу в кінцевому підсумку перетягне все на свій бік.

А Google заслуговує на премію за продуктивність. Google має найглибші накопичення в галузі AI, власні TPU вже досягли сьомого покоління, а місячна кількість активних користувачів моделі Gemini становить 750 мільйонів. У четвертому кварталі дохід Google Cloud збільшився на 48%, що значно перевищує темпи зростання конкурентів.

Google розширює обітницю використання знижок на платформу ШІ, щоб привернути клієнтів, які вимагають максимального рівня продуктивності. Вона дотримується стратегії технологічного люксу — їй не потрібно найбільше клієнтів, але важливо, щоб найприбутковіші елітні клієнти не могли обійтися без неї.

Співпраця з Apple є ще одним ключовим кроком: Google став обраною хмарною службою Apple, і обидві компанії спільно розробляють базові моделі, що забезпечить доступ до технологій AI від Google через пристрої Apple для користувачів по всьому світу.

Три стратегії відповідають трьом різним економічним бар’єрам: Microsoft залежить від витрат на перехід, AWS — від ефекту масштабу, а Google — від технологічного лідерства. Щоб визначити, яка компанія отримає найбільшу користь від переходу на PTU, ключовим є оцінка того, чи може її бар’єр залишатися ефективним протягом терміну довгострокових контрактів.

Однак вплив трансформації PTU не обмежиться лише хмарними провайдерами та великими клієнтами — він пошириться вздовж ланцюга поставок до чіпів на початку ланцюга та застосунків у кінці.

Першими вигідною від цього є постачальники чіпів. У моделі Token закупівля обчислювальних потужностей хмарними провайдерами має «імпульсний» характер — у періоди стрімкого зростання трафіку вони негайно роблять додаткові замовлення, а під час спадів ресурси залишаються невикористаними. У моделі PTU довгострокові контракти дозволяють хмарним провайдерам робити більш стабільні й передбачувані замовлення постачальникам на верхньому етапі ланцюга.

Microsoft планує збільшити обчислювальну потужність ШІ більше ніж на 80% протягом 2026 року, а протягом наступних двох років подвоїти масштаби центрів обробки даних. Планування виробничих потужностей таких виробників чіпів, як NVIDIA, стане більш спокійним, а ефективність ланцюга постачання значно зросте.

Підприємства з нижчого ланцюга, що застосовують ШІ, прискорюють перерозподіл: у моделі PTU, після блокування ресурсів великими клієнтами, ресурсний пул для малих і середніх клієнтів може бути стиснений. Бар’єри для старту в сфері ШІ-застосунків зростають: проекти, які раніше могли запускатися за допомогою Token за потребою, у майбутньому можуть стикатися з вищими початковими витратами. Разом із тим, компанії на рівні інструментів, які допомагають клієнтам оптимізувати використання PTU — такі як завантаження ШІ та SaaS-рішення для управління витратами — отримають структурні можливості.

Звіт Guoxin Securities вказує, що зміна моделі ціноутворення перебуває на переломному етапі; після того як вплив цих змін буде повністю врахований протягом наступного року, тенденція до укладання довгострокових угод на замовлення значно підвищить визначеність зростання доходів і прибутку.

03 Заключення

Перехід від токенів до PTU означає, що індустрія ШІ переходить з етапу «дикого росту» та експериментів до комерційно зрілої фази «детального розвитку».

Глянучи на шлях мобільного інтернету від тарифікації за кілобайти до безлімітного трафіку, саме дозрівання моделей ціноутворення сприяло виникненню трильйонних ринків коротких відео, прямих ефірів, хмарних ігор. Сьогоднішні болісні процеси тарифікації ШІ прокладають шлях для наступного «抖音-рівневого» ШІ-натурального застосунку.

Звичайно, PTU не буде кінцем. Зі зростанням моделей як сервісу (MaaS), оплата штучного інтелекту може далі еволюціонувати до моделі «оплата за результати бізнесу». Гра за визначення цін — завжди ключовий індикатор еволюції індустрії ШІ.

У цьому процесі справжніми переможцями стануть ті, хто перетворить «закріплення клієнтів» на «обслуговування клієнтів»; коли влада ціноутворення перейде від гри з нульовою сумою до позитивної співпраці, дорослість AI-комерціалізації буде повністю досягнута.

Цей матеріал надійшов із офіційного аккаунту WeChat «Shizhibang» (ID: shizhibang2021), автор: команда Shizhibang