Дослідник, який пише під псевдонімом Zeitgeist, сказав, що попит на пам’ять для штучного інтелекту перевищує те, що світ зараз може виробляти, на кілька порядків. За його думкою, акції виробників пам’яті можуть зростути в десять разів від поточного рівня, якщо їх оцінювати не за історичними максимумами, а за реальним попитом на обчислювальні ресурси.
Zeitgeist навів яскравий приклад: інвестиція в 50 000 доларів США в акції Micron у вересні минулого року сьогодні коштувала б близько 489 000 доларів США. За його словами, деякі інвестори бояться, що вже пропустили цей рух, тоді як інші бояться стати «ліквідністю, яку великі гравці використовують для виходу зі своїх позицій». Аналітик пропонує подивитися на цю можливість інакше — через арифметику попиту на пам’ять.
Чому пам’ять стала обмеженням
Кожен прискорювач оснащений фіксованою сумою високoshвидкісної пам’яті, відомої як HBM, яку неможливо розширити. За даними аналітика, стандартний чіп H100 має лише 80 ГБ, новіші покоління пропонують до 192 ГБ, а майбутній B300 матиме 288 ГБ. Цей ліміт визначає, скільки запитів може обробляти один прискорювач.
Основна навантаження приходить не від ваг моделі, а від так званого KV-кешу: пам’яті сесії, яка зростає з кожним згенерованим токеном. За розрахунками Zeitgeist, одна сесія з контекстом 128 000 токенів вимагає приблизно 20 ГБ пам’яті. Лише чотири такі сесії повністю вичерпають ресурси одного H100.
Використання пам’яті на сеанс залежно від розміру вікна контексту та кількості сеансів на прискорювачі H100. Джерело: Zeitgeist
Для просунутих моделей, таких як Claude Opus 4.8 або GPT-5.5, вимоги ще вищі: від 40 ГБ до 100 ГБ для одного довгого запиту. За словами аналітика, саме тому кожен додатковий гігабайт пам’яті коштує своєї ваги в золоті, а виробники, такі як Micron і SK Hynix, фізично не можуть прискорити виробництво.
Ефект AI-агента та розрив попиту
За даними Zeitgeist, ключовим зміщенням є перехід від простих чат-ботів до AI-агентів. Хоча звичайний запит майже не навантажує пам’ять, агент, який самостійно викликає інструменти та накопичує контекст, може легко досягти 100 000 токенів або більше. Один знаннєвий працівник, що запускає десять таких агентів паралельно, потребуватиме близько 152 ГБ пам’яті.
Пікове використання пам’яті на одного працівника знань під час паралельних чатів та агентних сесій. Джерело: Zeitgeist
Аналітик зазначив, що по всьому світу є приблизно 250 мільйонів працівників, пов’язаних зі знаннями. Якщо це число помножити на кількість одночасних агентних сеансів, попит на пам’ять не просто зростає — він «вибухає». За його оцінкою, при 100 агентних сеансах на людину на день світ потребуватиме приблизно в 60 разів більше пам’яті, ніж буде вироблено у 2026 році.
Zeitgeist визнав, що алгоритми зменшать використання пам’яті з часом, з новими «методами уваги», здатними зменшити навантаження в чотири-вісім разів. Але, на його думку, попит зростає набагато швидше: агенти замінюють прості чати, вікна контексту розширюються від 128 000 до 10 мільйонів токенів, а використання ШІ кожним працівником рухається від нуля до сотень сесій.
За думкою аналітика, у світі, де мовні моделі «плетуться у кожний аспект повсякденного життя», пам’ять стає критичним ресурсом. За його прогнозом, компанії, які її виробляють, отримають безпрецедентний дохід.
SK Hynix обганяє Samsung через зростання попиту на пам’ять для ШІ
Масштаби буму пам’яті на основі ШІ вже перетворюють ринок чіпів. Південнокорейський виробник пам’яті SK Hynix обминув Samsung як найціннішу публічну компанію країни завдяки своїй сильній позиції на ринку чіпів з високою пропускною здатністю, що використовуються для завдань штучного інтелекту.
Для Zeitgeist цей зсув підтримує загальну тезу про те, що виробники пам’яті стають одними з найбільших бенефіціарів гонки інфраструктури ШІ. Оскільки попит на HBM зростає швидше, ніж пропозиція, компанії, здатні виробляти передові чипи пам’яті, можуть побачити стрімке зростання доходів і оцінок.
