Индустрия ИИ вот-вот достигнет переломного момента. Согласно Epoch AI, некоммерческой организации, отслеживающей тенденции в области искусственного интеллекта, вычислительная мощность, выделяемая для запуска моделей ИИ, к 2030 году будет расти быстрее, чем вычислительная мощность, используемая для их создания.
Числа за сдвигом
Прогнозы Epoch AI рисуют картину отрасли, в которой экономика развертывания все больше будет доминировать над экономикой разработки. Организация оценивает, что к концу десятилетия почти половина всех вычислений для вывода перейдет на ASIC — специализированные интегральные схемы. Это чипы, предназначенные для выполнения одной задачи исключительно эффективно, в отличие от универсальных GPU, которые сегодня обеспечивают большинство задач ИИ.
В то же время доля вычислительных ресурсов для обучения в общих операциях ИИ, как ожидается, останется на уровне примерно 5%. Вычислительные ресурсы для обучения передовых моделей ИИ в настоящее время растут с годовым темпом 4–5 раз. Общая установленная база вычислительных ресурсов ИИ расширяется с аналогичной скоростью.
Исторически вычисления для вывода уже составляли 60–80% от общих вычислительных ресурсов в реальных развертываниях.
К 2030 году объемы обучения передовых моделей, как ожидается, достигнут примерно 2e29 FLOP. Такой прогресс сопоставим с переходом от GPT-2 к GPT-4, поддерживаемым ресурсами стоимостью более $100 миллиардов. Каждый из таких этапов обучения может требовать от 4 до 16 гигаватт вычислительной мощности.
Общая мощность ИИ-проектов Epoch в США может превысить 50 ГВт к 2030 году, а глобальная мощность — более 100 ГВт.
Почему ASICs поглощают инференс
Google разобрался с этим еще несколько лет назад с помощью своих процессоров Tensor. Amazon имеет свои чипы Inferentia. Тенденция, которую прогнозирует Epoch AI, указывает на то, что это не нишевая стратегия, а направление, которое к концу десятилетия займет примерно половина рынка инференса.
Ограничения на эту траекторию роста не являются тривиальными. Спрос на энергию, производственные мощности чипов и ограничения передачи данных представляют собой реальные вызовы. Оценка Epoch AI заключается в том, что эти узкие места управляемы при текущих предположениях о росте.
Что это значит для инвесторов
Если вычисления для вывода — это направление, в котором развивается рост, инвестиционная теория для полупроводникового сектора существенно меняется. Обучение все еще требует GPU, и бюджеты на обучение продолжают расти на 4–5% ежегодно. Однако возможность получения более высоких объемов и повторяющегося дохода все больше сосредотачивается на выводе.
Когда речь идет о 50 ГВт мощности ИИ только в США, это масштабное строительство центров обработки данных, систем генерации энергии и охлаждения.
Риск, за которым следует следить, — это устойчивость годового темпа роста вычислительных мощностей в 4–5 раз. Прогнозы Epoch AI предполагают сохранение текущих тенденций, но энергетические ограничения и геополитические динамики поставок чипов могут создать препятствия.
