Несколько мыслей накануне Nvidia сегодня вечером
Автор оригинала: @GavinSBaker
Перевод: Пегги, BlockBeats
Редакторская заметка: После публикации финансовых результатов NVIDIA рынок обычно сосредотачивается на выручке, прибыли и прогнозах. Однако автор этой статьи @GavinSBaker пытается вернуть дискуссию к более долгосрочному измерению: ценность NVIDIA определяется не квартальными данными, а тем, как долго будет сохраняться спрос на ИИ и создают ли инвестиции в вычислительные мощности действительно устойчивую отдачу.
Статья, опираясь на исторический опыт технологических циклов, рассматривает вопрос о возможном повторении «пузырей и чрезмерного строительства», одновременно отмечая, что в этом цикле ИИ существуют ограничения по мощности и поставкам вайферов, что может привести к более сдержанному темпу расширения. С другой стороны, цены на аренду GPU и высокая загрузка чипов старших моделей предоставляют реальное подтверждение «ROI ИИ».
Следует перевести следующий текст:
Вот несколько личных наблюдений, которые могут быть полезны для тех, кто следит за NVIDIA. На мой взгляд, вокруг этой компании действительно стоит обсуждать только два ключевых фактора: устойчивость спроса и рентабельность инвестиций в ИИ (ROI), причем последний тесно связан с эффективным сроком службы GPU.
Постоянство спроса: повторится ли история?
Из исторического опыта технологических волн видно, что почти все подобные циклы проходили через финансовые пузыри и чрезмерное расширение производственных мощностей. Карлота Перес подробно описывает это в книге «Технологические революции и финансовый капитал». Она отмечает, что на каждом этапе технологической революции — будь то железные дороги, радио или интернет — финансовые рынки раньше других распознают их долгосрочный потенциал, а последующая капитальная истерия часто порождает пузыри (это также можно объяснить с помощью концепции «коллапса разнообразия мнений», описанной Маубуассином). Пузыри ведут к чрезмерному строительству, чрезмерное строительство вызывает временное падение спроса, что, в свою очередь, приводит к краху рынка; а избыточное предложение базовых технологий в конечном итоге закладывает основу для «золотого века». Траектория развития интернета является ярким примером.
Таким образом, для NVIDIA ключевым является не результаты за этот квартал или прогноз на следующий квартал, которые часто уже полностью учтены институциональными инвесторами. Важнее устойчивость прибыли на акцию (EPS), а не темп роста за этот год.
Из текущих оценок, заложенных в ожиданиях рынка, кажется, что рынок выражает мнение: прибыль NVIDIA может приближаться к временной вершине, что отражает опасения по поводу чрезмерного расширения капитальных расходов. Важно подчеркнуть, что опасения рынка связаны не с «пузырем оценок», а с «пузырем фундаментальных показателей» — то есть с потенциальным риском чрезмерного строительства, обусловленным капитальными расходами. Если рынок сможет сформировать уверенность в том, что NVIDIA сохранит высокий однозначный темп роста выручки в виде CAGR после финансового года 2027, центральный уровень оценки может получить поддержку.
На этот раз действительно что-то изменилось?
«На этот раз это другое» — часто это опасное суждение. Но в этом цикле ИИ действительно есть отличия: на двух ключевых направлениях — электроэнергии (watts) и передовых полупроводниковых пластин (wafers) — существуют существенные ограничения, и их смягчение может занять несколько лет.
Это жесткое ограничение со стороны предложения, возможно, наоборот, сдерживает чрезмерное расширение производственных мощностей. Если условия позволяют, сверхкрупные облачные провайдеры теоретически продолжат усиливать расширение, но на практике их темпы роста ограничены электроснабжением и полупроводниковыми пластинами. В отличие от исторических технологических революций, описанных Пересом, в то время не существовало подобных ограничений в сфере предложения, сдерживающих скорость развертывания.
Без перегрева трудно ожидать краха, особенно при текущем уровне оценки технологических акций, который не является экстремально высоким.
В этих двух узких местах вайферы могут быть более критичны, чем электроэнергия. Темпы увеличения мощностей по производству вайферов могут стать важным фактором, удлиняющим цикл ИИ. Руководство TSMC традиционно известно своей осторожностью, оно больше акцентирует внимание на стабильности отрасли и долгосрочной ценности, а не на краткосрочном агрессивном расширении. Без ограничений по электроэнергии и вайферам рост NVIDIA в ближайшие 24 месяца мог бы быть быстрее, но одновременно значительно возрос бы риск чрезмерных инвестиций.
В определенном смысле ограничения предложения могут замедлять весь цикл ИИ, стабилизируя его. Высокая зависимость ИИ от вакуумных пластин передовых технологий может стать ключевым фактором, предотвращающим резкие колебания в этом цикле.
Для реализации некоторых экстремальных сценариев масштаб вычислительной мощности может потребовать увеличения в сотни или даже тысячи раз по сравнению с текущим уровнем. А время, необходимое для такого расширения, само по себе предоставляет социуму буфер для адаптации и корректировки институтов.
Исторический опыт также служит ориентиром: после того как Джеймс Уатт изобрел вращательный паровой двигатель, железнодорожная система действительно заменила лошадей лишь спустя десятилетия. Итерационная скорость ИИ, возможно, выше, но она все же не способна за крайне короткий срок перестроить социальную структуру.
Более того, человеку для достижения «общего интеллекта» требуется всего 20–30 ватт мощности. В мире с ограниченными ресурсами электроэнергии это преимущество в эффективности будет сохраняться долгое время. Следовательно, более плавный и устойчивый цикл ИИ未必 является чем-то плохим для самого общества.
Срок службы GPU и реальная ROI от ИИ
Цена аренды GPU по сути отражает экономическую ценность токена и является ключевым показателем «AI ROI». Теоретически, по мере постоянного выпуска чипов с более высокой производительностью, цена аренды устаревших моделей GPU должна постепенно снижаться, даже при положительной рентабельности инвестиций в ИИ.
Однако за последние два месяца цена аренды H100, находящейся в эксплуатации почти четыре года, значительно выросла. Это означает, что вычислительные мощности, особенно в сценариях агентного ИИ и генерации кода, создают реальную и значительную экономическую ценность.
В то же время, даже с запуском Blackwell, A100, выпущенный 6 лет назад, по-прежнему демонстрирует высокую загрузку, и цены на аренду не ощутили значительного ослабления. Это сильно указывает на то, что эффективный срок службы GPU, возможно, составляет не менее 6 лет и даже превышает срок амортизации большинства клиентов.
Это имеет структурные последствия: если остаточная стоимость выше, чем ожидалось ранее, стоимость финансирования GPU将进一步下降. Напротив, ASIC, настроенные под одну модель или конкретное применение, трудно обеспечить аналогичные преимущества по сроку службы. В условиях быстрой итерации капитальные затраты на специализированные чипы выше, и их труднее финансировать.
В определенной степени универсальность является защитным барьером для GPU. С разделением функций prefill и decode и постепенным формированием соответствующей чиповой системы архитектура вычислений эволюционирует от «однокристальной логики» к «многочиповой координационной системе». Инфраструктура ИИ больше не зависит от одного отдельного устройства, а представляет собой целостную высокоинтегрированную системную инженерную задачу.
С разъединением prefill и decode экосистема NVIDIA может раньше экосистемы TPU завершить структурную перестройку. На фоне различий в стратегиях проектирования различных производителей относительные преимущества клиентов в стоимости вывода меняются.
Если некоторые производители ранее полагались на ценовое преимущество для снижения цены токенов с целью завоевания рыночной доли, то при ослаблении этого преимущества рыночное поведение станет более рациональным. В долгосрочной перспективе это положительно скажется на ROI в области ИИ, особенно на этапе перехода спроса на вычислительные мощности от обучения к выводу.
Этот поворот, возможно, заслуживает большего внимания, чем любой квартальный отчет.
Последнее легкое пожелание: надеюсь, NVIDIA в будущем снова начнет использовать супергероев в качестве кодовых названий чипов. Удивительно, но «зеленый лагерь» до сих пор не использовал имя «Banner» (настоящее имя супергероя Марвел — Халк).
Нажмите, чтобы узнать о вакансиях BlockBeats
Добро пожаловать в официальное сообщество律动 BlockBeats:
Телеграм-канал с подпиской: https://t.me/theblockbeats
Телеграм-чат: https://t.me/BlockBeats_App
Официальный аккаунт Twitter: https://twitter.com/BlockBeatsAsia
