Инновации в моделях ИИ создают новые возможности для инфраструктуры ИИ

Статья | Alpha公社

За последнее время область AI-сетевой связи становится все более популярной.

С одной стороны, стартапы из Кремниевой долины в области AI-сетевой связи часто получают крупные инвестиции, с другой — акции компаний AI-сетевой связи, особенно в области оптоволоконной связи, на вторичном рынке также быстро растут.

Почему растет популярность AI-сетевой коммуникации? В основе — рост спроса: модели становятся все больше, потребление токенов увеличивается, вычислительные ресурсы начинают ощущать дефицит. Чтобы извлечь больше вычислительной мощности с меньшими затратами на стороне вычислений, необходимо искать решения на уровне базовых технологий.

Ускорение связи между чипами и ускорение связи между узлами — это путь, который сейчас проверяется на практике для повышения эффективности всей инфраструктуры вычислительных мощностей.

Компания Upscale AI недавно привлекла значительные инвестиции. В сентябре 2025 года она получила семя-финансирование на сумму 100 миллионов долларов США, которое возглавили Mayfield и Maverick Silicon, а также приняли участие StepStone Group, Celesta Capital, Xora, Qualcomm Ventures, Cota Capital, MVP Ventures и Стэнфордский университет.

В январе 2026 года было получено дополнительное финансирование серии A на сумму 200 миллионов долларов США, возглавляемое Tiger Global, Premji Invest и Xora Innovation, с участием Maverick Silicon, StepStone Group, Mayfield, Prosperity7 Ventures, Intel Capital и Qualcomm Ventures.

Недавно поступила еще одна информация о том, что он ведет переговоры о новом раунде финансирования в размере от 180 до 200 миллионов долларов.

Крупные параметры, MoE, длинный контекст, инновации в моделях вынуждают инновации в вычислительных сетях ИИ

Почему компания, созданная менее года назад, может последовательно получать крупные инвестиции? Это во многом связано с ее основательной командой. Фактически, Upscale AI была выделена из Auradine — самой по себе новой компании в сфере AI-инфраструктуры, которая сейчас переименована в Velaura AI и сосредоточена на предоставлении проверенных инновационных решений для сверхнизкого энергопотребления для облачных, граничных и физических приложений искусственного интеллекта.

Барун Кар и Раджив К, фото: Upscale AI

Сооснователь и генеральный директор Upscale AI Барун Кар ранее был главным операционным директором Auradine, а сооснователь и исполнительный председатель Раджив К. ранее был генеральным директором Auradine и теперь также является генеральным директором Velaura AI. Главный технический директор Upscale AI Пунеет Агарвал работал в Broadcom в течение десяти лет и ранее занимал должность главного технического директора отдела центров обработки данных в Marvell.

Барун Кар и Раджив К. также имели опыт работы в крупных корпорациях до своего предыдущего стартапа; можно сказать, что это команда с многолетним опытом и глубокими знаниями в отрасли.

Почему важна AI-сеть связи? Это нужно начинать объяснять с технологической основы.

Особенностью вычислительной нагрузки ИИ является высокая синхронизация. Современные рабочие нагрузки, такие как обучение крупных моделей, архитектура MoE и распределённый вывод, создают чрезвычайно высокое давление на синхронизацию сети.

В процессе обучения градиенты параметров модели должны передаваться между тысячами GPU с высокой синхронизацией по волнам; вычисления при выводе создают масштабный трафик с разветвлением и предъявляют чрезвычайно строгие требования к задержке.

Если сеть не справляется, GPU останавливается и ждет, задержка продолжает расти, и эффективность вычислительного кластера резко падает.

Это несоответствие архитектуры, которое нельзя решить настройкой.

Традиционные сети, ориентированные на универсальность, теперь сталкиваются с трудностями в сценариях ИИ из-за сложности, введенной для поддержки различных нагрузок. Детерминированная связь и строгая синхронизация, требуемые для коллективной коммуникации GPU, выходят за пределы возможностей традиционных сетей.

Сеть, необходимая для кластера ИИ-вычислительных ресурсов, должна поддерживать детерминированную, синхронизированную и высокопроизводительную связь в масштабе.

AI-сеть должна быть перестроена с нуля, с учетом реальных потребностей в масштабировании вверх и вширь.

Дальнейшая детализация и разбор сводятся к модели.

Сейчас две особенности модели оказывают особое давление на сеть вычислительных кластеров ИИ: экспоненциальный рост масштаба параметров модели и постоянное развитие длинных контекстов и COT.

На примере только что выпущенного DeepSeek V4 Pro: его параметры размера достигли 1,6 ТБ, а контекст — 1 М. Для размера 1,6 ТБ требуется 1,6 ТБ памяти, чего недостаточно на одном ускорителе, поэтому его необходимо разделить между большим количеством ускорителей, из-за чего связь между чипами быстро становится узким местом.

Очень длинное окно контекста резко увеличивает объем KV-кэша и превышает емкость HBM-памяти одной GPU. Это создает двойное давление на объем памяти и пропускную способность связи.

Это не просто инновация на уровне чипа, а полная стековая революция

Для обучения и плавного вывода моделей с большим объемом параметров и длинным контекстным окном истинным решением является переопределение «вычислительных границ», чтобы большее количество GPU могло быть подключено с помощью сверхбыстрых сетей, обладая задержкой на уровне субмикросекунд и высокой пропускной способностью коллективной коммуникации, позволяя воспринимать их как один «супер-GPU», благодаря чему появилась форма стойки.

На примере NVIDIA NVL72, он больше не рассматривает 72 GPU как отдельные устройства, а работает с ними как с единой машиной с согласованной памятью, внутренняя пропускная способность NVLink достигает 130 ТБ/с.

Здесь вводятся два уровня соединения инфраструктуры ИИ: межмодульная связь GPU в стойке (Scale-Up) и сетевая архитектура связи между кластерами (Scale-Out).

Эти два уровня должны работать совместно, чтобы тысячи GPU функционировали эффективно как единый распределенный вычислительный двигатель.

Для двух уровней соединения инфраструктуры ИИ Upscale AI разработала специализированную сетевую архитектуру для ИИ. Для межмодульной связи ИИ (Scale-Up) используется архитектура чипа SkyHammer, а для сетевой структуры кластера ИИ (Scale-Out) — Open Ethernet.

SkyHammer — это архитектура чипов, созданная для преодоления узких мест в сети Scale-Up AI, основанная на открытых стандартах и направленная на обеспечение детерминированной задержки, максимальной пропускной способности и предсказуемой производительности в масштабе сверхбольших систем, позволяя GPU и XPU работать совместно как высокосинхронизированный вычислительный двигатель.

Одной из его особенностей является детерминированная задержка, которая представляет собой время, необходимое для передачи данных между компонентами в стойке, и может быть с высокой предсказуемостью контролируема.

Источник изображения: Upscale AI

SkyHammer начинается с уровня ASIC и проектируется как целостная система на трёх уровнях: чип, система и стойка, обеспечивая согласованную работу каждого уровня. Каждый элемент был перепроектирован: от того, как данные перемещаются внутри чипа, до того, как fabric адаптируется под нагрузкой, и до того, как суперкластер сохраняет предсказуемость даже при высокой синхронизации.

Он поддерживает новые стандарты, такие как ESUN, UEC, UALink, и оставляет пространство для будущих инноваций, которые еще не появились. Благодаря гибкой архитектуре SkyHammer может плавно адаптироваться к новым стандартам без перестройки и компромиссов, обеспечивая взаимодействие в открытой и разнообразной среде, сохраняя при этом производительность.

Продукты на основе архитектуры SkyHammer запланированы к выпуску в 2026 году.

Open Ethernet в первую очередь ориентирован на архитектуру AI-сетей на уровне кластера (Scale-Out). На уровне кластера системы ИИ требуют открытости, интероперабельности и огромной пропускной способности.

Upscale AI создала оптимизированную под ИИ архитектуру Open Ethernet, которая будет построена на базе коммутационных чипов NVIDIA Spectrum-X и сетевой операционной системы SONiC с полной поддержкой端到端.

Система обеспечивает предсказуемую производительность, упрощенное обслуживание и высокую надежность в масштабных сценариях за счет интеграции нативных телеметрических возможностей ASIC, детерминированного безпотерь Ethernet-поведения и стандартизированных отраслевых сетевых рабочих процессов.

Проще говоря, он объединяет тысячи GPU в единую высокопроизводительную сеть, обеспечивая распределенное обучение и масштабные выводы.

Для этого проекта Upscale AI присоединилась к NVIDIA Partner Network и тесно сотрудничает с NVIDIA и ее экосистемными партнерами, совместно работая над опорной архитектурой и проверенными решениями для ускорения развертывания сетей крупномасштабных AI-центров обработки данных.

Как видно, Upscale AI не ограничивается созданием более быстрого сетевого чипа, а обеспечивает тесную интеграцию между чипом, системой и программным обеспечением. Для запуска крупных AI-вычислительных кластеров необходимо постоянно отслеживать состояние перегрузки, синхронизацию и использование GPU во всей сетевой структуре.

Это включает в себя высокопроизводительную RDMA-сеть, адаптивное управление перегрузками, телеметрию и наблюдаемость, ориентированные на GPU, а также реальное время отслеживания работы всей сетевой архитектуры. Upscale AI оптимизирует все эти компоненты, создавая детерминированную сетевую инфраструктуру, необходимую для работы современных вычислительных кластеров ИИ.

Несоответствие между потребностями моделей и инфраструктурой для вычислений ИИ создало множество возможностей для предпринимательства

Инфраструктура для вычислительных мощностей ИИ по-прежнему обладает огромным потенциалом для развития. Фактически, она может долгое время находиться в состоянии поочередного инновационного развития вместе с программным обеспечением ИИ, особенно с моделями. Когда архитектура модели претерпевает инновации, а аппаратное или программное обеспечение инфраструктуры вычислительных мощностей ИИ сталкивается со структурным несоответствием, возникают новые возможности.

Сейчас именно такая ситуация: архитектура MoE, сверхбольшие параметры, сверхдлинные окна контекста, жажда агентов к токенам — все эти факторы в совокупности привели к дефициту вычислительных мощностей ИИ, одновременно создавая возможности для инноваций в инфраструктуре вычислительных мощностей ИИ.

На уровне чипов для вычислительной мощности за последние полгода мы обратили внимание на Unconventional AI (привлекла 475 млн долларов), MatX (привлекла 500 млн долларов); в области применения ИИ для проектирования чипов — на Ricursive (привлекла 300 млн долларов), Cognichip (привлекла 60 млн долларов); а также на сетевую инфраструктуру для центров обработки данных ИИ, например, Upscale AI (уже привлекла 300 млн долларов и планирует привлечь еще 200 млн), Eridu (привлекла 200 млн долларов), Ethernovia (привлекла 90 млн долларов).

Китайские открытые ИИ-модели уже достигли мирового лидерства, особенно недавно выпущенная DeepSeek V4. На уровне ИИ-инфраструктуры Китай пока находится в стадии догоняющего развития, но это также означает огромный потенциал для инноваций. Наблюдая за китайским венчурным рынком, можно заметить, что множество инновационных компаний уже начали появляться, и некоторые из них уже достигли первоначального успеха.