Когда все сосредоточены на борьбе на уровне моделей, команда, владеющая стандартом открытого исходного кода для вывода, с самым престижным составом инвесторов в серии seed из Кремниевой долины, официально направляет свои усилия на создание новой инфраструктуры ИИ.

Автор статьи, источник: Machine Learning China

5 мая стартап в области инфраструктуры ИИ RadixArk объявил о завершении семена-финансирования на сумму 100 миллионов долларов США, после чего его оценка составила 400 миллионов долларов США. По объему инвестиций, оценке и составу инвесторов это крупнейшая ранняя ставка в сегменте AI Infra в 2026 году.

Этот раунд возглавил Accel, совместно с Spark Capital. Институциональные инвесторы включают NVentures, дочернюю компанию NVIDIA, AMD, MediaTek, Databricks, а также Salience Capital, HOF Capital, Walden Catalyst, A&E Investment, LDVP и WTT Fubon Family — ведущие институциональные фонды. Почти все ключевые игроки в области核心ного оборудования и системного уровня — от GPU до CPU, от чипов на краю до платформ для данных — уже присоединились.

За пределами ведущих институциональных инвесторов, ряд мировых технологических лидеров с опытом в Intel, Broadcom, OpenAI, xAI, PyTorch и других компаниях также приняли участие в этом раунде инвестиций в качестве ангельских инвесторов.

«Генеральные директора трех крупнейших аппаратных компаний + основатель лаборатории顶尖ных моделей + создатель PyTorch» — собрать такой состав в одном семенном раунде чрезвычайно редко встречается в истории AI Infra. Инвесторы, хорошо знакомые с этой областью, прямо говорят: это ставка на «фактический стандарт следующего поколения инфраструктуры».

Лучший в мире движок для вывода выводов, в их руках

История RadixArk должна начинаться с открытого проекта под названием SGLang.

С момента своего появления в 2023 году SGLang за два года стал одним из фактических стандартов в области открытых моделей для вывода, набрав более 27 000 звезд на GitHub и развернут на более чем 400 000 GPU. Ежедневно на SGLang обрабатывается несколько триллионов токенов производственного трафика, а его пользователями являются Google, Microsoft, NVIDIA, Oracle, AMD, LinkedIn, xAI и Thinking Machines Lab.

За последние два года архитектура моделей претерпела ряд значительных изменений: появление MoE, длинных контекстов, моделей рассуждений и мультимодальной интеграции. Каждый раз, когда архитектура перестраивалась, SGLang обеспечивал совместимость с днем 0 — благодаря инновационному механизму поддержки открытых моделей сразу после их выпуска, производительность приближалась к физическим пределам оборудования. Одной из наиболее часто упоминаемых инвесторами характеристик является то, что скорость итераций SGLang в сочетании с инженерной дисциплиной является абсолютно лучшей среди открытых проектов.

За основной дисциплиной стоит основательная команда с глубоким опытом в области систем и алгоритмов.

Генеральный директор Шэн Ин (Ying Sheng) получила степень бакалавра в ACM-классе Шанхайского交通大学 и докторскую степень в Стэнфордском университете. Она является инициатором LMSYS Org и одним из основателей SGLang. Во время учебы в аспирантуре она работала в качестве приглашенного исследователя в лаборатории Sky Lab UC Berkeley, затем работала в Databricks и xAI, где занимала должность руководителя команды по выводу в xAI. Работы Шэн Ин в области разреженности внимания и повторного использования KV-кэша вызывают большой интерес в отрасли; один из ее ключевых вкладов — механизм RadixAttention, разработанный в ранней версии SGLang.

CTO Чжу Баньхуа (Banghua Zhu) получил степень бакалавра в факультете электронной инженерии Циньхуа, а докторскую степень — в UC Berkeley под руководством экспертов в области машинного обучения Майкла И. Джордана и Цзяньтао Цзяо. Во время учебы в аспирантуре он совместно основал компанию Nexusflow, позже приобретенную NVIDIA, и стал Principal Research Scientist в NVIDIA. В рамках его проектов были реализованы как полные системы промышленного уровня для обучения, так и длительная работа по оптимизации базовых систем NVIDIA и масштабному обучению.

Технический руководитель одного из ключевых производителей оборудования оценил эту группу основателей как наиболее ценную в стартапах AI Infra 2026 года: с одной стороны — исследовательский предприниматель, владеющий стандартом открытого исходного кода для вывода, с другой — эксперт по алгоритмам крупных моделей из самого ядра исследовательской команды производителя GPU.

Обладая инференс-движком SGLang, который обрабатывает триллионы токенов в день, — это уже мечтательная отправная точка для стартапа в области AI Infra. Но у этой команды есть не только эта карта.

День 0: Освоение DeepSeek V4 с использованием обучения с подкреплением

Помимо инференс-движка, RadixArk также достигла прорыва на стороне обучения.

В ноябре 2025 года команда открыла исходный код фреймворка для обучения с подкреплением Miles, ориентированного на стабильность и эффективность масштабного обучения с подкреплением, который на данный момент уже используется более чем 20 командами для обучения моделей MoE с помощью методов обучения с подкреплением.

В 2025–2026 годах конкуренция в области способностей Reasoning, Tool Use и Agentic выйдет на новый уровень, и каждый шаг вперед требует системы, способной выдерживать сверхмасштабное распределенное RL. Отраслевые наблюдатели указали на боль, которая неоднократно упоминалась, но долгое время оставалась нерешенной: сегодня самая большая боль для команд больших моделей далеко выходит за рамки любой отдельной точечной оптимизации. Границы трения на всей цепочке — от обучения через RL до вывода в продакшене — каждая из которых в отдельности близка к оптимальной, при объединении приводит к потере эффективности повсюду.

Комбинация Miles и SGLang пытается устранить разрыв в эффективности на полном цикле «обучение-RL-вывод», с которым сталкиваются текущие команды крупных моделей.

Способности новой модели Day-0 — это наглядное проявление инженерных достижений команды Infra.

25 апреля был выпущен сложный по архитектуре DeepSeek-V4. В тот же день SGLang и Miles обеспечили одновременную поддержку инференса и RL-обучения DeepSeek-V4. Это стало возможным благодаря системным оптимизациям на низком уровне, включая ShadowRadix-кэш префиксов, разработанный для гибридного внимания, Flash Compressor, выполняющий сжатие внутри одного чипа за один проход, и Lightning TopK, сокращающий задержку Top-K до 15 микросекунд, а также полную RL-цепочку от инференса FP8 до обучения BF16.

Поддержка полного стека консенсуса:

Крупные игроки массово входят на рынок — в чем их тревога?

NVIDIA, AMD, MediaTek, Broadcom, Intel — компании, играющие ключевую роль на аппаратном уровне, одновременно участвующие в семяном раунде, — это практически немыслимо в отрасли. Фактически, производители аппаратного обеспечения лучше всех понимают, что вычислительные мощности сегодня остаются дорогими и дефицитными, и простое наращивание аппаратных ресурсов уже не является устойчивым решением. Их самым срочным и главным требованием является открытая система вывода, которая действительно отделяет аппаратное обеспечение и позволяет максимально эффективно использовать производительность чипов на гетерогенных платформах.

Участие Databricks, создателей PyTorch и ключевых фигур из OpenAI / Thinking Machines / xAI свидетельствует о сильных ожиданиях в отношении инфраструктуры «обучение-вывод в одном флаконе». Каждое имя в ансамбле ангелов означает чрезвычайно точную точку зрения на ставку:

Чэнь Лиу, генеральный директор Intel, ветеран полупроводниковой отрасли с десятилетиями опыта.
Джон Шульман — бывший сооснователь OpenAI, сооснователь Thinking Machines Lab и один из основателей области усиленного обучения.
Соумит Чинтала — сооснователь PyTorch, страж глобальных фреймворков глубокого обучения.
Игорь Бабушкин, бывший сооснователь xAI, лично создал одну из самых сложных в отрасли систем обучения и аппаратных платформ.
Лилиан Вэнг, сооснователь Thinking Machines Lab, обладает наиболее актуальными представлениями о промышленном внедрении ИИ-систем.

Когда люди, способные самостоятельно обеспечить финансирование в любых условиях, выбирают коллективно появиться на одной и той же cap table, это — горячая ставка на будущее.

Инфраструктура для всех: сделаем строительство ИИ доступным не только для немногих

Видение RadixArk можно кратко описать одной фразой: сделать инфраструктуру ИИ такой же распространенной, надежной и недоступной для монополизации, как электричество. Это звучит как идеалистическое заявление, но на практике они превращают эту фразу в реальность:

Академическое сообщество

Три года назад у докторанта, занимавшегося оптимизацией вывода LLM, перед собой он видел всего два варианта: один — API OpenAI, оплачиваемый по токенам, без доступа к внутренней структуре; другой — устаревший открытый код, в README которого было написано «работает на одном GPU», что на годы отличалось от реальной распределённой среды, описанной в статье.

SGLang устраняет этот выбор между промышленной пропускной способностью в день и полностью открытым кодом — системы исследовательских групп Стэнфорда, Беркли, CMU и UW по умолчанию используют его в качестве базовой линии. Для исследователей, работающих с агентами, RadixAttention с кэшированием префиксов организует общие префиксы в виде древовидной структуры, вычисляя одинаковые ключи и значения только один раз: эксперименты, которые раньше занимали два дня, теперь выполняются за полдня, и ссылка на SGLang в локальных выводах статей стала практически стандартом.

Стартап

Группа инженеров, покинувших крупные компании, вышла на предпринимательскую деятельность, обладая глубоким пониманием определённой узкой области. У них не было бюджета в миллион долларов на вычислительные мощности, не было отдельной команды Infra — только интуиция к продукту.

Раньше создание производственных инференс-пайплайнов и поддержка совместимости с различным оборудованием накладывали чрезмерную инженерную нагрузку, превышавшую возможности стартапов на этапе seed-финансирования, заставляя тратить огромное количество времени на повторное изобретение колеса. Теперь они могут напрямую развернуть инференс-сервисы с производительностью, приближающейся к передовым показателям, поверх SGLang, используя Miles для обучения моделей, специфичных для их области — инфраструктура больше не является узким местом, и сэкономленное время и деньги можно полностью направить на создание того, что они действительно хотят построить.

Технологический гигант

Почему такие гиганты, как Google, Microsoft и NVIDIA, обладающие самыми мощными внутренними инфраструктурами в мире, также появились в списке пользователей SGLang? Ответ скрыт в структуре текущих инвесторов — пять ключевых производителей оборудования: NVIDIA, AMD, MediaTek, Broadcom и Intel одновременно вошли в проект. Они лучше всех понимают, что означает для всей экосистемы наличие открытой системы вывода, независимой от оборудования и не привязанной к какому-либо конкуренту. Использование открытой системы, поддерживаемой сообществом и несколькими производителями оборудования, — это стратегия инфраструктуры более высокого уровня.

Официальное заявление RadixArk не содержит эмоций, но достаточно пронзительно:

Следующее поколение ИИ не должно ограничиваться доступом к частной инфраструктуре. Более команды должны иметь возможность владеть своими моделями, своими системами, своим будущим.

Этот семя-финансовый раунд в 100 миллионов долларов направлен на превращение этой фразы в инженерную реальность: сделать SGLang стандартом производства для любых новых моделей с первого дня; превратить Miles в инфраструктурный фреймворк для масштабного обучения и RL; а затем построить на открытом ядре хостинг-платформу, которая не привязывает модели и не удерживает клиентов, но предоставляет возможности топового уровня.

Видение RadixArk никогда не заключалось в замене кого-либо. Оно заключается в том, чтобы дать академической лаборатории, небольшой команде из трех человек, стартапу, только что получившему семя-инвестиции, и гиганту с капитализацией в триллионы — равные стартовые условия на одной и той же инфраструктуре.

Если Anthropic в 2023 году, Mistral в 2024 году и Thinking Machines Lab в 2025 году каждая сделали ставку на определенное направление в слое AI-моделей, то RadixArk в 2026 году делает ставку на что-то более фундаментальное и долгосрочное: действительно вернуть право на создание передовых AI в руки достаточного числа людей.

После завершения финансирования команда инициировала акцию в поддержку открытого сообщества: участники, зарегистрировавшиеся на платформе и перепостившие твит, получат бесплатные кредиты на использование платформы RadixArk после её официального запуска. Для команды, выросшей из открытого сообщества, это способ выразить настоящую благодарность тем, кто поддерживал SGLang на протяжении всего пути до сегодняшнего дня.

Ссылка: platform.radixark.com

RadixArk привлекла 100 млн долларов в серии seed для создания инфраструктуры открытого ИИ следующего поколения

Лучший в мире движок для вывода выводов, в их руках

День 0: Освоение DeepSeek V4 с использованием обучения с подкреплением

Инфраструктура для всех: сделаем строительство ИИ доступным не только для немногих