Інновації в моделях ШІ створюють нові можливості для інфраструктури ШІ

Стаття | Альфа-комітет

За останній час область AI-комунікацій стає все більш популярною.

З одного боку, стартапи зі сфері штучного інтелекту та мережевих комунікацій з Сіліконової долини постійно отримують величезні інвестиції, а з іншого — акції компаній зі сферою штучного інтелекту та мережевих комунікацій, особливо у сфері оптичних комунікацій, на вторинному ринку швидко зростають у ціні.

Чому зростає популярність AI-мережевого зв’язку? Суть у тому, що це підтримується попитом: розміри моделей постійно збільшуються, споживання токенів зростає, а обчислювальні ресурси стають дефіцитними. Щоб отримати більше обчислювальних потужностей з меншими витратами з боку обчислень, потрібно шукати рішення на рівні базових технологій.

Прискорення зв’язку між чіпами, прискорення зв’язку між вузлами та підвищення ефективності всієї інфраструктури обчислювальних потужностей — це шлях, який зараз перевіряється.

Компанія Upscale AI недавно привлекла значні інвестиції. У вересні 2025 року вона отримала 100 мільйонів доларів США у рамках посівного фінансування, яке спільно очолили Mayfield та Maverick Silicon, а також участь взяли StepStone Group, Celesta Capital, Xora, Qualcomm Ventures, Cota Capital, MVP Ventures та Стенфордський університет.

У січні 2026 року отримано додаткове фінансування серії A на суму 200 мільйонів доларів США, яке очолили Tiger Global, Premji Invest та Xora Innovation, а також участь Maverick Silicon, StepStone Group, Mayfield, Prosperity7 Ventures, Intel Capital та Qualcomm Ventures.

Недавно з’явилася інформація, що він веде переговори щодо нового раунду фінансування в розмірі від 180 до 200 мільйонів доларів США.

Великі параметри, MoE, довгі контексти, інновації в моделях змушують інновувати обчислювальні мережі ШІ

Підприємство, засноване менше року тому, чому вдалося отримати серію великих інвестицій, це пов’язано з його засновницькою командою. Насправді, Upscale AI була виведена з Auradine — це саме по собі є новітньою компанією з інфраструктури ШІ, яка зараз змінила назву на Velaura AI і присвячена наданню підтверджених інноваційних рішень для надзвичайно низького споживання енергії для хмарних, крайових та фізичних застосунків ШІ.

Барун Кар і Раджив К, фото: Upscale AI

Співзасновник і генеральний директор Upscale AI Барун Кар раніше був COO Auradine, а співзасновник і виконавчий голова Раджив К. раніше був CEO Auradine, зараз він також є генеральним директором Velaura AI. Технічний директор Upscale AI Пуніт Агарвал пропрацював десять років у Broadcom і був технічним директором відділу центрів обробки даних у Marvell.

Барун Кар і Раджив К. мали досвід роботи у великих корпораціях ще до свого попереднього стартапу — це команда з багаторічним досвідом у галузі.

AI-мережевий зв’язок, чому це важливо? Це треба починати з технічної основи.

Особливістю навантаження штучного інтелекту є висока синхронізація. Сучасні завдання, такі як навчання великих моделей, архітектура MoE та розподілений висновок, створюють високий тиск на мережу щодо синхронізації.

Під час навчання градієнти параметрів моделі повинні передаватися між тисячами GPU у високо синхронізованих хвилях; під час висновку обчислення створюють масштабний трафік з розгалуженням і висувають надзвичайно вимогливі вимоги до затримки.

Якщо мережа не встигає, GPU зупиняється і чекає, затримка постійно зростає, і ефективність обчислювального кластера руйнується.

Це невідповідність архітектури, яку не можна вирішити налаштуванням.

Традиційні мережі, що прагнуть до універсальності, зараз у сценаріях AI стають перешкодою через складність, введену сумісністю з різними навантаженнями. Детермінована комунікація та сильна синхронізація, необхідні для колективної комунікації GPU, перевищують межі проектування традиційних мереж.

Мережа, необхідна для кластерів штучного інтелекту, повинна підтримувати детерміновану, синхронізовану та високопропускну зв’язок у великомасштабних умовах.

AI-мережа повинна бути перебудована з підстав, з урахуванням реальних вимог до масштабування вгору та масштабування вбік.

Подальше деталізація та розбиття зводяться до моделі.

Зараз два характеристики моделі створюють особливо великий навантаження на мережу кластерів AI-обчислень. Одна з них — експоненційне збільшення розміру параметрів моделі, а інша — постійна еволюція довгих контекстів та CoT.

Наприклад, на основі недавно випущеного DeepSeek V4 Pro, його розмір становить 1,6 ТБ, а контекст досягає 1 М. Для розміру 1,6 ТБ потрібно 1,6 ТБ пам’яті, чого недостатньо на одному прискорювачі, тому його потрібно розділити на велику кількість прискорювачів для роботи, а міжчіпова комунікація стає швидким обмеженням.

Дуже довгі вікна контексту призводять до стрімкого зростання обсягу KV-кешу та перевищують обсяг пам’яті HBM однієї GPU. Це створює подвійний тиск на обсяг пам’яті та пропускну здатність зв’язку.

Не просто інновації на рівні чіпа, а повна стек-революція

Для навчання та плавного виведення моделей з великими параметрами та довгими вікнами контексту справжнім рішенням є переозначення «меж обчислень», щоб більше GPU можна було з’єднати за допомогою надшвидких мереж з затримкою на рівні субмікросекунд та високою пропускною здатністю колективної комунікації, щоб вважати їх одним «супер-GPU», і саме тоді з’явилася форма стелажу.

Наприклад, NVIDIA NVL72 більше не розглядає 72 GPU як окремі пристрої, а працює з ними як з єдиною машиной з єдиною пам’яттю, внутрішня пропускна здатність NVLink досягає 130 ТБ/с.

Тут вводяться два рівні з’єднання інфраструктури ШІ: між GPU на рівні стелажу (Scale-Up) і мережева структура на рівні кластера (Scale-Out).

Ці два рівні повинні працювати разом, щоб тисячі GPU працювали ефективно як єдиний розподілений обчислювальний двигун.

Для двох рівнів з’єднання інфраструктури ШІ, Upscale AI розробила мережеву архітектуру, створену спеціально для ШІ. Для міжкристалічного з’єднання ШІ (Scale-Up) вона має архітектуру чіпа SkyHammer, а для мережевої архітектури кластера ШІ (Scale-Out) — Open Ethernet.

SkyHammer — це архітектура чіпів, розроблена для подолання обмежень мережі Scale-Up AI, яка базується на відкритих стандартах і спрямована на забезпечення детермінованої затримки, екстремальної пропускної здатності та передбачуваної продуктивності в масштабах надвеликих систем, щоб GPU та XPU могли працювати разом як високо синхронізований обчислювальний двигун.

Однією з його особливостей є детермінована затримка, яка відображає час, необхідний для передачі даних між компонентами в стелажі, і може бути високо передбачувано контролюваною.

Джерело зображення: Upscale AI

SkyHammer побудований з ASIC-рівня, з цілісним спільним проектуванням на трьох рівнях: чіп, система та стелаж, щоб забезпечити синхронну роботу кожного рівня. Кожен елемент був перепроектований: від того, як дані потоком рухаються всередині чіпа, до того, як fabric адаптується під навантаження, і до того, як суперкластер зберігає передбачуваність навіть за високого рівня синхронізації.

Він підтримує нові стандарти, такі як ESUN, UEC, UALink, а також залишає простір для майбутніх інновацій. Завдяки гнучкій архітектурі SkyHammer може плавно адаптуватися до нових стандартів без перебудови чи компромісів, забезпечуючи взаємодію в відкритому та різноманітному середовищі, зберігаючи при цьому продуктивність.

Продукти на основі архітектури SkyHammer планують випустити у 2026 році.

Open Ethernet зосереджений на архітектурі AI-мереж на рівні кластера (Scale-Out). На рівні кластера AI-системам потрібні відкритість, взаємодія та величезна пропускна здатність.

Upscale AI створила оптимізовану під AI архітектуру Open Ethernet, яка буде побудована на базі Ethernet-перемикачів NVIDIA Spectrum-X та мережевої операційної системи SONiC із наданням повної підтримки.

Шляхом інтеграції нативних можливостей ASIC-телеметрії, детермінованої безвтратної поведінки Ethernet та стандартизованих мережевих робочих процесів галузі система забезпечує передбачувану продуктивність, спрощене обслуговування та високу надійність у масштабних сценаріях.

Коротко кажучи, він об’єднує тисячі GPU в єдину високопродуктивну мережу, що підтримує розподілене навчання та масштабні висновки.

Для цього проекту Upscale AI приєднався до NVIDIA Partner Network і тісно співпрацює з NVIDIA та її екосистемними партнерами, зосереджуючись на спільній роботі з відправними архітектурами та перевіреними дизайнами для прискорення розгортання мереж масштабних AI-центри даних.

Як видно, Upscale AI не обмежується створенням швидшого мережевого чіпа, а досягає тісного зв’язку між чіпом, системою та програмним забезпеченням. Для запуску великих AI-кластерів необхідно постійно контролювати стан переповнення, синхронізацію та використання GPU в усьому мережевому структурі.

Це включає: високопродуктивну RDMA-мережу, адаптивне керування перевантаженням, телеметрію та спостережуваність, орієнтовані на GPU, та реальний час візуалізації операцій по всій структурі мережі. Upscale AI оптимізує всі ці аспекти, створюючи детерміновану мережеву інфраструктуру, необхідну для роботи сучасних AI-обчислювальних кластерів.

Несумісність між вимогами до моделей та інфраструктурою для AI-обчислень створила багато можливостей для підприємництва

Інфраструктура для обчислювальних потужностей ШІ все ще має великий потенціал для розвитку. Насправді, вона може довгий час перебувати у стані почергового інноваційного розвитку разом із програмним забезпеченням ШІ, зокрема моделями. Коли архітектура моделі зазнає інновацій, а обчислювальна інфраструктура ШІ стикається зі структурною несумісністю у апаратному чи програмному забезпеченні, виникають нові можливості.

Зараз саме така ситуація: архітектура MoE, надвеликі параметри, наддовгі вікна контексту, та схильність агентів до споживання токенів — ці фактори разом створили дефіцит обчислювальних потужностей для ШІ, одночасно відкриваючи можливості для інновацій у інфраструктурі обчислювальних потужностей ШІ.

На рівні чіпів для обчислювальної потужності за останні півроку ми звертали увагу на Unconventional AI (збори 475 мільйонів доларів США), MatX (збори 500 мільйонів доларів США); у сфері AI-оптимізованих чіпів для проектування — Ricursive (збори 300 мільйонів доларів США), Cognichip (збори 60 мільйонів доларів США); а також у сфері мережевого зв’язку AI-центри обробки даних, наприклад, Upscale AI (вже зібрав 300 мільйонів доларів США, планує ще 200 мільйонів), Eridu (збори 200 мільйонів доларів США), Ethernovia (збори 90 мільйонів доларів США).

Китайські відкриті AI-моделі вже досягли світового лідерства, зокрема недавно випущена DeepSeek V4. У сфері AI-інфраструктури Китай ще перебуває на етапі переслідування, але це також свідчить про величезний потенціал для інновацій. Спостерігаючи за китайським венчурним ринком, можна побачити, що велика кількість інноваційних компаній вже з’явилася, і частина з них вже досягла початкового успіху.