NVIDIA RTX Spark переозначує AI-ПК з продуктивністю 1 петафлоп AI

За останні два роки виробники ПК під час просування «AI PC» постійно згадували один параметр: потужність NPU. Але незалежно від 45 TOPS у Intel Lunar Lake чи 50 TOPS у AMD Strix Point, ці цифри завжди залишалися на відносно помірному рівні. Вони дозволяють робити розмиття фону, зменшувати шум у голосі та запускати деякі невеликі моделі на пристрої, але все.

31 травня NVIDIA на конференції GTC 2026 представила суперчіп RTX Spark, що підняло цей показник до 1 петафлопа, тобто 1000 TOPS. Не на 30% чи 50% — а безпосередньо на порядок вище.

Також були опубліковані інші повідомлення: Microsoft оновила вбудовані механізми безпеки Windows у співпраці з RTX Spark і інтегрувала відкритий ізольований середовище виконання OpenShell від NVIDIA на платформі Windows; Adobe оголосила про повну перебудову Photoshop і Premiere з метою спеціальної адаптації до єдиної архітектури пам’яті RTX Spark; перші шість виробників OEM підтвердили, що восени цього року випустять тонкі та компактні настільні ПК з цим чіпом.

На цій GTC NVIDIA не випустила новий чіп. Вона намагається встановити новий апаратний стандарт для категорії «персонального AI-комп’ютера».

зображення

Коли GPU стає головною зіркою ПК

Спочатку розглянемо сам чіп. За даними, опублікованими NVIDIA на GTC, RTX Spark інтегрує GPU архітектури Blackwell з 6144 ядрами CUDA, а також 20-ядерний CPU Grace архітектури Arm, розроблений у співпраці з MediaTek, виготовлений за технологією TSMC 3 нм. Ключова зміна полягає в архітектурі пам’яті: до 128 ГБ уніфікованої пам’яті, яку спільно використовують CPU та GPU, — дані не потрібно переносити між ними.

Це протилежно логіці архітектури ПК у минулому.

Базова структура традиційного ПК — «x86 CPU як основний процесор, незалежний GPU як додатковий аксесуар». Навіть у сучасних концепціях AI PC Intel та AMD вбудовують NPU всередину CPU як додатковий модуль для прискорення AI, зі звичайною потужністю 40–50 TOPS. GPU залишається «зовнішнім пристроєм».

RTX Spark змінив баланс влади. Цей SoC перетворює GPU на головну фігуру, а CPU відходить на другий план. NVIDIA заявляє про AI-потужність 1 петафлоп FP4, що дорівнює 1000 TOPS — понад 20 разів більше, ніж у попереднього покоління AI PC з вбудованим NPU. Це не просто прискорення на тій самій трасі — це старт на іншій трасі.

Швидкість реакції виробників OEM підтверджує цей висновок. Згідно з офіційним повідомленням NVIDIA та подальшими матеріалами DIGITIMES, ASUS, Dell, HP, Lenovo, Microsoft Surface та MSI представлять у осінній період цього року тонкі та компактні настільні ПК з RTX Spark, а Acer та Gigabyte випустять свої моделі трохи пізніше. Майже всі основні бренди Windows PC вступили на ринок.

зображення

RTX Spark — це не продукт, створений з нуля. На початку 2025 року ті самі чіпси з ядрами Blackwell і Grace з’явилися під назвами Project DIGITS та DGX Spark, але тоді вони позиціонувалися як Linux-десктопні суперкомп’ютери для розробників, за розмірами нагадуючи невеликий стаціонарний комп’ютер. Через рік ця архітектура була втілена в просторі охолодження тонкого ноутбука, операційна система змінилася з Linux на Windows, а цільова аудиторія розширилася від розробників ШІ до звичайних споживачів і корпоративних клієнтів. Ось чому найважливішою зміною на споживчому випуску GTC 2026 є те, що NVIDIA не представляє іграшку для розробників, а відкриває двері ринку споживчої електроніки.

Чи достатньо запускати модель 120B локально?

Числа обчислювальної потужності та пам’яті в кінцевому підсумку повинні відповідати на питання: що це дозволяє робити?

На презентації NVIDIA зазначило, що RTX Spark підтримує локальне виконання великих моделей з 120 мільярдами параметрів, а віконтекст може досягати мільйона токенів. Що означає 120 мільярдів? Як порівняння, наразі стандартною практикою для локального запуску моделей на споживчому обладнанні є запуск моделей з 30–40 мільярдами параметрів на GPU RTX 4090 з 24 ГБ відеопам’яті за допомогою квантування. Деякі менші моделі, які швидко працюють на споживчих відеокартах, мають розмір 9 мільярдів параметрів. Цей стрибок від 9 до 120 мільярдів перезадає стандарт «достатньо» для AI на кінцевих пристроях.

128 ГБ уніфікованої пам’яті — це передумова всього цього. У традиційній архітектурі ПК ЦП має власну системну пам’ять, а ВП — власну відеопам’ять, між ними існує фізична межа. Модель, що перевищує об’єм відеопам’яті, або взагалі не запускається, або вимагає складного розбиття моделі та обміну пам’яттю, що різко знижує швидкість. Уніфікована архітектура пам’яті усунула цей обмеження: дані моделі безпосередньо розміщуються у спільному басейні на 128 ГБ, до якого мають доступ і ЦП, і ВП. Apple на Apple Silicon першою довела практичну доцільність цього технологічного напрямку для споживачів, а тепер NVIDIA перенесла його до екосистеми Windows.

Крім висновків великих моделей, до випадків використання, перелічених NVIDIA, належать редагування відео 12K, рендеринг 3D-сцен більше 90 ГБ та ігри з трасуванням променів зі швидкістю понад 100 кадрів на секунду при роздільній здатності 1440p. Спільною рисою цих сценаріїв є надзвичайно великий обсяг даних, що обробляються за один раз: традиційний ПК або потребує від кількох разів довшого часу очікування, або взагалі не може запустити їх.

Між «підтримкою виконання» та «плавною працездатністю» ще є відстань. NVIDIA не оприлюднила реальну швидкість висновку для моделі 120B на RTX Spark, а також не надала дані про затримку першого токена в сценаріях з мільйоном токенів у контексті. Ключовим показником, що визначає швидкість висновку при довгому контексті, є пропускна здатність пам’яті. Як зразок, DGX Spark з тими ж ядрами GB10 має реальну пропускну здатність пам’яті близько 301 ГБ/с. Цього рівня пропускної здатності достатньо для роботи з моделлю 120B, але при обробці контекстних вікон розміром у мільйон токенів користувачеві може знадобитися кілька секунд, щоб побачити перший вихідний токен. Версія RTX Spark для ноутбуків може мати ще нижчу реальну пропускну здатність через обмеження енергоспоживання.

Додайте безпечну клітку до AI-агенту

Ще одним ключовим оголошенням, окрім обчислювальної потужності, є співпраця NVIDIA та Microsoft на рівні системи. Ця частина, ймовірно, є найбільш незамітною, але найбільш впливовою для галузі в контексті споживчих оголошень GTC 2026.

Комп’ютер, здатний запускати модель розміром 120 млрд, якщо його використовує AI-агент, що може самостійно керувати робочим столом, натискати кнопки та читати/записувати файли, стає не просто питанням «чи втратяться дані», а питанням «чи зробить агент те, чого ви не хочете». Якщо цю проблему не вирішити, підприємства не зможуть розгорнути такі пристрої для співробітників.

Рішення Microsoft та NVIDIA — це дві лінії захисту. Перша: Microsoft оновила вбудовані механізми безпеки Windows, забезпечивши моніторинг та обмеження поведінки AI-агентів на рівні операційної системи. Друга: NVIDIA офіційно впровадила OpenShell Runtime на платформі Windows. Згідно з офіційною документацією NVIDIA, OpenShell — це відкритий шарований середовище виконання, яке забезпечує ізоляцію на рівні ядра. Він обмежує AI-агента певним контролюваним діапазоном дій: агент може автономно виконувати завдання в межах цього діапазону, але його права строго обмежені — він не може отримати доступ до системних файлів, мережевих з’єднань або конфіденційних даних користувача.

Значення цього комплекту для корпоративних закупівель очевидне. Раніше концепція «локального AI-агенту» залишалася на рівні технічних демонстрацій. Апаратне забезпечення працювало, але безпекові рамки були порожніми. Жоден корпоративний ІТ-відділ не наважувався включати такі пристрої до списку закупівель у такому стані. NVIDIA та Microsoft вставили між апаратним забезпеченням та застосунками стандартний ізоляційний шар, перетворивши «працює» на «керований».

Відкритий Shell має власну вартість продуктивності, яка є змінною, що потребує спостереження. Ізоляція в пісочниці зазвичай призводить до певної втрати продуктивності; наскільки це вплине на швидкість висновку або відгук системи, NVIDIA наразі не публікує даних. Складність розгортання на боку корпоративного ІТ-управління, сумісність із існуючими стратегіями безпеки — ці практичні питання, що виникають під час реалізації, можна буде перевірити лише після виходу пристроїв OEM.

Чому Adobe згодна «перебудувати з підвалин»

Ступінь співпраці виробника програмного забезпечення зазвичай є показником того, чи зможе нова апаратна платформа закріпитися.

Дії Adobe, оголошені під час GTC, є найбільшим сигналом щодо програмного забезпечення в цьому циклі випусків. За підтвердженням офіційного блогу NVIDIA та керівників Adobe, Adobe розпочав фундаментальну реконструкцію Photoshop і Premiere, спеціально адаптовану під єдину архітектуру пам’яті RTX Spark, заявивши, що продуктивність AI та графічної обробки може зростати до 2 разів.

«Реконструкція на нижньому рівні» — це не додавання плагіна чи створення шару сумісності. На традиційних ПК CPU та GPU мають власні простори пам’яті, і при обробці надвеликого файлу PSD або відеолінійки 8K дані постійно копіюються між двома системами пам’яті — це головне місце втрат продуктивності. Уніфікована пам’ять RTX Spark дозволяє CPU та GPU безпосередньо використовувати спільний простір об’ємом 128 ГБ, і ця зміна архітектури має реальну цінність для робочих процесів професійних творців. Adobe змінила базовий код, що свідчить про те, що вона визнає цей напрямок архітектури не разовою маркетинговою хитрістю.

Проте, яким є базовий показник для цього «2-кратного прискорення» — NVIDIA та Adobe не розголошили. Чи це порівняння з процесорами x86 того ж покоління разом із дискретною графічною картою, чи з рішенням NPU попереднього покоління AI PC? Результати будуть зовсім різними. До тих пір, поки умови тестування не будуть оприлюднені, ця цифра залишається під питанням.

Також підтримку оголошено для Blackmagic Design, ComfyUI, llama.cpp, OTOY та кількох ігрових компаній. Слід звернути увагу на підтримку ComfyUI та llama.cpp, оскільки це найактивніші відкриті інструменти для локальних AI-робочих процесів. Рання підтримка розробницького ком’юніті часто більш щиро відображає потенціал екосистеми платформи, ніж обіцянки великих компаній.

NVIDIA використовує екосистему CUDA та архітектуру уніфікованої пам’яті, щоб створити на платформі Windows досвід, подібний до того, що пропонує Apple зі своїм інтегрованим програмним та апаратним забезпеченням. Різниця полягає в тому, що стіна Apple побудована самими Apple, а NVIDIA має переконати Microsoft та ISV приєднатися до будівництва. Те, що Adobe згоден працювати з основ, хоча б свідчить про те, що перший кирпич цієї стіни вже покладено.

Поза паперовими параметрами

Повернемося до найбільш практичного питання: чи можна взагалі купити ці пристрої, і яким буде досвід їх придбання?

Згідно з інформацією, опублікованою NVIDIA, перші пристрої RTX Spark з’являться на ринку восени цього року і включатимуть тонкі та компактні настільні ПК від ASUS, Dell, HP, Lenovo, Microsoft Surface та MSI. Моделі від Acer та Gigabyte з’являться пізніше. Конкретні ціни та точні дати виходу всіх OEM-виробників не розголошуються.

Важливішими за ціну є кілька фізичних невідомих. Як забезпечити баланс споживання енергії та охолодження, коли чіп з потужністю 1 петафлоп вміщується в тонкий і легкий ноутбук? Якими є повсякденна продуктивність та тривалість роботи від батареї RTX Spark у не-AI сценаріях? Чи зменшиться реальна пропускна здатність 128 ГБ уніфікованої пам’яті у форм-факторі ноутбука через обмеження споживання енергії?

Це справжній випробування для індустріального впровадження. Пікові обчислювальні потужності чіпа на інженерному зразку та його реальна продуктивність протягом 8 годин на день у руках користувача — це часто дві різні речі. NVIDIA підкреслила енергоефективність RTX Spark на презентації, але не навела конкретних значень TDP або часу роботи від батареї.

З погляду структури індустрії ПК, з’явлення RTX Spark свідчить про формування нової моделі розподілу функцій. Протягом останніх тридцяти років ключове слово щодо ядерних чіпів ПК належало виробникам x86-процесорів, а виробники GPU, хоча й ставали все важливішими, завжди залишалися «додатковими пристроями, вставленими в материнську плату». Наведена NVIDIA цілий SoC, у якому CPU, GPU та контролер пам’яті повністю інтегровані; частина CPU на архітектурі Arm розроблена MediaTek. Структура влади в ланцюжку поставок ПК переходить від моделі «x86 CPU з опціональним GPU» до «SoC-платформи з центром на GPU».

Цей поворот не відбудеться за один день. Стратегія ціноутворення OEM, реальна ефективність продуктів, прогрес адаптації ПЗ ISV та цикл перевірки закупівель корпоративними клієнтами — кожен з цих етапів визначає, чи стане RTX Spark новою координатою індустрії ПК чи іншим технічним демонстраційним проектом з високим початком і низьким завершенням. Відповідь з’явиться не раніше осені цього року.