NVIDIA RTX Spark redefine la PC de IA con un rendimiento de IA de 1 petaflop

En los últimos dos años, los fabricantes de PC han mencionado repetidamente un parámetro al promover las "PC con IA": la capacidad de cálculo del NPU. Pero ya sea los 45 TOPS del Intel Lunar Lake o los 50 TOPS del AMD Strix Point, estos números siempre se han mantenido en un nivel relativamente moderado: suficientes para desenfocar el fondo, reducir el ruido del audio y ejecutar algunos modelos pequeños en el dispositivo, pero nada más.

El 31 de mayo, NVIDIA presentó en la conferencia GTC 2026 el superchip RTX Spark, elevando esta cifra a 1 petaflop, es decir, 1000 TOPS. No se trató de un aumento del 30% o 50%, sino de un salto directo de un orden de magnitud.

También se anunciaron otros mensajes simultáneamente: Microsoft actualizó los mecanismos de seguridad nativos de Windows en colaboración con RTX Spark e integró el entorno de ejecución de sandbox de código abierto de NVIDIA, OpenShell, en la plataforma Windows; Adobe anunció que está reconstruyendo desde cero Photoshop y Premiere para adaptarse específicamente a la arquitectura de memoria unificada de RTX Spark; seis fabricantes OEM confirmaron que lanzarán laptops delgadas y escritorios compactos equipados con este chip en el otoño de este año.

Lo que NVIDIA hizo en esta GTC no fue lanzar un nuevo chip. Está intentando establecer un nuevo estándar de hardware para la categoría de "computadora de IA personal".

imagen

Cuando la GPU se convierte en el protagonista de la PC

Primero, veamos el propio chip. Según los datos publicados por NVIDIA en GTC, RTX Spark integra una GPU de arquitectura Blackwell con 6144 núcleos CUDA, acompañada por una CPU Grace de 20 núcleos Arm diseñada en colaboración con MediaTek, fabricada con el proceso de 3 nm de TSMC. El cambio clave radica en la arquitectura de memoria: hasta 128 GB de memoria unificada, donde la CPU y la GPU comparten el mismo pool de memoria, eliminando la necesidad de transferir datos entre ambos.

Esto es lo opuesto a la lógica de arquitectura de las PC anteriores.

La estructura básica de las PC tradicionales es “CPU x86 como procesador principal y GPU independiente como accesorio opcional”. Incluso en el reciente concepto de PC de IA, Intel y AMD han optado por integrar una NPU dentro de la CPU como módulo adicional para aceleración de IA, con un rendimiento generalmente de cuarenta a cincuenta TOPS. La GPU sigue siendo un “dispositivo externo”.

RTX Spark ha reasignado el protagonismo. Este SoC convierte a la GPU en el centro de atención y relega a la CPU a un papel secundario. NVIDIA ofrece una capacidad de cómputo de IA de 1 petaflop FP4, equivalente a 1000 TOPS, más de 20 veces la capacidad del NPU integrado en la generación anterior de PC de IA. Esto no es un aumento de velocidad en la misma pista, sino el inicio de una pista completamente diferente.

La velocidad de seguimiento de los fabricantes OEM confirma esta evaluación. Según el anuncio oficial de NVIDIA y los informes posteriores de DIGITIMES, ASUS, Dell, HP, Lenovo, Microsoft Surface y MSI lanzarán laptops delgadas y ordenadores de escritorio compactos con RTX Spark este otoño, seguidos por modelos de Acer y Gigabyte. Casi todas las marcas principales de PC con Windows están participando.

imagen

RTX Spark no es un producto nacido desde cero. A principios de 2025, el mismo chip con núcleos Blackwell y Grace se presentó bajo los nombres Project DIGITS y DGX Spark, pero en ese momento se posicionaba como una supercomputadora de escritorio para desarrolladores con Linux, con un tamaño cercano al de una pequeña computadora de escritorio. Un año después, esta arquitectura se redujo para caber en el espacio de disipación de calor de una laptop delgada y ligera, el sistema operativo pasó de Linux a Windows, y el público objetivo se amplió desde desarrolladores de IA hasta consumidores y empresas comunes. Este es el cambio más notable en el lanzamiento de consumo en GTC 2026: NVIDIA no está lanzando un juguete para desarrolladores, sino abriendo la puerta al mercado de consumo.

¿Es suficiente ejecutar un modelo de 120B en local?

¿Qué puede hacerse finalmente con los números de potencia de cálculo y memoria?

La respuesta proporcionada por NVIDIA en el lanzamiento fue que RTX Spark admite la ejecución local de modelos grandes de 120 mil millones de parámetros, con una ventana de contexto que puede alcanzar hasta un millón de tokens. ¿Qué significa 120B? Como referencia, la práctica actual más común en hardware de consumo para ejecutar modelos localmente es que una GPU RTX 4090 con 24 GB de memoria VRAM, mediante cuantización y compresión, puede ejecutar modelos de 30B a 40B parámetros. Algunos modelos más pequeños pueden ejecutarse rápidamente en tarjetas gráficas de consumo, como los modelos de 9B. El salto desde 9B hasta 120B redefine el umbral de “suficiente” para la IA en el extremo.

128 GB de memoria unificada es el requisito previo para todo esto. En la arquitectura tradicional de PC, la CPU tiene su propia memoria del sistema y la GPU tiene su propia memoria dedicada, con una frontera física entre ambas. Un modelo más grande que la capacidad de la memoria dedicada o bien no puede ejecutarse en absoluto, o requiere una compleja división del modelo e intercambio de memoria, lo que reduce drásticamente la velocidad. La arquitectura de memoria unificada elimina este cuello de botella, permitiendo que los datos del modelo se almacenen directamente en un pool compartido de 128 GB al que pueden acceder tanto la CPU como la GPU. Apple demostró por primera vez la viabilidad de esta ruta tecnológica para el consumidor en Apple Silicon, y ahora NVIDIA la lleva al ecosistema Windows.

Además de la inferencia de modelos grandes, los casos de uso enumerados por NVIDIA incluyen edición de video 12K, renderizado de escenas 3D superiores a 90 GB y juegos con ray tracing a más de 100 fps en resolución 1440p. La característica común de estos escenarios es que procesan cantidades masivas de datos en una sola operación; las PC tradicionales requieren tiempos de espera varias veces mayores o simplemente no pueden ejecutarlos.

Aún hay una distancia entre “soporte de ejecución” y “funcionamiento fluido”. NVIDIA no ha publicado la velocidad real de inferencia del modelo de 120B en RTX Spark ni los datos de latencia del primer token en escenarios con contexto de millones de tokens. El indicador clave que determina la velocidad de inferencia con contexto largo es el ancho de banda de memoria. Como referencia, el DGX Spark, que también utiliza el núcleo GB10, ha demostrado un ancho de banda de memoria de aproximadamente 301 GB/s en pruebas reales. Este nivel de ancho de banda es suficiente para ejecutar un modelo de 120B, pero al procesar ventanas de contexto a nivel de millones de tokens, los usuarios podrían tener que esperar varios segundos para ver el primer token de salida. La versión portátil de RTX Spark podría tener un ancho de banda real ajustado debido a limitaciones de consumo energético.

Añadir una jaula de seguridad a los agentes de IA

Otro lanzamiento central, además del poder de cómputo, es la colaboración entre NVIDIA y Microsoft a nivel de sistema. Esta parte podría ser el contenido más fácilmente pasado por alto, pero de mayor impacto para la industria, en el lanzamiento al consumidor de GTC 2026.

Una computadora capaz de ejecutar un modelo de 120B, si se le entrega a un agente de IA que puede operar de forma autónoma el escritorio, hacer clic en botones y leer/escribir archivos, el riesgo de seguridad ya no es del nivel de “¿se perderán los datos?”, sino de “¿el agente realizará acciones que no deseas?”. Sin resolver este problema, las empresas no podrán desplegar este tipo de dispositivos para sus empleados.

Las soluciones proporcionadas por Microsoft y NVIDIA constituyen dos líneas de defensa. La primera, Microsoft actualizó los mecanismos de seguridad nativos de Windows, brindando monitoreo y restricciones a nivel del sistema operativo para las acciones de los agentes de IA. La segunda, NVIDIA introdujo oficialmente el entorno de ejecución OpenShell en la plataforma Windows. Según la documentación oficial de NVIDIA, OpenShell es un entorno de ejecución de sandbox de código abierto que ofrece aislamiento a nivel de kernel. Este entorno delimita un rango de operaciones controlado para los agentes de IA, permitiéndoles ejecutar tareas de forma autónoma dentro de esos límites, pero con permisos estrictamente restringidos que les impiden acceder a archivos centrales del sistema, conexiones de red o datos sensibles del usuario.

El significado de esta combinación para la adquisición empresarial es claro. Antes de esto, el concepto de "agente de IA local" se limitaba a demostraciones técnicas. El hardware funcionaba, pero el marco de seguridad estaba vacío. Ningún departamento de TI empresarial se atrevería a incluir dispositivos en este estado en su lista de adquisiciones. NVIDIA y Microsoft insertaron una capa estandarizada de aislamiento entre el hardware y la aplicación, transformando lo "funcional" en lo "gestionable".

El overhead de rendimiento de OpenShell es una variable que debe observarse. La aislamiento en sandbox generalmente conlleva cierta pérdida de rendimiento; sin embargo, NVIDIA no ha publicado datos sobre el impacto exacto en la velocidad de inferencia o la respuesta del sistema. La complejidad de implementación en la gestión de TI empresarial y la compatibilidad con las políticas de seguridad existentes son problemas prácticos que solo se podrán validar una vez que los dispositivos OEM estén disponibles en el mercado.

¿Por qué Adobe está dispuesta a "reconstruir desde cero"?

El grado de cooperación del proveedor de software suele ser un indicador de si una nueva plataforma de hardware puede establecerse con éxito.

Las acciones anunciadas por Adobe durante la GTC son la señal más significativa en el lado del software de esta ronda de lanzamientos. Según el blog oficial de NVIDIA y la confirmación de los ejecutivos de Adobe, Adobe ha iniciado una reestructuración fundamental de Photoshop y Premiere, optimizadas específicamente para la arquitectura de memoria unificada RTX Spark, afirmando que el rendimiento de IA y procesamiento gráfico puede mejorar hasta en un 200 %.

La "reestructuración de la capa subyacente" no se trata de agregar un complemento ni crear una capa de adaptación. En las PC tradicionales, la CPU y la GPU tienen espacios de memoria separados; al procesar un archivo PSD extremadamente grande o una línea de tiempo de video 8K, los datos deben transferirse repetidamente entre ambos sistemas de memoria, lo que representa un punto crítico de desperdicio de rendimiento. La memoria unificada de RTX Spark permite que la CPU y la GPU compartan directamente un mismo espacio de 128 GB; este cambio arquitectónico tiene un valor real para el flujo de trabajo de creadores profesionales. Que Adobe haya modificado su código subyacente demuestra que reconoce esta dirección arquitectónica como algo más que una estrategia de marketing puntual.

Sin embargo, neither NVIDIA nor Adobe has disclosed what the benchmark is for this "2x acceleration." Is it compared to a same-generation x86 processor with a dedicated GPU, or to the NPU solution of the previous generation of AI PCs? The results differ drastically. Until the benchmark conditions are made public, the validity of this figure remains questionable.

También se anunció el soporte de Blackmagic Design, ComfyUI, llama.cpp, OTOY y varios estudios de juegos. Es notable el respaldo de ComfyUI y llama.cpp, ya que son las herramientas de código abierto más activas en los flujos de trabajo de IA locales. El apoyo temprano de la comunidad de desarrolladores suele reflejar más auténticamente el potencial ecológico de una plataforma que los compromisos de grandes empresas.

NVIDIA está utilizando el ecosistema CUDA y la arquitectura de memoria unificada para construir una experiencia similar a la integración de hardware y software de Apple en el ecosistema Windows. La diferencia es que el muro de Apple lo construyó por sí mismo, mientras que NVIDIA necesita convencer a Microsoft y a los ISV de que lo construyan juntos. Que Adobe esté dispuesto a actuar desde la base indica al menos que se ha colocado la primera piedra de este muro.

Más allá de los parámetros en papel

Volver a una pregunta más práctica: ¿realmente se pueden comprar estos dispositivos y qué experiencia se tiene al adquirirlos?

Según la información publicada por NVIDIA, los primeros dispositivos RTX Spark estarán disponibles en el otoño de este año, incluyendo laptops delgadas y portátiles compactos de ASUS, Dell, HP, Lenovo, Microsoft Surface y MSI. Los modelos de Acer y Gigabyte seguirán posteriormente. No se han revelado los precios específicos ni las fechas exactas de lanzamiento para ninguno de los OEM.

Más cruciales que el precio son varias incógnitas a nivel físico. ¿Cómo equilibrar el consumo de energía y la disipación térmica al integrar un chip de 1 petaflop de potencia de cómputo en una laptop delgada y ligera? ¿Cómo es el rendimiento diario y la duración de la batería de RTX Spark en escenarios no relacionados con IA? ¿La ancho de banda real de 128 GB de memoria unificada en una forma de laptop se reducirá notablemente debido a limitaciones de consumo de energía?

Estas preguntas son la verdadera prueba de la implementación industrial. El rendimiento pico de un chip en un prototipo de ingeniería y su desempeño real durante 8 horas diarias en manos del consumidor suelen ser dos cosas distintas. NVIDIA enfatizó en el lanzamiento la eficiencia energética de RTX Spark, pero no proporcionó valores específicos de TDP ni datos de autonomía.

Desde la perspectiva del panorama de la industria de la PC, la aparición de RTX Spark marca la formación de un nuevo modelo de división del trabajo. Durante los últimos treinta años, el control sobre los chips principales de la PC ha estado en manos de los fabricantes de procesadores x86; aunque las empresas de GPU se han vuelto cada vez más importantes, siempre han sido consideradas “componentes insertados en la placa base”. NVIDIA presenta ahora un SoC completo, con el CPU, el GPU y el controlador de memoria completamente integrados; la parte CPU basada en Arm fue diseñada por MediaTek. La estructura de poder en la cadena de suministro de la PC está pasando de “CPU x86 más GPU opcional” a “plataforma SoC centrada en GPU”.

Este cambio no se completará en un solo día. La estrategia de precios del OEM, el rendimiento real de eficiencia energética del producto, el progreso de la adaptación del software ISV y el ciclo de validación de compra del cliente empresarial: cada uno de estos aspectos determinará si RTX Spark se convierte en un nuevo punto de referencia para la industria de la PC o en otra demostración técnica con un inicio alto y un desempeño bajo. La respuesta no llegará hasta el otoño de este año.