La competencia en la infraestructura de IA se está extendiendo desde las GPU hasta el componente de memoria. La startup de chips XCENA, con operaciones en Corea del Sur y Estados Unidos, completó una ronda B de 135 millones de dólares, con una valoración posterior a la inversión de 570 millones de dólares. La empresa considera que la presión de costos en la fase de inferencia de la IA generativa no proviene solo de los chips de procesamiento, sino también del proceso repetitivo de transferencia de datos entre CPU, GPU y memoria.
La valoración tras la financiación aumentó a 570 millones de dólares
Tras esta ronda de financiación, XCENA ha recaudado un total de 185 millones de dólares. La empresa fue fundada conjuntamente por el CEO Jin Kim, el CTO Dohun Kim y el CPO Harry Juhyun Kim, quienes anteriormente trabajaron en Samsung Electronics y SK Hynix. Ambas empresas son proveedores principales de chips de almacenamiento a nivel mundial y forman parte clave de la cadena de suministro de GPU de NVIDIA.
TechCrunch informa que XCENA considera que la inferencia de IA está pasando de un "problema de potencia de cómputo" a un "problema de expansión de memoria". A medida que los modelos llaman a los contextos, cachés y procesos de preprocesamiento para generar cada token, los datos se transfieren constantemente entre diferentes chips, generando retrasos adicionales, consumo de energía y costos de hardware.
El chip mueve parte del cálculo cerca de la memoria.
El producto de XCENA se llama MX1 y actualmente aún está en fase de prototipo. Este chip se conecta al CPU mediante CXL, transfiriendo parte de las tareas de procesamiento de datos a una ubicación más cercana a la DRAM, reduciendo así el intercambio de datos entre el CPU, la GPU y la memoria.
La empresa afirma que estas tareas incluyen preprocesamiento, gestión de caché KV y caché de datos. Según ellos, el trabajo que originalmente podría requerir 10 servidores tiene la posibilidad de reducirse a un solo servidor en ciertos escenarios. Sin embargo, este efecto aún necesita ser validado mediante una implementación a gran escala.
Plan de producción en masa para finales de 2026
XCENA espera que los chips en producción masiva salgan de la línea de fabricación de Samsung Foundry a finales de 2026 y comiencen a generar ingresos en 2027. Los clientes actuales de la empresa son proveedores de nube de gran escala que invierten cientos de miles de millones de dólares anuales en infraestructura de IA, ya que incluso un pequeño aumento en la eficiencia de memoria podría generar ahorros de costos de decenas de millones de dólares.
La empresa indicó que, desde el segundo semestre del año pasado, la demanda del mercado por soluciones relacionadas con la memoria ha aumentado notablemente, y actualmente ha establecido contactos iniciales con varios fabricantes globales de almacenamiento, aunque no reveló los nombres específicos.
Los competidores incluyen Astera Labs y Marvell
En el panorama competitivo, XCENA considera a Astera Labs y Marvell como competidores cercanos. Ambas empresas están impulsando soluciones de interconexión de memoria de próxima generación, y Marvell ya es una empresa establecida y cotizada.
XCENA considera que sus diferencias clave radican en la arquitectura interna del chip. La empresa afirma que su solución se basa en RISC-V, utiliza numerosos núcleos pequeños de procesamiento de datos, y ha desarrollado internamente la jerarquía de memoria, el bus de interconexión y el controlador DRAM, en lugar de externalizar estos componentes a terceros.
Esta ronda de financiación fue liderada conjuntamente por los fondos de capital de riesgo coreanos Altinum e IMM Investment, con la participación de Corstone Asia y los accionistas existentes SBI Investment y Future Asset Capital. XCENA actualmente tiene oficinas en Banqiao, Corea, y Sunnyvale, Estados Unidos, con más de 90 empleados en total, y está en conversaciones con inversores internacionales sobre futuras rondas de financiación.
