Los modelos de IA chinos reducen costos y superan a sus competidores estadounidenses en eficiencia de entrenamiento e inferencia

DeepSeek entrenó su modelo V3 por aproximadamente $5,58 millones. Para contexto, sus competidores estadounidenses gastan habitualmente decenas a cientos de millones en modelos de vanguardia.

En mayo de 2026, DeepSeek redujo permanentemente los precios de su modelo V4-Pro en un 75%. Los costos de entrada en caché bajaron hasta tan solo 0,025 RMB por millón de tokens.

DeepSeek no está solo en esta carrera hacia el fondo. Se informa que la empresa china 01.ai ofrece inferencia a aproximadamente 14 centavos por millón de tokens, posicionando los precios de las API chinas como los más bajos del mundo.

Los modelos de IA chinos en OpenRouter han logrado un crecimiento de 5 veces en volumen, impulsado casi en su totalidad por sus ventajas de costo frente a las alternativas estadounidenses.

Anuncio

Cómo lo están haciendo

Los desarrolladores chinos han construido arquitecturas MoE dispersas que reducen la activación de parámetros de 671 mil millones a solo 37 mil millones. Esto se traduce en reducciones de costos de cómputo del 90-97% en la capa de inferencia.

Más allá de la arquitectura, los equipos chinos han adoptado métodos de entrenamiento de menor precisión como FP8, que reduce la demanda computacional de cada cálculo individual.

El modelo de razonamiento R1 de DeepSeek fue entrenado por solo $294,000, utilizando 512 chips H800 durante 80 horas.

Nacido de la restricción

Desde 2023, las restricciones de exportación de EE. UU. han limitado el acceso de las empresas chinas al hardware de gama alta de Nvidia. El H100 y sus sucesores están efectivamente prohibidos. Los desarrolladores chinos han estado trabajando con el H800, un chip reducido diseñado para cumplir con las normas de exportación.

Los principales actores chinos que abarcan esta frontera de eficiencia incluyen a Qwen de Alibaba, Kimi de Moonshot AI, GLM de Zhipu AI, Doubao de ByteDance, junto con DeepSeek.

Qué significa esto para los inversores

Si el rendimiento de vanguardia en IA es alcanzable con costos de entrenamiento inferiores a 6 millones de dólares en lugar de más de 100 millones, la ventaja competitiva en gastos de capital alrededor de los líderes estadounidenses en IA comienza a parecer más delgada.

Para el ecosistema cripto y Web3, la inferencia más económica reduce directamente el costo de ejecutar aplicaciones descentralizadas impulsadas por IA, redes oráculo y herramientas de análisis en cadena.

Las reducciones del 97% en el cómputo que los desarrolladores chinos están logrando mediante arquitecturas MoE dispersas no son solo hitos técnicos. Son señales de precio, y los mercados eventualmente siguen las señales de precio.