Guerra de IA: Las tres capas de cómputo, modelos y control de flujo de trabajo

iconMetaEra
Compartir
AI summary iconResumen
La competencia finalmente se centró en la lucha por el control de tres frentes: la capa de capacidad de cómputo (carrera armamentista de CAPEX, $805 mil millones/año), la capa de modelos (competencia de investigación y desarrollo entre Anthropic/OpenAI/Google) y la capa de flujos de trabajo (batalla por el punto de entrada entre Cursor/Copilot y SaaS empresarial). El verdadero foso competitivo solo se forma en la última capa: quien controle los flujos de trabajo, controlará la rueda de datos y tendrá una ventaja estructural en la próxima iteración de modelos. El precio de adquisición de Cursor de $60 mil millones es, en esencia, el último punto de referencia del mercado para valorar el "control de los flujos de trabajo", y este precio sigue aumentando.

Autor del artículo, fuente: SkillsMaster

Introducción: Tres frentes de batalla y una proposición central

En 2026, se está produciendo la mayor concentración de capital en la historia de la humanidad. Los seis principales gigantes tecnológicos estadounidenses invertirán este año $805 mil millones (aproximadamente 5.8 billones de yuanes chinos) en infraestructura de IA: una cifra que supera el PIB anual de la mayoría de los países y es más del doble del gasto militar total de Estados Unidos en 2023.

Mientras tanto, SpaceX adquirió Cursor (una herramienta de programación de IA que hace tres años tenía una valoración de solo $59 millones) mediante una operación totalmente en acciones por $600 mil millones, cerrando el acuerdo el cuarto día después del IPO de SpaceX, lo que provocó un aumento del 17% en un solo día para SPCX y una capitalización bursátil temporal que superó a Microsoft. Los ingresos anualizados de Anthropic aumentaron de $10 mil millones a $470 mil millones en 16 meses, a pesar de que la empresa nunca ha logrado una ganancia trimestral, y su valoración ya se acerca a $965 mil millones.

Detrás de estos eventos se encuentra la misma guerra en diferentes frentes. Este artículo desglosa la guerra en tres campos independientes pero interdependientes: la carrera de armamentos CAPEX en la capa de capacidad de cómputo, la competencia de investigación y desarrollo en la capa de modelos, y la lucha por la entrada en la capa de flujos de trabajo. La tesis central es que la ventaja competitiva tiene una intensidad completamente distinta en cada una de las tres capas, y la mayoría de los participantes del mercado concentran su atención en el nivel incorrecto.

Capítulo 1: Capa de poder de cómputo: La carrera armamentista de $805 mil millones en CAPEX

La capa de poder de cómputo es la base material de esta guerra y la barrera de entrada. En 2023, los seis grandes jugadores estadounidenses (Amazon AWS, Google Alphabet, Microsoft Azure, Meta, Oracle Cloud, CoreWeave) sumaron un CAPEX de $146 mil millones; se prevé que en 2026 sea de $805 mil millones, un aumento del 451% en tres años.

1.1 Economía del token: Cada token es una unidad de beneficio

Jensen Huang presentó en GTC Taipei 2026 la lógica económica central de las fábricas de IA: la capacidad de cómputo como ingreso, ya que cada Token es ingreso y cada Token es ganancia. Esta lógica transforma el GCE en "inversión en capacidad productiva"—como construir más líneas de producción en una fábrica. El gasto de capital por GW en una fábrica de IA ya alcanza los $500-800 mil millones, y el sistema de rack NVIDIA Vera Rubin NVL72 reduce los costos de inferencia en un factor de 10 en comparación con Blackwell, reforzando aún más este modelo económico.

1.2 Presión de capital: ¿Qué significa una tasa de reinversión del 128%?

En 2023, el CAPEX de estas seis empresas representó solo el 40% del flujo de efectivo operativo, con una gran cantidad de efectivo destinado a recompras de acciones y dividendos. En 2026, esta proporción superó el 100%, lo que significa que los flujos de efectivo operativos ya no son suficientes para cubrir los gastos de infraestructura, obligando a las empresas a recurrir a financiamiento externo. La financiación de capital de $847.5 mil millones de Alphabet (junio de 2026), que emplea una estructura de capital múltiple ($400 mil millones en acciones preferentes convertibles + $100 mil millones en bonos sin cupón + $347.5 mil millones en acciones ordinarias y preferentes), es precisamente el producto directo de esta presión y la mayor financiación de capital individual de la historia. 2

La ventaja competitiva de la capa de poder de cómputo es real, pero es una barrera de entrada, no una ventaja diferenciadora. Quien posee poder de cómputo solo obtiene la "licencia para participar", pero no puede ganar la competencia final con ello.

1.3 La paradoja estratégica de la capa de hash rate: NVIDIA 2026 YTD -18.9%

Los datos de precios de las acciones de M7 (al 18 de junio de 2026) revelan una contradicción estructural: NVIDIA es el beneficiario más directo de la carrera de CAPEX, pero su precio de acciones ha caído un 18,9% desde principios de 2026, siendo la mayor caída entre las M7. El mercado está preciando un riesgo a largo plazo: el CAPEX masivo de los compradores aguas abajo, gran parte del cual se destina a construir rutas propias de ASIC que eviten a NVIDIA (AWS Trainium, Google TPU v7, Microsoft Maia). El desempeño de CoreWeave (+240%) y Micron (+259%) (2026 YTD) refleja la evaluación del mercado de capitales sobre los beneficiarios del segmento intermedio de la cadena de suministro de IA.

Capítulo 2: Capa de modelos: Competencia en I+D y la "ilusión del foso de defensa"

Si la capa de poder de cómputo determina quién tiene derecho a participar, y la capa de modelo determina quién lidera al inicio de la competencia, los datos de Sensor Tower ya han demostrado que la ventaja de la capa de modelo no puede convertirse en un bloqueo sostenible de usuarios.

2.1 La cuota de ChatGPT se reduce a la mitad: el reconocimiento de marca no equivale a la fidelización de usuarios

ChatGPT pasó de aproximadamente el 85% de cuota global en mayo de 2023 a aproximadamente el 43% en mayo de 2026, una caída de más de 40 puntos porcentuales, sin ninguna recuperación en todo el camino. Esta curva transmite una señal clave: el efecto de red de los LLM de consumo es extremadamente débil. Los usuarios cambian según la utilidad inmediata, sin bloqueo social del tipo "mis amigos están aquí, así que yo también estoy aquí", ni una biblioteca de contenido acumulada durante años (como la biblioteca de películas de Netflix).

En enero de 2025, el lanzamiento de DeepSeek provocó la fluctuación individual más pronunciada en toda la serie temporal: ChatGPT perdió aproximadamente 10 puntos porcentuales en cuestión de semanas. Esto indica que una alternativa abierta, gratuita y de rendimiento comparable es suficiente para reasignar a decenas de millones de usuarios en un tiempo extremadamente corto. El costo de cambio para los usuarios finales de LLM es prácticamente cero.

2.2 La paradoja de Anthropic: empresa con pérdida valorada en $1 billón

Anthropic nunca ha logrado una ganancia trimestral desde su fundación en 2021, quemando $56 mil millones en efectivo en 2024 (margen bruto del -94%), pero con una valoración estimada de $9,650 mil millones en la mitad de 2026 (Serie H). Los ingresos anualizados aumentaron de $10 mil millones en enero de 2025 a $470 mil millones en mayo de 2026: un crecimiento de 47 veces en 16 meses.

La lógica de esta valoración no se basa en las ganancias actuales, sino en el doble bloqueo creado por la integración de API empresarial: el 80% de los ingresos provienen de clientes empresariales, y las bases de código, sistemas de cumplimiento y procesos de producto de más de 300,000 clientes comerciales ya están profundamente integrados en la API de Claude. El costo de cambio ya no es una cuestión de "¿qué modelo es mejor?", sino de "el costo de ingeniería de reestructurar toda la integración", un costo que a menudo supera con creces la diferencia en rendimiento del modelo.

La ventaja competitiva de la capa del modelo es temporal: cada lanzamiento de un nuevo modelo cada 6-12 meses puede eliminar cualquier ventaja de rendimiento. Lo que realmente crea fidelización es el flujo de trabajo y la integración de datos construidos sobre el modelo.

Capítulo 3: Capa de flujo de trabajo: La competencia entre Cursor, Copilot y la entrada de SaaS empresarial

La capa de flujo de trabajo es la que tiene el foso más profundo y la duración más larga de los tres campos de batalla. Entrar en un flujo de trabajo significa ingresar al entorno donde los usuarios trabajan 8 horas al día; una vez establecidos los hábitos, acumulados los datos e integrados los procesos, el costo de reemplazo se eleva de "si el modelo es fácil de usar" a "la reconstrucción de todo el sistema de trabajo".

3.1 Caso Cursor: Experimento límite de la viscosidad del flujo de trabajo

Análisis de caso profundo | SpaceX adquiere Cursor por $600 mil millones: desde $59 millones en Seed hasta la adquisición más cara de una herramienta de IA de la historia

Cursor fue creado en 2023 por cuatro estudiantes universitarios del MIT a partir de una bifurcación de VS Code, revolucionando el paradigma de interacción entre desarrolladores y código con un flujo de trabajo llamado "Vibe Coding": los desarrolladores ya no necesitan manejar sintaxis de bajo nivel, sino que realizan orquestación de alto nivel con asistencia de IA. En su pico, Cursor representó el 41% del mercado de herramientas de programación con IA y contribuyó con aproximadamente la mitad de los ingresos de la API de Anthropic Claude.

3.2 Tensión mortal entre la viscosidad del flujo de trabajo y la dependencia del modelo

La lección más importante del caso Cursor no radica en su éxito, sino en su fragilidad estructural. Después de que Anthropic cortara el acceso a Claude en 2026, la cuota de mercado de Cursor en programación con IA cayó de un 41% a un 26%. Este evento reveló claramente: la adherencia de los flujos de trabajo en la capa de aplicación depende de la estabilidad del suministro en la capa del modelo; una vez que el proveedor subyacente retoma el control, cualquier adherencia de flujo de trabajo, por fuerte que sea, se desvanece al instante.

SpaceX adquiere por una operación de 600 mil millones de dólares en acciones, lo que esencialmente resuelve este riesgo de oferta mediante la integración del modelo Grok de xAI y el supercomputador Colossus de Memphis (uno de los mayores clusters de GPU del mundo), internalizando la oferta de modelos, al tiempo que conserva los enormes datos de decisiones de código real de desarrolladores acumulados por Cursor. La generación de código es el escenario de mayor valor para los LLM, y estos datos tienen un valor irremplazable para la mejora continua de los modelos de xAI. 2

3.3 Microsoft Copilot: ventaja sistemática en los canales de distribución

La estrategia de flujo de trabajo de Microsoft sigue un camino completamente diferente al de SpaceX/Cursor. Copilot no depende del crecimiento orgánico impulsado por la experiencia del producto, sino que logra una penetración forzada a través de los 345 millones de suscriptores pagos de Microsoft 365. Los ingresos anualizados de GitHub Copilot ya superan los $2 mil millones (2026), con una tasa de renovación empresarial superior al 85%.

Más importante aún es la ventaja de datos de Microsoft: los flujos de trabajo empresariales acumulados a través de productos como Office, Teams y Outlook generan una capacidad de comprensión contextual que cualquier herramienta de IA independiente difícilmente puede replicar. Cuando Copilot puede citar las actas de una reunión de Teams del día anterior dentro de un documento de Word, al mismo tiempo que relaciona la cadena de correos electrónicos relevante en Outlook, el costo de cambio se eleva de una "sustitución de software" a una "interrupción de la memoria de trabajo".

3.4 Capa empresarial SaaS: Salesforce, Workday y entradas de IA vertical

La competencia en la capa de flujos de trabajo no se limita a las herramientas de IA general. Las empresas tradicionales de SaaS están integrando capacidades de LLM en sus productos principales, creando controles de flujos de trabajo de IA verticalizados. La capacidad de Salesforce Einstein GPT para acceder directamente a los datos del CRM le confiere una adherencia mucho mayor en los flujos de trabajo de ventas que cualquier interfaz de LLM general. La integración de Workday AI en los procesos de toma de decisiones de recursos humanos también genera costos extremadamente altos de migración de datos y procesos.

Caso histórico paralelo | WhatsApp ($22 mil millones) → Cursor ($60 mil millones): Evolución del paradigma de adquisiciones basadas en efectos de red

En 2014, Facebook adquirió WhatsApp por $22 mil millones (de los cuales $19 mil millones = $4 mil millones en efectivo + $15 mil millones en acciones), cuando WhatsApp registró una pérdida neta de $138 millones en 2013 y prácticamente ningún ingreso. La lógica de la adquisición: la red social de contactos de usuarios crea un bloqueo horizontal, donde cada nuevo usuario aumenta el valor de toda la red (efecto de red bilateral clásico); el motivo defensivo de Facebook era impedir que sus competidores obtuvieran acceso a la mensajería móvil.

La estructura lógica de Cursor es similar pero más compleja: los efectos de red horizontales son más débiles que los de WhatsApp (los desarrolladores no se ven obligados a usar Cursor solo porque sus colegas lo hagan), pero la rueda de datos verticales es mucho más fuerte que la de WhatsApp (los datos reales de decisiones de código mejoran continuamente el modelo, creando un bucle de auto-refuerzo: flujo de trabajo → datos → modelo → mejor flujo de trabajo). Los $600 mil millones son el precio del mercado por la combinación de "control del flujo de trabajo + rueda de datos de código", un premio de aproximadamente el 172% respecto a WhatsApp, que refleja la reevaluación del valor del flujo de trabajo en la era de los LLM.

Capítulo 4: La guerra de AI Factory: ubicación, construcción y condiciones de失效 de la ventaja competitiva

Analizando los tres frentes, la ubicación de la ventaja competitiva no es única. Diferentes jugadores han establecido barreras de distinta intensidad en distintos niveles, pero la pregunta clave es: ¿qué ventaja competitiva puede persistir más allá de los ciclos de iteración tecnológica? ¿Bajo qué condiciones dejará de ser efectiva una ventaja competitiva?

4.1 Foso de poder de cómputo: real pero no diferenciador

Poseer grandes clústeres de GPU crea una barrera de entrada, pero no genera una ventaja diferenciadora, ya que los competidores pueden comprar el mismo hardware con el mismo capital. La plataforma Vera Rubin de NVIDIA reduce los costos de inferencia en un factor de 10, lo que significa que la rápida caída en los costos de cómputo debilitará aún más el valor de la ventaja competitiva basada en "tener más poder de cómputo". La condición para la pérdida de la ventaja competitiva en la capa de cómputo: el desarrollo a gran escala y la madurez de ASICs propios (esperado para 2027-2028), en cuyo momento la ventaja de costos en inferencia de los proveedores de nube a gran escala se verá significativamente comprimida.

4.2 El foso de ventaja competitiva del ciclo de datos: la ventaja a largo plazo más difícil de replicar

Los datos reales de decisiones de código de desarrolladores recopilados por Cursor, los datos empresariales propietarios acumulados en las llamadas a la API de Anthropic y los flujos de trabajo empresariales recopilados por Microsoft a través de Office 365 representan los activos más defensibles de la era de la IA. La profundidad de la ventaja competitiva del ciclo de datos depende de dos variables: la propiedad de los datos (si pueden ser copiados o sustituidos por síntesis) y el grado de acoplamiento entre los datos y la mejora del modelo (si los datos impulsan realmente las capacidades diferenciadoras del modelo).

4.3 Control del flujo de trabajo: la fortaleza definitiva

El control del flujo de trabajo es la barrera más duradera de las tres. Su lógica de defensa no depende de una ventaja continua en el rendimiento del modelo (donde se puede cambiar de proveedor en la capa del modelo), sino del costo de fricción de la migración: reescribir prompts, reconstruir integraciones de API, volver a capacitar al personal y volver a pasar auditorías de seguridad y cumplimiento. La suma de estos costos suele superar las mejoras de eficiencia que aporta el nuevo modelo, generando un bloqueo persistente por inercia.

Hay tres condiciones de expiración: ① aparición de un paradigma de flujo de trabajo disruptivo (por ejemplo, un salto de "programación asistida por IA" a "programación completamente autónoma por IA", reiniciando toda la lógica del flujo de trabajo); ② apertura de interfaces estandarizadas que eliminen los costos de migración (por ejemplo, un protocolo unificado de llamada a Agentes de IA); ③ exigencia regulatoria de portabilidad de datos.

4.4 Geopolítica: riesgo sistémico subestimado

Las tres capas de ventaja competitiva se basan en un supuesto implícito: la estabilidad de la cadena de suministro. Las siete chips co-diseñados de la plataforma NVIDIA Vera Rubin se fabrican completamente en el proceso de 3 nm de TSMC, y la memoria HBM4 proviene de tres fabricantes coreanos. El riesgo geopolítico en Taiwán y las restricciones de exportación pueden interrumpir la cadena de suministro de hardware en cualquier momento, y este riesgo no está adecuadamente valorado en los planes actuales de CAPEX.4 Este es el único riesgo sistémico exógeno real en toda la guerra de la AI Factory.

Conclusión: ¿Quién ganará esta guerra?

La proposición central de este artículo se verificó sistemáticamente tras el análisis de datos de tres capítulos: el foso competitivo en la inteligencia artificial no se encuentra en el mismo nivel; la capa de poder de cómputo determina la elegibilidad para sobrevivir, la ventaja en la capa de modelos es efímera, y solo los actores que controlan la capa de flujo de trabajo pueden establecer un poder de fijación de precios sostenible.

Los datos de Sensor Tower han demostrado que el extremo del consumidor carece de adherencia; la mitad de la cuota de ChatGPT en tres años es la evidencia más clara. La adquisición de Cursor por $60 mil millones demuestra que el mercado ya ha revaluado el "control del flujo de trabajo", y este precio seguirá aumentando. El ARR de $47 mil millones de Anthropic junto con pérdidas continuas demuestra que el bloqueo generado por la integración empresarial de API es suficiente para sustentar una valoración mucho mayor que las ganancias actuales.

Desde la perspectiva del panorama competitivo, Microsoft posee el foso competitivo de tres capas más equilibrado: capacidad de Azure, acceso a modelos de OpenAI y puntos de entrada de flujos de trabajo de Office/GitHub; Anthropic lidera en fidelización empresarial mediante API pero enfrenta presión por consumo continuo de capital; la ventaja de distribución de Google (Android + Search) es difícil de replicar en el lado del consumidor; la ruta de integración vertical de SpaceX/xAI + Cursor aún está en fase de validación, pero si tiene éxito, construirá la combinación de foso competitivo más difícil de desmantelar.

La guerra final no se trata de qué modelo es más inteligente, sino de cuál flujo de trabajo es más difícil de abandonar. Esta es la lógica comercial básica ya validada en la era de WhatsApp, amplificada en la era de los LLM hasta escalas de billones de dólares.

Fuentes y notas de los datos

1 Equipo de analistas de Bank of America (abril de 2026); TrendForce Global Research (mayo de 2026); orientación de los resultados del Q1 2026 de Amazon, Alphabet, Microsoft, Meta, Oracle. Gráfico de datos "U.S. AI Hyperscale CAPEX Sprint"; gráfico de datos "Capital Squeeze: CAPEX vs. OCF".

2 anuncios de fusión entre SpaceX/Anysphere (junio de 2026); divulgación oficial del ARR de Cursor; materiales de la conferencia del Prof. Chen Lin, Escuela de Negocios de HKU (junio de 2026); base de datos de financiación de Crunchbase.

Anuncio de financiación de la serie H de Anthropic (mayo de 2026, valoración de $965 mil millones); gráfico de datos del material del curso de la HKU Business School "Empresa con pérdidas por valor de 1 billón de USD"; Bloomberg Terminal.

4 NVIDIA GTC Taipei 2026 Discurso principal de Jensen Huang (1 de junio de 2026, Taipei Music Center); Anuncio del producto NVIDIA Vera Rubin; SemiAnalysis "Vera Rubin: Extreme Co-Design" (febrero de 2026).

5 Bloomberg Terminal; gráfico de datos "M7 vs Micron 2026 YTD (18 de junio de 2026)"; material del curso de la Escuela de Negocios de HKU. Informes anuales de las empresas por año.

6 Sensor Tower Global Research; Prof. Chen Lin (林晨教授), HKU Business School, diapositivas de la conferencia "Customer Price Sensitivity and Loyalty" (junio de 2026, datos mundiales).

7 Informe financiero de Microsoft para el año fiscal 2026; Divulgación oficial del ARR de GitHub Copilot; Datos de usuarios suscritos de pago de Microsoft 365 (Q1 2026); Declaraciones de Satya Nadella en el Día del Inversor.

Anuncio de adquisición de Facebook/Meta WhatsApp (febrero de 2014); datos financieros de WhatsApp de 2013; materiales del curso "Old Story in the previous cycle" de la Escuela de Negocios de HKU; documentos relacionados con la SEC.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.