Autor del artículo: Hu Xuanfeng, Director de Negocios de Activos Digitales de Fosun Wealth, CMO de FinChain, Director Ejecutivo del Instituto de Aplicación e Inversión en Blockchain de Hong Kong y Vicedirector del Centro de Promoción de la Industria Blockchain del Delta del Río Yangtze
Advertencia de riesgo: Este artículo no constituye ninguna recomendación de compra o venta de valores, ni realiza juicios deterministas sobre los precios de acciones de ninguna industria o empresa. Los términos “oportunidad”, “reevaluación” y “mapa de riqueza” mencionados en el texto se refieren únicamente a tendencias industriales y direcciones que podrían atraer la atención del mercado de capitales. La inversión real requiere un juicio independiente basado en la valoración, el desempeño, los pedidos, el panorama competitivo, la calidad financiera y la capacidad de asumir riesgos.
Introducción: ¿Quién será el próximo módulo óptico?
Después de que los módulos ópticos aumentaran diez veces, muchas personas creen que ya se perdieron la mejor oportunidad en la cadena de valor de la IA. Empresas como InnoLight, NeoPhotonics, Tech-Fu Communications y Yuanjie Technology se convirtieron en el eje más brillante del mercado de capitales durante el último año. En particular, Yuanjie Technology alcanzó temporalmente un precio por acción superior al de Kweichow Moutai en abril de 2026, convirtiéndose en un nuevo representante de acciones de alto precio en el mercado A. Esto en sí mismo demuestra que el hardware de capacidad de cómputo de la IA ha pasado de ser un tema tecnológico a convertirse en un evento real de fijación de precios en el mercado de capitales. [1]
Pero lo que realmente quiero discutir es "¿Quién será el próximo módulo óptico?", lo que más interesa a todos.
Para saber esta respuesta, no podemos quedarnos en la superficie; debemos comprender la lógica subyacente: en cada revolución industrial, los mercados de capitales pueden otorgar valoraciones altas a las historias bien contadas, pero esto no es duradero; las empresas que realmente obtienen una valoración sostenida por el capital son aquellas que resuelven los nuevos cuellos de botella.
Quien bloquee el nuevo cuello de botella tendrá el nuevo poder de fijación de precios; quien posea el nuevo poder de fijación de precios podrá ser revaluado. Esta ola de mercado en módulos ópticos no se debe a que el mercado haya comenzado repentinamente a preferir la comunicación óptica, sino a que los centros de datos de IA han llevado primero al primer plano el cuello de botella de “interconexión de alta velocidad”.
I. La IA es una nueva revolución en la infraestructura de información
Hoy, mucha gente ve la IA con una mentalidad de tema: como ChatGPT se volvió popular, entonces especulan con la valoración de los grandes modelos; como NVIDIA subió, entonces especulan con las GPU; como los módulos ópticos subieron, todos persiguen los módulos ópticos; como las aplicaciones aún no generan ganancias a gran escala, dicen que la IA es una burbuja.
Esta perspectiva es demasiado a corto plazo y facilita que sigas lo que está de moda y termines atrapado en ello. Lo realmente importante es realizar un análisis profundo: ¿por qué los módulos ópticos han recibido reconocimiento del capital? ¿Qué patrones se pueden descubrir?
La IA es una nueva revolución en la infraestructura de información. Al igual que el telégrafo, el teléfono e Internet móvil, está redefiniendo la forma en que se producen, transmiten, procesan y monetizan la información.
Recientemente he estado escribiendo mi nuevo libro, "Token Economy: Nuevas rutas de desarrollo en la era inteligente", y tras una investigación profunda, descubrí que cada revolución de la información genera primero una nueva unidad de medición comercial.
En la era del telegrafo, la unidad más importante era la "palabra"; en la era telefónica, la unidad más importante era el "minuto"; en la era de internet móvil, la unidad más importante era el "datos"; en la era de la IA, la unidad más importante es el Token, es decir, el "token".
Los tokens son, en apariencia, la unidad mínima de información que la IA procesa, pero en realidad representan un costo integral de capacidad de cómputo, electricidad, memoria de GPU, almacenamiento, red, arquitectura del modelo y eficiencia de inferencia. Cuando le haces una pregunta a la IA, consumes tokens; cuando una empresa hace que un agente ejecute un proceso, también consume tokens. En el futuro, cuando la IA se integre en atención al cliente, investigación financiera, diseño, programación, educación, medicina, finanzas y manufactura, cada ejecución de tarea tendrá un costo real en tokens.
Por lo tanto, la distribución a largo plazo de la riqueza en la cadena de valor de la IA no debe basarse únicamente en quién vende GPU. Lo realmente importante son cuatro aspectos: quién produce los tokens, quién reduce el costo de los tokens, quién gestiona los tokens y quién convierte los tokens en resultados que los usuarios estén dispuestos a pagar.
II. La historia no es un trasfondo, sino las reglas de asignación de la industria
Para comprender el futuro de la IA, primero debes comprender la historia de la industria de la información de los últimos cien años.
Telegram, teléfono e internet, aparentemente tres industrias distintas, pero en su base repiten el mismo guion: cuando surgen nuevas unidades, son caras y la infraestructura primero gana dinero; cuando el costo por unidad disminuye, la capa de eficiencia toma el relevo; finalmente, la capa de acceso reasigna el valor comercial.
La primera escena es la era del telégrafo.
En 1866, el cable submarino transatlántico entró realmente en funcionamiento, reduciendo la transmisión de información entre Europa y Norteamérica de semanas a minutos. Sin embargo, al principio, el telégrafo era muy caro: diez dólares por palabra, con un mínimo de diez palabras. Enviar el mensaje más corto posible a través del océano equivalía aproximadamente a diez semanas de salario de un trabajador calificado. [2]
En ese momento, los primeros en ganar dinero fueron quienes instalaron los cables submarinos y quienes controlaban la red telegráfica internacional, ya que poseían la autopista de información global para finanzas, comercio, navegación y diplomacia de la época.
Pero si una palabra es demasiado cara, se forzará inevitablemente el desarrollo de tecnologías de compresión. Los comerciantes comenzaron a usar códigos telegráficos y diccionarios comerciales. Una palabra ya no era simplemente una palabra, sino que podía representar una frase completa, una instrucción de operación o una especificación de mercancía. Hoy hablamos de compresión de modelos de IA, cuantización y decodificación por inferencia, lo cual suena muy avanzado, pero la lógica subyacente no es nueva. La humanidad ha estado haciendo lo mismo desde la era del telégrafo: ¿pueden enviarse la misma información con menos unidades de costo?
Luego, surgió la entrada. Reuters es un ejemplo típico. En 1850, Paul Julius Reuter utilizó 45 palomas mensajeras para transmitir precios de acciones y noticias entre Bruselas y Aquisgrán, siendo aproximadamente 6 horas más rápido que el ferrocarril; tras la instalación del cable del Canal de la Mancha, se conectó rápidamente a la red de telégrafo y vendió información financiera, noticias comerciales y datos de mercado a bancos, periódicos y comerciantes. [3]
Lo que hace destacar a Reuters no es que haya instalado cables, sino que sabe qué información es importante y quién está dispuesto a pagar por obtenerla más rápido. Las compañías de telégrafos ganan con el cobro por carácter transmitido, mientras que Reuters gana con el derecho a distribuir la información. Una gana por el canal, la otra por el valor de la información.
Segunda escena, la era del teléfono.
La unidad de cobro en la era telefónica se convirtió en minutos. En 1915, durante los inicios de la comercialización de la telefonía transcontinental en Estados Unidos, los primeros tres minutos de una llamada de Nueva York a San Francisco costaban aproximadamente 20.70 dólares, lo que equivale a cientos de dólares en valores actuales. [4] Los primeros ganadores fueron naturalmente AT&T. La red telefónica tiene fuertes características de monopolio físico: las líneas, los conmutadores, las estaciones repetidoras y los usuarios finales forman juntos una red enorme.
Pero luego, las conmutadoras automáticas, los amplificadores de señal y la actualización de equipos de comunicación hicieron que el costo por minuto de llamada disminuyera constantemente. Los mercados de capitales comenzaron a reevaluar a las empresas que producían equipos para mejorar la eficiencia del sistema. Más tarde, surgieron las páginas amarillas en la red telefónica. Las páginas amarillas no cobraban por llamadas, sino por la tarifa de exhibición de los comerciantes. Los usuarios buscaban comerciantes, y los comerciantes querían ser encontrados por los usuarios, lo que generó una puerta de entrada comercial.
Tercer acto, la era del teléfono móvil y el internet.
En las primeras comunicaciones inalámbricas, los constructores de infraestructura eran los más valiosos; luego, los operadores de comunicaciones controlaron los números, las redes, los planes y la facturación, volviéndose muy populares, cobrando por mensaje, voz y datos según el uso. Internet, basado en infraestructuras de red cableada e inalámbrica, redujo drásticamente los costos y mejoró la eficiencia de las comunicaciones, dando inicio a la era del tráfico. A medida que el costo unitario del tráfico disminuyó rápidamente, la infraestructura dejó de ser altamente valorada, y las empresas que controlaban los puntos de acceso al usuario se volvieron cada vez más valiosas, consolidando a los gigantes de las plataformas de internet. WeChat, Taobao, Meituan, Douyin, Xiaohongshu y Pinduoduo tomaron el control del tiempo, las transacciones y las decisiones de consumo de los usuarios.
Los operadores controlan los bytes; las plataformas de internet controlan la intención comercial dentro de esos bytes. Esta es la ley que las tres generaciones de la industria de la información han demostrado conjuntamente: primero crecen las infraestructuras, luego las capas de eficiencia las siguen, y finalmente las capas de acceso asignan el mayor valor. La IA actualmente se encuentra en una posición clave de transición desde la primera fase hacia la segunda y tercera fases.
Tres: ¿Por qué la primera ola aterrizó primero en GPU, HBM y módulos ópticos?
No es sorprendente que, durante los últimos dos años, la primera ola de mercado de la IA haya comenzado con Nvidia, almacenamiento y módulos ópticos, ya que la primera etapa de la IA consiste en el entrenamiento de modelos grandes y la construcción de clústeres de capacidad de cómputo.
Entrenar modelos grandes requiere una gran cantidad de GPU; las GPU necesitan memoria de alta ancho de banda, es decir, HBM; muchas GPU deben trabajar en conjunto, lo que requiere interconexiones de alta velocidad, como módulos ópticos, chips de conmutación, PCB, conectores y equipos de red. Los centros de datos tradicionales son como un grupo de servidores que manejan muchas tareas comunes, mientras que los centros de datos de IA funcionan más como una supercomputadora enorme. Decenas de miles o cientos de miles de GPU deben trabajar como un solo cuerpo; si cualquier etapa intermedia se ralentiza, arrastrará a todo el sistema.
Las GPU son caras; si la red no es lo suficientemente rápida, la GPU espera datos. Que la GPU espere datos significa que un activo costoso está inactivo. Por eso, los módulos ópticos suben, lo que tiene una base industrial; los HBM suben porque el mercado de capitales está comprando cuellos de botella reales en la cadena de valor.
Pero el mercado no se centrará para siempre solo en los primeros cuellos de botella. Una vez que se discutan ampliamente los componentes visibles como las GPU, HBM y los módulos ópticos, la pregunta seguirá avanzando: una vez construida la capacidad de cómputo, ¿cómo asegurar su estabilidad? ¿Cómo hacerlo económico? ¿Cómo integrarlo en los procesos empresariales? ¿Cómo convertirlo en un resultado por el que los usuarios estén dispuestos a pagar?
Cuarta barrera en el desarrollo de la IA: energía, refrigeración líquida y bienes raíces industriales para cómputo
La línea más segura que considero a continuación es la electricidad y el enfriamiento líquido. La razón es sencilla: los centros de datos de IA están pasando de ser un “negocio de sala de servidores” a un “negocio energético”.
Anteriormente, la gente entendía los centros de datos como edificios que contienen muchos servidores. Los centros de datos de IA no son así. Las restricciones clave de los centros de datos de IA están pasando a ser el acceso a la electricidad, la densidad de potencia de los gabinetes, la capacidad de refrigeración, la programación energética y la entrega de infraestructura. NVIDIA enfatiza en su descripción oficial del GB200 NVL72 que conecta 36 CPUs Grace y 72 GPUs Blackwell en un diseño a escala de rack con refrigeración líquida, es decir, un sistema de refrigeración líquida a nivel de gabinete. [5]
Esto significa que la competencia en IA ya no es solo una competencia por una sola GPU, sino un sistema competitivo que involucra gabinetes completos, salas de servidores enteras y centros de datos completos. En el futuro, la densidad de potencia de los gabinetes seguirá avanzando hacia niveles de decenas de kilovatios e incluso cientos de kilovatios; el enfriamiento líquido y la distribución de energía ya no serán complementos de fondo, sino condiciones previas para la implementación de la capacidad de cómputo.
Más importante aún es la electricidad. La Agencia Internacional de la Energía predice en "Energy and AI" que el consumo eléctrico global de los centros de datos alcanzará aproximadamente 945 TWh para 2030, casi duplicándose, y representará cerca del 3%, pero ligeramente por debajo, del consumo eléctrico mundial; siendo la IA uno de los impulsores de crecimiento más importantes. [6]
Las GPU se pueden ordenar, los módulos ópticos se pueden expandir, los servidores se pueden ensamblar, pero la red eléctrica, las subestaciones, las líneas de transmisión, las fuentes de alimentación de respaldo y los sistemas de enfriamiento no pueden aparecer de la nada en unos pocos meses. Cuanto más potente sea la IA, mayor será el consumo de energía; cuanto más densa sea la capacidad de cómputo, mayor será el calor generado; cuanto más concentrados sean los centros de datos, más extremas serán las exigencias de electricidad y refrigeración.
Por lo tanto, los transformadores, UPS, cuadros de distribución, fuentes de alimentación conmutadas, canales de barra, sistemas de energía para centros de datos, placas líquidas de enfriamiento, CDU, bombas y válvulas, intercambiadores de calor y soluciones de enfriamiento líquido para gabinetes completos, así como la integración total de infraestructura para centros de datos, serán revaluados. Anteriormente, todos ellos se consideraban parte de la industria manufacturera tradicional, pero con la llegada de la IA, se han convertido en condiciones previas para la entrega de capacidad de cómputo.
Si se avanza un paso más, los centros de datos de IA pasarán de ser IDC tradicionales a convertirse en una nueva categoría de bienes raíces industriales. Los IDC tradicionales se evalúan por número de gabinetes, tasa de utilización, PUE, alquiler y clientes; los centros de datos de IA se evalúan por indicadores de energía, subestaciones, contratos energéticos a largo plazo, capacidad de refrigeración líquida, acceso a redes de alta velocidad, contratos a largo plazo con grandes clientes, capacidad de operación y mantenimiento de clústeres de GPU y espacio para expansión de terreno.
Esto ya no es simplemente un negocio de "construir edificios y colocar servidores". Es más como las estaciones de la era ferroviaria, los puertos de la era marítima, los aeropuertos de la era aérea y los centros de conexión de la era de las autopistas. La mejor empresa de centros de datos de IA del futuro no solo alquilará espacios de servidores, sino que también organizará tierra, electricidad, refrigeración, red, chips y contratos a largo plazo con clientes en un conjunto de activos de infraestructura con flujo de efectivo, barreras de entrada y escasez.
Esta línea tiene un cambio adicional: la financiación de activos de centros de datos. Una vez que los centros de datos de IA generen flujos de efectivo estables, podrían convertirse en REITs, RWA, fondos de infraestructura, productos de derechos de ingresos y activos de arrendamiento a largo plazo. En la era de la nube, los centros de datos eran activos de fondo para los proveedores de nube; en la era de la IA, los centros de datos serán revaluados como “bienes inmobiliarios industriales de capacidad de cómputo”.
Cinco: Después del entrenamiento, es la guerra de los costos de inferencia
Mucha gente cree ahora que NVIDIA es demasiado fuerte, por lo que las oportunidades en chips de IA ya han sido absorbidas por NVIDIA. Esta evaluación solo es parcialmente correcta.
Durante la fase de entrenamiento de modelos grandes, la ventaja de NVIDIA es muy fuerte. No solo sus GPU son potentes, sino que también lo son CUDA, el ecosistema de desarrolladores, los sistemas de red, las soluciones completas y la cadena de herramientas de software. Sin embargo, una vez que la IA entra en la fase de inferencia a gran escala, la lógica cambia. En la fase de entrenamiento, lo más importante es desarrollar el modelo; en la fase de inferencia, lo más importante es que el modelo sirva a una cantidad masiva de usuarios diariamente. El entrenamiento es más como gasto de capital, mientras que la inferencia es más como costo operativo.
Cuando la IA entra en atención al cliente, oficina, programación, finanzas, educación, medicina y manufactura, se generan cantidades masivas de llamadas diarias. En este momento, todos se dan cuenta de que la lógica económica de los tokens difiere de la lógica económica del tráfico: en la economía del tráfico, el costo marginal disminuye, por lo que se puede obtener una gran cantidad de usuarios primero y luego considerar los ingresos, ya que el costo de red por cada usuario adicional se vuelve cada vez más bajo. Sin embargo, la lógica económica de los tokens es diferente: hace que las empresas de modelos grandes y los proveedores de nube sientan un costo económico completamente distinto, ya que su costo marginal permanece constante o incluso aumenta. El entrenamiento es una inversión única con beneficios a largo plazo, pero la inferencia no lo es. Si cada uso de IA para atender a un usuario genera pérdidas, y una tarea se llama decenas de millones o cientos de millones de veces al día, ninguna empresa puede soportarlo. Por eso incluso el modelo grande DouBao de ByteDance ha comenzado a cobrar.
En este momento, surge una nueva oportunidad, y todos reflexionan sobre cómo reducir costos. ¿Por qué todos los trabajos deben realizarse con GPU genéricas más caras? ¿Se podrían usar chips dedicados? ¿Se podrían emplear ASIC con menor consumo de energía, mayor rendimiento y más adecuados para escenarios fijos?
Es por eso que los casos de Broadcom, AMD, Google TPU merecen atención.
Reuters informa que Broadcom espera que, para 2027, las oportunidades de ingresos provenientes de chips AI personalizados puedan superar los 100 mil millones de dólares, impulsadas por el rápido aumento de la demanda de chips AI personalizados por parte de grandes empresas tecnológicas. [7] AMD reveló en su informe anual de 2024 que sus ingresos anuales del negocio de AI para centros de datos ya superan los 5 mil millones de dólares, con clientes como Meta, Microsoft y Oracle implementando a gran escala los aceleradores AMD Instinct MI300. [8] Google Cloud destaca que el TPU v5e está orientado a la eficiencia de costos, ofreciendo un mayor volumen de consultas al mismo costo. [9]
Por lo tanto, los chips de IA no tendrán solo una forma en el futuro. NVIDIA seguirá siendo fuerte, pero los proveedores de nube desarrollarán sus propios chips, ASIC personalizados, chips de aceleración de inferencia y chips de IA en el borde, cada uno ocupando su propio espacio. No se trata de reemplazar simplemente a NVIDIA, sino de capturar una parte del mercado de beneficios en la era de la inferencia. A medida que la IA pasa de la era del entrenamiento a la era de la inferencia, la optimización de costos se convertirá en el nuevo poder de fijación de precios.
Sixth, after the optical modules comes the entire AI network
Mucha gente cree que los módulos ópticos ya han terminado de subir, por lo que el mercado de IA ha concluido. Yo no lo veo así. Los módulos ópticos son solo el primer nivel visible de la red de IA. Detrás vienen los chips de conmutación, conmutadores, DPU, SmartNIC, CPO, fotónica en silicio, programación de clústeres y sistemas operativos de red.
La esencia de un centro de datos de IA es conectar una gran cantidad de GPU para formar una supercomputadora. El activo más costoso aquí son las GPU, y lo que menos se puede permitir es que las GPU estén inactivas. Si la latencia de red es alta, las GPU esperan datos; si la eficiencia de intercambio es baja, las GPU esperan datos; si la arquitectura de comunicación es deficiente, las GPU siguen esperando datos.
Por lo tanto, el valor de la red de IA no solo radica en la transmisión de datos, sino en aumentar la utilización de todo el clúster de GPU. En un centro de datos de Internet común, si la red es más lenta, el usuario simplemente experimenta una carga más lenta; en un centro de datos de IA, si la red es un poco más lenta, podría provocar una disminución en la utilización de equipos por valores de cientos de millones o miles de millones de dólares.
La plataforma Quantum-X800 InfiniBand de NVIDIA se enfoca en redes de extremo a extremo de 800 Gb/s, diseñadas para servir modelos de IA con billones de parámetros; Spectrum-X Ethernet, por su parte, destaca la mejora del rendimiento de la red de IA y el soporte para la expansión de grandes clústeres de GPU. [10] TrendForce también señala que la demanda de módulos ópticos transceptores de 800 G o superior en la interconexión de clústeres de servidores de IA está aumentando rápidamente, y se espera que el mercado de módulos ópticos para IA siga expandiéndose. [11]
Por lo tanto, la red de IA seguirá mejorando: de 400G a 800G, y luego a 1.6T; de módulos ópticos tradicionales a CPO; de conmutación electrónica a integración óptico-electrónica; de redes normales a AI fabric; de dispositivos individuales a programación de clusters completos. El mercado de capitales ya no solo observará el negocio de los módulos ópticos, sino quién pueda aumentar la eficiencia de conexión de clusters de IA, quién pueda reducir el tiempo de espera de las GPU y quién pueda hacer que los clusters de decenas de miles o cientos de miles de tarjetas sean más estables.
Siete: Después de que el token se vuelva más barato, el acceso cambiará de persona.
La aplicación a gran escala en la era de la IA depende de si el costo de los tokens puede seguir disminuyendo. Cuanto más caros sean los tokens, más difícil será la adopción de la IA; cuanto más baratos sean los tokens, más fácil será integrar la IA en los procesos empresariales y la vida cotidiana.
El informe del Índice de IA de Stanford 2025 muestra que el costo de consulta para modelos que alcanzan el nivel de GPT-3.5 disminuyó de aproximadamente 20 dólares por millón de tokens en noviembre de 2022 a aproximadamente 0,07 dólares en octubre de 2024, una reducción de más de 280 veces en aproximadamente 18 meses; según la tarea, la velocidad de caída del precio de inferencia de los LLM varía enormemente, desde 9 veces hasta 900 veces por año. [12]
Esta información indica que las verdaderas fuerzas deflacionarias a largo plazo en la industria de la IA ya han comenzado a manifestarse. Quien pueda realizar la misma tarea consumiendo menos tokens, menos memoria GPU, menos electricidad y menos tiempo de inferencia, tendrá valor.
Estas empresas, que yo llamo la escuela de compresión de tokens.
Pueden ser empresas de modelos, plataformas de inferencia, empresas de chips, proveedores de nube o empresas de infraestructura de IA empresarial. Lo importante no es cómo se llamen, sino si pueden reducir el costo de la misma tarea, acortar la cadena de inferencia, disminuir las llamadas innecesarias y lograr resultados más estables.
Hay varias tecnologías importantes aquí: MoE, cuantización, distilación, caché, decodificación especulativa y enrutamiento de modelos. En particular, el enrutamiento de modelos no requiere invocar el modelo más caro para todas las tareas. Un sistema de IA maduro seleccionará automáticamente el modelo y la ruta más adecuados según la complejidad de la tarea, el presupuesto de costos, los requisitos de velocidad, los requisitos de privacidad y los requisitos de precisión. Por supuesto, el enrutamiento de modelos también es vulnerable a la presión de grandes empresas, ya que su ventaja competitiva no es sólida.
Una vez que los costos disminuyan, el problema de la entrada se volverá más importante. Mucha gente cree que la entrada de la era de la IA será una plataforma de orquestación de modelos, como el Meituan de la era de la IA. Esta analogía tiene sentido, pero no es lo suficientemente profunda. La verdadera entrada de la IA no necesariamente será una plataforma que te permita elegir modelos, sino más bien un sistema integrado en tu flujo de trabajo.
Los usuarios comunes no abrirán diariamente una plataforma de programación de modelos. Los usuarios empresariales tampoco llamarán a modelos solo para llamarlos. Los usuarios buscan completar tareas, las empresas buscan mejorar la eficiencia de los procesos y los empleados buscan resultados en su trabajo. La IA finalmente se integrará en Office, Feishu, DingTalk, WeCom, ERP, CRM, editores de código, navegadores, correo electrónico, búsqueda, sistemas financieros, sistemas de atención al cliente y sistemas de trading. Quien controle el flujo de trabajo, controlará el derecho a llamar a la IA.
Microsoft reveló en su informe anual de 2025 que la familia de productos Copilot suma más de 100 millones de usuarios activos mensuales en los segmentos comerciales y de consumo, e integró aún más Microsoft 365 Copilot en los procesos de oficina. [13] Esto indica que la entrada de IA no necesariamente debe ser una aplicación independiente, sino que puede ser una capa inteligente dentro de flujos de trabajo existentes.
La entrada para programadores podría ser un editor de código y una plataforma de alojamiento de código; la entrada para oficinas podría ser Microsoft 365, Google Workspace, Feishu o DingTalk; la entrada para la gestión empresarial podría ser ERP, CRM o sistemas financieros; la entrada personal podría ser el sistema operativo del teléfono, el navegador, la barra de búsqueda o gafas inteligentes. La verdadera entrada en la era de la IA no es la lista de modelos, sino la entrada de flujos de trabajo.
Ocho: Lo realmente difícil de la IA empresarial es integrarla en los procesos
Para que la IA se convierta en la entrada de los flujos de trabajo, aún se requiere un prerequisito: debe integrarse en los procesos reales de la empresa. Lo más difícil de la IA empresarial no es conectar un chatbot, sino si el modelo puede acceder de forma segura a los datos de la empresa, comprender los procesos comerciales, invocar sistemas, generar registros, someterse a auditorías y combinarse con los mecanismos de aprobación humana.
Muchas empresas hoy en día utilizan IA solo hasta el punto en que los empleados la consultan, escriben y resumen por sí mismos. Esto mejora la eficiencia individual, pero no cambia realmente la estructura organizacional. La verdadera IA empresarial es cuando los Agentes se integran en los procesos.
El agente de servicio al cliente no solo responde preguntas, sino que también debe revisar pedidos, verificar el envío, evaluar las condiciones de reembolso y utilizar el sistema de postventa; el agente financiero no solo prepara informes, sino que también debe revisar comprobantes, conciliar cuentas, identificar anomalías y generar opiniones de aprobación; el agente de investigación e inversión no solo resume noticias, sino que también debe recopilar datos, construir modelos, comparar empresas y monitorear riesgos; el agente jurídico no solo redacta contratos, sino que también debe buscar cláusulas, identificar riesgos, relacionar casos y conservar registros de modificaciones.
Detrás de esto se necesita toda una infraestructura: base de datos, recuperación vectorial, gestión de permisos, gobernanza de datos, integración de sistemas, motor de flujos de trabajo, registros de auditoría, seguridad y cumplimiento, base de conocimiento empresarial, plataforma de orquestación de Agentes. Estas cosas no son tan atractivas como los grandes modelos, pero son la base sobre la que se implementa realmente la IA en las empresas. El primer dinero que una empresa debería invertir al implementar IA es en seguridad, datos, permisos, procesos, integración y cumplimiento, no en desplegar un modelo para ejecutar tareas llamativas con algunos tokens.
Aquí también hay un cambio aún mayor: el verdadero dinero en aplicaciones de IA no proviene necesariamente del presupuesto de software, sino que podría provenir del presupuesto de recursos humanos. El SaaS vende herramientas, mientras que los Agentes de IA venden resultados. Las herramientas requieren que una persona las opere, pero los Agentes realizan directamente las tareas.
Un sistema de atención al cliente con IA, si solo vende software, tiene como techo el mercado de software de atención al cliente; pero si realmente reemplaza a una gran cantidad de agentes de atención al cliente humanos, su techo es el costo de la externalización de la atención al cliente y el gasto en personal de atención al cliente empresarial. Un sistema jurídico con IA, si solo vende herramientas de documentación, tiene un techo limitado; pero si puede reemplazar a abogados junior, la revisión de contratos y la debida diligencia, su techo es el pool de costos de servicios jurídicos.
Harvey es un caso de inteligencia artificial legal digno de observarse. Según TIME en 2025, Harvey tiene una valoración de aproximadamente 5 mil millones de dólares, cuenta con más de 300 clientes en 53 países y está presente en siete de las diez firmas legales con mayores ingresos en Estados Unidos. [14] Esto demuestra que la aplicación de la IA en escenarios de trabajo de conocimiento de alto valor no se trata de una sustitución simple de herramientas, sino de intervenir en el pool de costos laborales de los servicios profesionales.
Las empresas de IA verdaderamente excelentes en el futuro no solo se describirán como compañías de software, sino que dirán cuánto trabajo pueden realizar por sus clientes, cuánta mano de obra pueden ahorrar, cuántos errores pueden reducir, cuánto pueden aumentar la conversión y cuánto pueden acortar los ciclos de entrega. El mercado de capitales antes miraba el ARR; en el futuro, también mirará cuánto de la piscina de costos laborales puede consumir.
Nueve: No ignore la inteligencia artificial local y la financiación de la capacidad de cómputo
También hay dos líneas que, aunque actualmente no son las más populares, no se pueden ignorar a mediano y largo plazo. Una es la IA local. Actualmente, la mayoría de los tokens se generan en centros de datos en la nube; cuando haces una pregunta a un modelo, en esencia es un centro de datos lejano el que realiza el cálculo por ti. Pero en el futuro no es posible que toda la inferencia de IA se realice en la nube.
La razón es sencilla: la inferencia en la nube es demasiado costosa, muchos escenarios requieren baja latencia y muchos datos no pueden subirse a la nube; además, los dispositivos terminales se volverán cada vez más inteligentes. Por lo tanto, en el futuro, una parte de los tokens se migrará desde la nube hacia el local, también conocido como el lado del dispositivo terminal. Los teléfonos móviles ejecutarán IA, las PC ejecutarán IA, los automóviles ejecutarán IA, los robots ejecutarán IA, las gafas inteligentes ejecutarán IA y las estaciones de trabajo locales también ejecutarán IA.
Una vez que la IA en el extremo se implemente, desencadenará un nuevo ciclo de hardware. Los chips de IA en el extremo, NPU, memoria de bajo consumo, gestión de energía, disipación térmica, sensores, módulos de cámara, matrices de micrófonos, PC con IA, teléfonos con IA, gafas con IA, robots y plataformas de cálculo inteligente para vehículos entrarán en una nueva reevaluación de la cadena de suministro.
Pero esta línea debe verse objetivamente. La dirección de la IA en el extremo es correcta, pero aún falta una aplicación verdaderamente clave. Actualmente, los PC de IA y los teléfonos de IA son impulsados principalmente por fabricantes de hardware, y los usuarios aún no han desarrollado una necesidad imperiosa de cambiar. Por lo tanto, la IA en el extremo no será la primera línea de tendencia en explotar, pero sí será una línea importante a mediano y largo plazo.
Otra línea es la financiación de la potencia de cálculo. La infraestructura de IA es muy intensiva. Las GPU son caras, los centros de datos son caros, los contratos de energía son caros, los plazos de construcción son largos y requieren un gran compromiso de capital. Depender únicamente del balance de las empresas tecnológicas para soportarlo no necesariamente es la solución óptima.
En el futuro podrían surgir varias nuevas clases de activos financieros: contratos de alquiler de GPU, derechos a ingresos de poder de cómputo, REITs de centros de datos, fondos de infraestructura de IA, acuerdos de compra de electricidad a largo plazo, financiamiento con garantía de GPU, financiamiento estructurado basado en ingresos por inferencia, y activos de poder de cómputo tokenizados como RWA.
El negocio de activos digitales de Fosun Wealth, donde trabajo, es uno de los equipos más profesionales de emisión de RWA en Hong Kong. Desde mi análisis de negocio en la primera línea, los activos de poder de cómputo RWA tienen un valor financiero extremadamente alto y un futuro en el comercio global regulado. FinChain StarChain y StarRoad están ayudando a grandes fabricantes tradicionales de poder de cómputo a establecer nuevas vías financieras reguladas mediante la tokenización, desde el poder de cómputo de Bitcoin hasta el poder de cómputo de IA.
Ya existen casos exitosos de financiación de la potencia de cómputo en el extranjero, y CoreWeave es el más típico. En marzo de 2026, CoreWeave anunció la finalización de un préstamo diferido por 8.500 millones de dólares, al que denominó la primera financiación respaldada por GPU con calificación de inversión. [15] Esto indica que las GPU, los gabinetes y los contratos de potencia de cómputo están siendo revaluados por los mercados financieros como activos de infraestructura garantizables y financiables.
Esto es muy similar a las eras del ferrocarril, las telecomunicaciones y la nube. En la era del ferrocarril, las compañías ferroviarias financiaban la construcción de vías mediante bonos; en la era de las telecomunicaciones, los operadores utilizaban capital a largo plazo para desplegar redes; en la era de la nube, los proveedores de nube invertían grandes gastos de capital en la construcción de centros de datos. En la era de la IA, las GPU, los gabinetes, los contratos de energía y los ingresos futuros de inferencia también serán reempaquetados, valorados y negociados por los mercados financieros.
Diez: La oportunidad más alta: las empresas nativas de IA reescribirán el estado de resultados.
Lo anterior se refiere a la cadena de valor. Pero el mayor impacto a largo plazo de la IA no es solo la cadena de valor, sino que la forma organizacional será reescrita.
Anteriormente, las empresas se organizaban en departamentos compuestos por personas: ventas, servicio al cliente, finanzas, jurídico, investigación y desarrollo, y operaciones. Cada departamento tenía puestos, procesos, aprobaciones y desempeño. Después de la introducción de los Agentes de IA, la organización cambiará: una persona podrá gestionar múltiples Agentes, un departamento podrá ser comprimido por flujos de trabajo de Agentes, los puestos de backoffice y middle office se automatizarán, el radio de gestión se ampliará, y la empresa se transformará de una organización intensiva en mano de obra en una organización de colaboración humano-máquina.
Esto significa que, en el futuro, los mercados de capitales reevaluarán un tipo de empresa: las empresas nativas de IA. No se trata simplemente de comprar algunas herramientas de IA ni de permitir que los empleados usen ChatGPT para redactar textos, sino de rediseñar desde el inicio la estructura organizacional según la IA: menos personas, mayores ingresos, mayor productividad por empleado, menores costos marginales y velocidades de entrega más rápidas.
Por lo tanto, el mayor impacto del AI en los mercados de capitales no solo es "quiénes subirán en la cadena de valor del AI", sino también "en qué industrias alguien puede reescribir su estado de resultados con AI". El futuro premiará a dos tipos de empresas: una, las que venden infraestructura y capacidades de AI; y otra, las que utilizan AI para reestructurar sus costos e ingresos. Estas últimas no necesariamente parecerán empresas de AI, pero su eficiencia organizacional, su margen de beneficio y su productividad por empleado experimentarán cambios fundamentales.
Conclusión: La IA está redefiniendo la escasez
Hasta aquí, si solo se ven GPU, módulos ópticos, electricidad, refrigeración líquida, ASIC, centros de datos y dispositivos de borde, aún se está viendo a la IA como una cadena de tecnología. El cambio más profundo es que la IA redefinirá qué es lo escaso.
Antes, lo escaso era la GPU, por lo que NVIDIA subió; luego, lo escaso fue el HBM y los módulos ópticos, por lo que subieron el almacenamiento y los módulos ópticos; a continuación, lo escaso será la electricidad, la refrigeración líquida, la red de IA, los chips de inferencia, las tuberías de datos, los puntos de entrada de flujos de trabajo, los datos empresariales y la ejecución organizacional.
Si se desglosa esta ola de mercado de IA, en la primera fase se compran infraestructuras de cómputo, en la segunda fase se compran la estabilidad y el bajo costo de operación del cómputo, y en la tercera fase se compran la integración del cómputo en los procesos empresariales para generar ingresos y ganancias reales.
El módulo óptico subió diez veces, pero esto no es el final de la historia, sino la primera vez que los mercados de capitales ven claramente el cuello de botella físico de la infraestructura de IA. La próxima revaluación más grande ocurrirá en la próxima serie de cuellos de botella aún subvalorados.
La electricidad, la refrigeración líquida, los centros de datos de IA, los ASIC personalizados, las redes de IA, la compresión de tokens, el enrutamiento de modelos, las canalizaciones de datos empresariales, los puntos de entrada de flujos de trabajo, la IA en el extremo, la financiarización de la capacidad de cómputo y las empresas nativas de IA juntas formarán el siguiente mapa de riqueza de la cadena de valor de la IA.
Por supuesto, esto no significa que todas las empresas subirán ni que cada concepto merezca ser comprado. En cada revolución industrial, la riqueza no se distribuye de manera equitativa. Las empresas que realmente serán recompensadas a largo plazo por los mercados de capitales son aquellas que superan cuellos de botella, tienen clientes, pedidos, barreras tecnológicas, ventajas de costos y una posición ecológica.
Resumen: La primera ola de oportunidades en IA es quién pueda construir capacidad de cómputo; la próxima ola de oportunidades en IA es quién pueda respaldar, optimizar y programar la capacidad de cómputo, y finalmente convertirla en resultados comerciales reales.
Notas y fuentes
La siguiente información respalda los hechos históricos, datos públicos y casos industriales mencionados en el texto. Para facilitar la verificación por parte de editores de medios financieros, se priorizan fuentes oficiales, anuncios de empresas, medios autorizados o datos primarios.
[1] Sobre el precio de las acciones de Yuanjie Technology durante la sesión que superó a Kweichow Moutai y se convirtió en el nuevo representante de la acción más cara del mercado A: Sina Finance, 17 de abril de 2026, "Superando a Moutai, nace el nuevo rey de las nuevas emisiones del mercado A". https://finance.sina.com.cn/wm/2026-04-17/doc-inhuupte2305062.shtml
[2] Sobre los cargos del cable transatlántico de 1866: PBS American Experience, “How the Early Cable Was Used”, indica que los cargos iniciales del cable transatlántico de 1866 eran de 10 dólares por palabra, con un mínimo de 10 palabras, equivalente aproximadamente a diez semanas de salario de un trabajador calificado. https://www.pbs.org/wgbh/americanexperience/features/cable-how-early-cable-was-used/
[3] Sobre el caso de las palomas mensajeras de Reuters: Reuters, “The long history of speed at Reuters”, menciona que Reuter utilizaba palomas mensajeras en sus inicios para transmitir información financiera. https://www.reuters.com/article/business/the-long-history-of-speed-at-reuters-idUSKBN2761WD/
[4] Sobre el costo de la llamada telefónica transcontinental estadounidense de 1915: JSTOR Daily, “AT&T: El nacimiento de la primera red social”, menciona que una llamada de 3 minutos de costa a costa en 1915 costaba 20.70 dólares. https://daily.jstor.org/birth-first-social-network/
[5] Sobre NVIDIA GB200 NVL72: La página oficial de NVIDIA indica que el GB200 NVL72 conecta 36 CPUs Grace y 72 GPUs Blackwell, con un diseño de escala de rack y enfriamiento líquido. https://www.nvidia.com/en-us/data-center/gb200-nvl72/
[6] Sobre el consumo de energía de los centros de datos globales: Agencia Internacional de la Energía, “Energy demand from AI”, se estima que el consumo de energía de los centros de datos globales alcanzará aproximadamente 945 TWh para 2030, menos del 3% del consumo eléctrico mundial. https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai
[7] Sobre los chips AI personalizados de Broadcom: Reuters, 2026-03-04, “Broadcom pronostica ingresos del segundo trimestre por encima de las estimaciones”, informa que Broadcom espera que los ingresos de los chips AI superen los 100.000 millones de dólares para 2027. https://www.reuters.com/technology/broadcom-forecasts-second-quarter-revenue-above-estimates-2026-03-04/
[8] Sobre el negocio de IA para centros de datos de AMD: El Informe Anual 2024 de AMD revela que los ingresos anuales del negocio de IA para centros de datos superan los 5.000 millones de dólares y menciona la implementación de aceleradores AMD Instinct MI300 por parte de Meta, Microsoft, Oracle, entre otros. https://ir.amd.com/financial-information/sec-filings/content/0001193125-25-067185/0001193125-25-067185.pdf
[9] Sobre la eficiencia de costos de Google TPU v5e: Google Cloud Blog, “Performance per dollar of GPUs and TPUs for AI inference”, menciona que el TPU v5e aumenta la cantidad de consultas al mismo costo. https://cloud.google.com/blog/products/compute/performance-per-dollar-of-gpus-and-tpus-for-ai-inference
[10] Sobre la plataforma de red AI de NVIDIA: La página oficial de NVIDIA Quantum-X800 indica que es una red InfiniBand de extremo a extremo de 800 Gb/s. https://www.nvidia.com/en-us/networking/products/infiniband/quantum-x800/
[11] Sobre el mercado de módulos ópticos de recepción/transmisión de IA: TrendForce, 2026-04-20, “El mercado global de transceptores ópticos de IA alcanzará los 26 mil millones de dólares estadounidenses”, indica que la demanda de módulos ópticos de 800G y superior está aumentando rápidamente. https://www.trendforce.com/presscenter/news/20260420-13017.html
[12] Sobre la reducción del costo de la inferencia de IA: Stanford HAI, “AI Index 2025: State of AI in 10 Charts”, indica que el costo de las consultas de modelos al nivel de GPT-3.5 disminuyó más de 280 veces en aproximadamente 18 meses. https://hai.stanford.edu/news/ai-index-2025-state-of-ai-in-10-charts
[13] Sobre la base de usuarios de Microsoft Copilot: Informe Anual de Microsoft 2025, que revela que la familia de productos Copilot tiene más de 100 millones de usuarios activos mensuales combinados en los segmentos empresarial y de consumo. https://www.microsoft.com/investor/reports/ar25/index.html
[14] Sobre el caso de Harvey AI legal: La lista Time 2025 de las empresas más influyentes del mundo informa que Harvey tiene una valoración de aproximadamente 5.000 millones de dólares, más de 300 clientes y está presente en 53 países. https://time.com/collections/time100-companies-2025/7289586/harvey/
[15] Sobre el financiamiento respaldado por GPU de CoreWeave: Anuncio de relaciones con inversores de CoreWeave, en marzo de 2026 se anunció la finalización de un facility de préstamo diferido de 8.5 mil millones de dólares, denominado el primer financiamiento respaldado por GPU con calificación de inversión. https://investors.coreweave.com/news/news-details/2026/CoreWeave-Closes-Landmark-8-5-Billion-Financing-Facility-Achieving-First-Investment-Grade-Rated-GPU-backed-Financing/default.aspx
Nota: Este artículo es un ensayo de opinión de la industria; las notas sirven para indicar las fuentes de los hechos y no constituyen ningún consejo de inversión.
