La naturaleza de suscripción de la IA consiste en convertir el costo impredecible de la capacidad de cómputo en una estructura de ingresos predecible, y esta será la pregunta central que el mercado repetidamente planteará a las empresas de IA.
Autor del artículo, fuente: Wu Duidui
La IA nacional finalmente ha llegado a este punto: ya no basta con hablar de usuarios, hay que hablar de ganancias.
La fase de adquisición gratuita ha finalizado, y las aplicaciones de IA comienzan a entrar en la fase de "estratificación de costos + estratificación de usuarios + validación comercial".
Recientemente, la página de la App Store de Doubao mostró información de suscripción de pago: además de la versión básica gratuita, podrían estar disponibles la versión estándar por 68 yuanes/mes, la versión mejorada por 200 yuanes/mes y la versión profesional por 500 yuanes/mes, con una tarifa anual máxima de 5088 yuanes.
La respuesta de Doubao es que el servicio gratuito se mantendrá, y las opciones de servicios de pago aún están en prueba; actualmente, los beneficios relacionados no se muestran oficialmente dentro del producto.
This matter can be viewed from several perspectives.
Esto tiene que ver con el costo, especialmente el "costo de los usuarios intensivos".
Lo más problemático de un producto como DouBao es que cuanto más lo usan los usuarios, mayor es el costo para la plataforma.
Un usuario promedio que hace algunas preguntas ocasionales puede tener un costo controlable.
Pero si el usuario comienza a hacer estas cosas:
Escribir artículos extensos, generar presentaciones en PowerPoint, realizar análisis de datos, investigaciones profundas, generación de imágenes, generación de videos, conversación de voz en tiempo real y ejecución de tareas múltiples por Agent.
Entonces no es ni siquiera el mismo nivel de costo.
Las capacidades principales de la versión Mac de Doubao, además del chat, incluyen "búsqueda, edición de imágenes, redacción, traducción, PPT y análisis de datos", y enfatiza flujos de trabajo integrales como generación de imágenes y videos, investigación profunda, actas de reuniones y procesamiento de documentos y tablas. Estas funciones, en esencia, consumen más tokens, requieren más capacidad de razonamiento y más potencia de cómputo multimodal que un chat normal.
Entonces, el hecho de que DouBao cobre probablemente no se debe a que "está perdiendo demasiado con chats normales", sino a:
Las capacidades de alto valor y los usuarios intensivos ya no pueden suministrarse gratuitamente de forma ilimitada.
La versión gratuita puede seguir existiendo como punto de entrada, para activación diaria y percepción de marca; pero las funciones que consumen más recursos deben clasificarse mediante suscripciones, cuotas, prioridades y la versión profesional.
La dificultad de la comercialización de la IA es que "los ingresos son fijos, pero los costos son variables".
El modelo de suscripción tiene una contradicción inherente:
El monto que paga el usuario cada mes es fijo, pero los tokens que consume no son fijos.
Esto es diferente de Netflix, Tencent Video o iQIYI. En las plataformas de video, una vez que se completa una serie, el costo marginal de que los usuarios la vean varias veces es relativamente limitado. Con la IA es distinto: cada conversación profunda, cada generación de video y cada análisis de contexto largo requieren volver a ocupar recursos de inferencia.
Los modelos de software tradicionales y el modelo de Netflix son más como:
Desarrollar una vez → Copiar infinitas veces → El costo marginal de vender una unidad adicional se acerca a 0
Pero el servicio de grandes modelos es más como:
Modelo de investigación y desarrollo una vez → Cada llamada requiere potencia de cómputo → Cuantos más usuarios y más profundamente los utilicen, mayor será el costo de inferencia.
Las API de OpenAI, Azure OpenAI, etc., cobran por token, lo que demuestra claramente esto: los tokens de entrada, los tokens de salida, el contexto largo y la caché de entrada tienen precios diferentes, y los tokens de salida suelen ser significativamente más caros.
En la página de precios oficial de OpenAI, GPT-5.5 tiene un costo de $2.5 por millón de tokens de entrada y $15 por millón de tokens de salida para contextos cortos, mientras que la entrada en caché es mucho más barata.
This is not the same economic model as selling Office, selling Photoshop, or selling operating systems.
La propia plataforma de ByteDance, VolcEngine, también muestra una lógica similar: el precio del modelo Doubao se cobra por millón de tokens para desarrolladores, por ejemplo, Doubao-Seed-2.0-pro se muestra desde 3.2 yuanes por millón de tokens de entrada y desde 16 yuanes por millón de tokens de salida.
Esto señala un problema fundamental:
Los productos de IA parecen ser suscripciones de membresía, pero en segundo plano se consumen por uso. Sin embargo, tampoco son completamente equivalentes a un restaurante.
Una forma más precisa de decirlo sería:
IA es una mezcla de "empresa de software + empresa de nube + empresa industrial intensiva en energía".
Si un usuario paga 68 yuanes al mes pero genera desmedidamente presentaciones PPT, videos e informes largos, los costos podrían consumir la mayor parte de sus ingresos.
Si un usuario paga 500 yuanes al mes, pero los utiliza principalmente para trabajos de alto valor y con consumo controlado, es un buen negocio.
Entonces, la suscripción de IA en esencia está haciendo una cosa:
Convierta los costos de poder de cómputo incontrolables en una estructura de ingresos predecible.
Cambiar de la competencia por escala de usuarios a la competencia por ARPU
Anteriormente, la competencia en aplicaciones de IA en el país se basaba en gran medida en ofrecer servicios gratuitos para atraer usuarios.
¿Por qué DouBao ha logrado un gran éxito? Además de tener ventajas en el producto, también se debe a que ByteDance cuenta con tráfico, fuertes capacidades de producto y un umbral de acceso gratuito bajo. DouBao es la aplicación de chat AI más utilizada en China; según datos de QuestMobile, sus usuarios activos semanales ascienden a aproximadamente 155 millones, mientras que DeepSeek tiene alrededor de 81,6 millones. Al mismo tiempo, Alibaba también ha impulsado el crecimiento de los usuarios de Qwen mediante subsidios sustanciales.
Pero el modo gratuito tiene un problema:
Cuanto mayor sea la escala de usuarios, más real será la presión sobre los costos.
Sobre todo, los productos de IA en China aún están en medio de una guerra de precios. DeepSeek ha reducido drásticamente las expectativas de costo del modelo, y Alibaba, ByteDance, Tencent y Baidu no quieren perder su punto de acceso. Como resultado, la IA para el consumidor fácilmente cae en una situación incómoda:
Los usuarios creen que la IA debería ser gratuita; la plataforma sabe que la IA no puede ser infinitamente gratuita; los inversores buscan crecimiento; la empresa internamente busca un cierre comercial.
La lanzamiento de la versión de pago de Doubao significa que quiere probar una pregunta:
¿Están los usuarios chinos dispuestos a pagar por flujos de trabajo de IA?
No pagas por "chatear", sino por "ahorrarme tiempo, hacer presentaciones, escribir informes, realizar investigaciones, procesar datos y generar videos".
Esta diferencia es clave.
Es difícil para los usuarios pagar 500 yuanes mensuales por "chatear conmigo".
Pero si realmente puede ayudar a profesionales de contenido, vendedores, profesores, estudiantes, operadores y consultores a ahorrar 1-2 horas al día, entonces la aceptación de 68 yuanes, 200 yuanes o 500 yuanes sería completamente diferente.
Esto también indica que la versión gratuita de IA se mantendrá, pero se volverá cada vez más "limitada".
Futuramente, las aplicaciones nativas de IA en el mercado nacional probablemente no cobrarán de forma uniforme, sino que tendrán una estructura de cuatro niveles:
Primer nivel: versión gratuita
Para adquirir clientes, establecer hábitos de uso y mantener la cuota de mercado. Las conversaciones normales, preguntas básicas y búsquedas ligeras seguirán siendo gratuitas.
Capa 2: Miembros de bajo costo
Para usuarios frecuentes comunes, como mayores límites, velocidades más rápidas, menos espera y mejores modelos.
Nivel tres: Versión profesional
Para creadores de contenido, profesionales, estudiantes, programadores e investigadores: ofrecemos presentaciones PPT, análisis de datos, investigaciones profundas, procesamiento de documentos, código y contextos largos.
Nivel 4: Servicios para empresas/API/Agentes
Cobro por uso o plan + cobro por exceso. Aquí es donde realmente se ejecuta el modelo de negocio.
Las tres niveles de 68, 200 y 500 que se están emitiendo actualmente en DouBao son esencialmente una prueba de esta estratificación.
La versión gratuita resuelve el "escalamiento de usuarios"; la versión estándar resuelve el "pago ligero"; las versiones mejorada y profesional resuelven la "recuperación de costos para usuarios intensivos".
ChatGPT, Claude, Gemini, Kimi, Tongyi, Zhipu y Doubao ya han o pronto se dirigirán hacia una estructura similar. La diferencia radica únicamente en: ¿cuál tiene la versión gratuita más potente?, ¿cuál ofrece los beneficios de pago más notables? y ¿cuál controla mejor los costos?
¿Por qué es más difícil la suscripción de IA que la SaaS tradicional?
Cada usuario adicional, cada conversación adicional, cada resumen extenso adicional y cada tarea adicional ejecutada por un agente requiere un mayor consumo de GPU, electricidad, memoria de video, ancho de banda, almacenamiento y operaciones de ingeniería.
Entonces, el problema más fundamental de las empresas de aplicaciones de IA no es:
¿Hay usuarios?
sino:
¿Más usuarios significan más ganancias o más gastos?
Esto es muy diferente al SaaS tradicional. En el SaaS tradicional, una vez que el sistema está establecido, el margen bruto de nuevos clientes suele ser alto; pero en los productos de IA, si los usuarios los utilizan mucho, pueden generar costos de inferencia más altos. La preocupación actual del mercado sobre el retorno de la inversión en IA de las grandes tecnológicas es esencialmente este mismo problema. Alphabet, Microsoft, Meta, Amazon y otras grandes empresas han realizado inversiones masivas en IA este año, y los inversores comenzaron a prestar más atención a cuándo estos gastos en IA generarán retornos suficientes.
Pero el suscripción de IA no puede compararse simplemente con un restaurante, ya que es difícil que un restaurante reduzca el costo de "un plato de fideos" un 80% anualmente.
Pero la IA sí puede.
Porque el costo de la inferencia del modelo seguirá disminuyendo por varias cosas:
Primero, los chips se vuelven más potentes. Segundo, los modelos se vuelven más pequeños, con distilación, cuantización y enrutamiento MoE más refinado. Tercero, el almacenamiento en caché, el procesamiento por lotes y la reutilización del contexto reducirán el costo de cálculos repetidos. Cuarto, muchas tareas no requieren el modelo más potente y pueden completarse con modelos más pequeños. Quinto, las empresas pasarán de "acumular tokens ciegamente" a "consumir menos tokens por cada resultado empresarial".
Entonces, el costo marginal de la IA no es 0, pero tampoco es un costo fijo de ingredientes.
Es más como la nube computacional en sus inicios: al principio era cara, pero la escala, la optimización del hardware y el software seguirán reduciendo los costos.
Por eso, en la estructura de precios de OpenAI, la "entrada en caché" es mucho más barata que la entrada normal. La existencia del mecanismo de caché demuestra que los proveedores de IA están esforzándose por convertir los cálculos repetitivos en etapas más económicas, similares a software.
Esto hace que las empresas de IA necesiten responder simultáneamente a tres preguntas:
Primero, ¿cuánto está dispuesto a pagar el usuario? Esto es el lado de los ingresos.
En segundo lugar, ¿cuántos tokens consumirá el usuario mensualmente? Esto es el costo.
Tercero, ¿puede la velocidad de caída de los costos del modelo superar el crecimiento del uso? Esto es desde el lado del margen de beneficio.
If the answer is:
El usuario está dispuesto a pagar 200 yuanes, pero el costo mensual es de 150 yuanes, por lo que este negocio es bastante mediocre.
Si la respuesta es: el usuario está dispuesto a pagar 200 yuanes; el costo es solo de 20 yuanes, y puede reducirse aún más a 10 yuanes con la optimización del modelo.
Entonces, las aplicaciones de IA vuelve a acercarse a un buen negocio de software.
Por lo tanto, el verdadero indicador clave del modelo de negocio de IA no es el DAU, ni tampoco el número de descargas, sino:
Ingreso por usuario pagado / Costo de inferencia por usuario pagado.
Es decir, el modelo de economía unitaria versión IA.
Esto afectará a su vez el mercado de IA
En relación con el mercado de acciones, esto es realmente importante.
El mercado ahora negocia IA; la primera fase mira:
¿Explotará la demanda de poder de cálculo?
Por lo tanto, subieron NVIDIA, TSMC, Broadcom, almacenamiento, equipos eléctricos y centros de datos.
En la segunda fase, el mercado preguntará:
¿Hay usuarios para las aplicaciones de IA?
Por lo tanto, se prestará atención al tamaño de la base de usuarios de ChatGPT, Doubao, Kimi, Qwen, Copilot y Gemini.
Fase tres, la fase más crítica que viene a continuación, el mercado se preguntará:
¿Pueden estos usuarios pagar? ¿Pueden ganar dinero después de pagar?
Se rumorea que DouBao cobrará, lo que en realidad marca el inicio de la tercera fase.
Si en el futuro se ven estas señales, el mercado de IA será más saludable:
La tasa de conversión paga es buena; los usuarios no han abandonado masivamente debido a los cargos; hay compradores para la versión profesional de alto precio; los clientes empresariales comenzaron a comprar a gran escala; los costos de inferencia continúan disminuyendo; las funciones de IA brindan una verdadera capacidad de aumento de precios.
Pero si se observa la señal opuesta:
Los usuarios solo quieren usarlo gratis; la versión de pago tiene mala reputación; la plataforma reduce constantemente los precios en promociones; los usuarios frecuentes han desbordado los costos; los ingresos por aplicaciones de IA crecen rápidamente, pero los márgenes brutos son bajos.
Entonces el mercado comenzará a dudar:
¿Es un buen negocio la capa de aplicaciones de IA?
Esto se transmitirá aún más hacia arriba en la cadena. Porque si la capa de aplicaciones no genera ganancias, a los proveedores de nube y de modelos les preguntarán: ¿por qué siguen aumentando su gasto en capital?
Diferentes empresas de IA tienen modelos económicos completamente distintos
También hay un problema: no se pueden agrupar todas las empresas de IA juntas.
1. NVIDIA, TSMC, almacenamiento, equipos eléctricos
Estos son los que venden palas. Cuanto más use la gente la IA, más ganan ellos.
No asumen directamente el costo de los tokens de los usuarios finales, sino que absorben los gastos de capital generados por la expansión de la inferencia y el entrenamiento de IA.
2. Proveedores de nube: Microsoft, Google, Amazon
They are in between.
Por un lado, la IA impulsa el crecimiento de los ingresos en la nube; por otro, ellas mismas asumen enormes gastos de capital, depreciación, costos de electricidad y de centros de datos. Reuters Breakingviews señala que los gastos en IA de las grandes empresas están expandiéndose considerablemente, pero el mercado también se preocupa cada vez más por si estas inversiones generarán retornos claros.
Entonces, el problema de los proveedores de nube es:
¿Puede el crecimiento de los ingresos de la nube de IA cubrir los costos de los centros de datos, GPU, depreciación y electricidad?
3. Empresas de aplicaciones de IA: Copilot, ChatGPT, diversos Agentes
Cuanto más use el usuario, mayor será el costo. Si se trata de una suscripción fija, por ejemplo, cobrar un precio fijo mensual, pero el usuario lo utiliza intensivamente, el margen bruto se verá afectado.
Por lo tanto, el estado más ideal para las aplicaciones de IA no es "el usuario chatea infinitamente", sino:
Los usuarios están dispuestos a pagar un precio alto, pero el consumo real de tokens es controlable.
Por ejemplo, si una empresa está dispuesta a pagar 30, 50 o 100 dólares mensuales por un asistente de ventas de IA, un asistente de código de IA o un asistente jurídico de IA, pero el costo de procesamiento detrás de ello es solo unos pocos dólares, entonces es un buen negocio.
4. Empresas de software tradicionales + IA
Por ejemplo, empresas como Microsoft, Adobe y Salesforce podrían convertir la IA en una herramienta para aumentar los precios si logran integrar funciones de IA en sus software existentes, mejorar el ARPU y mantener bajo control los costos.
Para ellos, la IA no es un nuevo emprendimiento, sino un paquete de recargo de IA añadido a los canales existentes de distribución de software.
Entonces, la mayor divergencia en la valoración de la IA está aquí
No es necesario discutir si la IA es útil o tiene futuro; la IA es sin duda el futuro.
El problema más profundo es: ¿es la IA realmente un software de alto margen o una industria intensiva en capital?
Los optimistas creen que:
El costo de la IA disminuirá rápidamente, las aplicaciones explotarán, el ARPU aumentará, y finalmente seguirá siendo un negocio de software con altas margen de ganancia.
Los pesimistas creen que:
La IA se convertirá en una carrera armamentista, donde todos comprarán GPU, construirán centros de datos y pagarán facturas eléctricas, pero los usuarios quizás no estén dispuestos a pagar precios suficientemente altos por cada token, lo que hará que las ganancias se consuman por los costos de infraestructura.
Creo que la verdad está en el medio:
Los modelos base y la infraestructura en la nube se volverán cada vez más como industrias de activos pesados; solo las aplicaciones de IA con distribución, escenarios y poder de fijación de precios tendrán la oportunidad de volver a convertirse en negocios de software.
Esto también explica por qué los mercados de IA podrían divergir
En la primera fase, el mercado compra:
Quien tenga algo que ver con IA, sube.
En la segunda fase, el mercado preguntará:
¿Quién puede convertir la IA en ingresos?
En la tercera fase, el mercado seguirá preguntando:
¿Quién puede convertir los ingresos de IA en ganancias y flujo de efectivo libre?
La IA no tiene el mismo modelo de “vender una copia adicional con costo casi cero” que el software tradicional; cada servicio requiere consumo de potencia de cómputo, por lo que inherentemente posee las características de costo de restaurantes, nube y empresas manufactureras.
Pero la IA no es tan lineal como un restaurante, ya que la optimización del modelo, el almacenamiento en caché, los avances en chips, el procesamiento por lotes y el enrutamiento de modelos pequeños hacen que el costo por unidad siga disminuyendo.
Entonces, lo que realmente hay que mirar en el modelo de negocio de IA no es "si tiene ingresos", sino:
Cuánta GPU, electricidad y costo de tokens se consumen por cada dólar de ingresos de IA.
Esta será la pregunta central que el mercado repetirá una y otra vez a las empresas de IA.
¿Cuánta rentabilidad tiene el futuro de la IA?
