El lanzamiento K2.6 y el aumento de precios de Moonshot se consideran un pre-OPC

Artículo por Xiang Xianzhi

La noche anteayer, Moonshot lanzó Kimi K2.6 y ajustó el precio de entrada de la API de 0.60 dólares por millón de tokens a 0.95 dólares.

Aumentó un 58 %. Por primera vez desde el lanzamiento de la serie K2.

Pero parece que nadie está prestando atención a esto.

Cuatro meses atrás, en una carta interna del último día de 2025, Yang Zhilin escribió que Moonshot "no tiene prisa por realizar una OPI a corto plazo". En ese momento, los prospectos de Zhipu y MiniMax ya habían sido presentados a la Bolsa de Hong Kong, lo cual claramente representaba una diferenciación intencionada de posición.

También escribió en esa carta que las reservas de efectivo de la empresa superan los 1.400 millones de dólares y que la ronda C de 500 millones de dólares estuvo sobrecotizada: la implicación es que el potencial del mercado primario aún no se ha aprovechado plenamente, y no hay prisa en el mercado secundario.

Tres meses después, Bloomberg informó que comenzó a contactar a CICC y Goldman Sachs. Tres semanas después, K2.6 se lanzó.

Una persona que no le gustaba “apresurarse” completó en cuatro meses la cosa que antes decía que no haría.

K2.6 definitivamente no es el último lanzamiento de producto antes de la lista de Lunar Dark Side. Pero este lanzamiento es la primera presentación de Yang Zhilin tras el plan de lista de Lunar Dark Side.

Kimi nunca ha lanzado una versión de modelo así.

Kimi solía tener un conjunto de acciones fijas al lanzar modelos.

Publicar informes técnicos, liberar pesos abiertos y subir a las listas de HuggingFace, luego esperar la revisión de la comunidad técnica. K1.5 se alinea con o1 en metodologías de inferencia, con más detalles técnicos que números de benchmark; K2 Thinking directamente sube los pesos a HuggingFace para que los desarrolladores los prueben por sí mismos. Estas acciones están dirigidas a desarrolladores e investigadores.

El discurso también es el típico de la comunidad técnica: resolvimos qué problema, por qué nuestro método es mejor, bienvenidos a replicarlo.

El movimiento de K2.6 es diferente.

Primero, el aumento de precios. En términos de yuanes chinos, el precio de entrada por millón de tokens para K2.6 es de 6.5 yuanes (fallo de caché), y para K2.5 es de 4 yuanes. El precio de salida aumentó de 21 yuanes a 27 yuanes. El precio con acierto de caché es de 1.1 yuanes.

Este es un aumento estructurado. Aunque todas las bandas muestran un aumento, la banda con mayor tasa de aciertos en caché tiene el incremento más pequeño: de 0.7 yuanes a 1.1 yuanes, lo que equivale a 0.16 dólares por millón de tokens.

Este 0.16 dólares es la clave para entender este aumento de precio.

Para clientes empresariales que utilizan el mismo prompt de sistema a largo plazo: el asistente de código, el marco de orquestación de agentes y el servicio al cliente inteligente comparten un alto grado de reutilización de prefijos, logrando una tasa de aciertos en caché del 75% al 83%. Moonshot ha establecido un precio casi equivalente para este grupo de clientes.

For occasional users with varying prompts each time, this price increase has been fully passed on to them.

Esta es una ajuste de precios amigable para las empresas ya vinculadas a Kimi, y un ajuste de precios poco amigable para los clientes individuales que aún comparan precios. Los primeros son los “clientes corporativos bloqueados” del relato de lanzamiento; los segundos son los “usuarios de cola larga” que nunca aparecen en las presentaciones de路演. Moonshot entiende perfectamente quiénes son sus activos de valoración.

La estructura de poder de cómputo en la era de los Agentes es diferente a la de la era de las conversaciones. Los modelos de conversación implican intercambios de decenas de tokens, mientras que los Agentes consumen miles de llamadas a herramientas y decenas de miles de tokens. En los casos de uso oficiales de K2.6: la implementación local en Mac del modelo Qwen3.5 realizó más de 4.000 llamadas a herramientas durante 12 horas; la reestructuración del motor de negociación open-source exchange-core requirió más de 1.000 llamadas a herramientas en 13 horas; y aún más extremo, la ejecución autónoma durante 5 días para monitoreo y alertas, y respuesta a fallas. El consumo de tokens en estas tareas individuales es cientos o incluso miles de veces mayor que en los escenarios de conversación de la era K2.5.

Of course, this case is used to illustrate long-range reasoning capabilities, but with the addition of this K2.6 300-agent cluster, the token consumption must be staggering.

A la antigua tarifa de 0.60 dólares, este agente podría generar pérdidas por cada llamada. A 0.95 dólares, apenas cubre los costos de inferencia.

Entonces, el aumento de precios no es una muestra de confianza, sino una necesidad. Moonshot ha recaudado un total de 2.5 mil millones de dólares, con 1.4 mil millones de dólares en efectivo reservado desde la ronda C hasta la C+. Sin embargo, si la próxima generación de K3 tiene realmente una escala de 3 a 4 billones de parámetros, una sola ronda de preentrenamiento podría consumir la mitad de ese monto.

Sin aumentos de precios, los datos de margen bruto de los últimos trimestres antes de la salida a bolsa serán poco favorables. La memoria informativa debe revelar el margen bruto.

Lado oscuro de la luna

Esto podría haberse explicado abiertamente: la era de los Agentes requiere un nuevo modelo de precios. Pero Moonshot no lo mencionó. Porque los usuarios finales acaban de salir de la era gratuita de K2 Thinking, y decirles ahora “aumenté los precios” no es una buena historia de producto.

Es una historia contada para otra audiencia: Kimi ya tiene un grupo de clientes empresariales que no pueden vivir sin él, y aunque sea más caro, lo usarán. (Como yo mismo)

Lo segundo es la comparación de referencia. El referente elegido oficialmente por K2.6 es GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro. Los tres son los modelos insignia de la generación anterior.

La misma semana, Anthropic lanzó Claude Mythos, y Opus 4.7 acaba de salir: ambos son una generación más potentes que Opus 4.6. K2.6 no les hace frente.

En realidad, es una elección activa. En comparación con Mythos, K2.6 se ubica en la posición de "seguidor"; en comparación con Opus 4.6, K2.6 se ubica en el "primer nivel". Una valoración de 18 mil millones de dólares requiere lo último.

Kimi antes no hacía este tipo de cosas. Cuando se lanzó K2 Thinking, el equipo oficial publicó directamente todos los benchmarks, con resultados buenos y malos, para que los desarrolladores pudieran juzgar por sí mismos. Ese es el enfoque de la comunidad técnica: la comunidad entiende tus fortalezas y debilidades, y está dispuesta a aceptar un modelo con deficiencias evidentes pero una hoja de ruta clara.

No es el PPT de la presentación. El PPT de la presentación necesita una conclusión que un gestor de fondos pueda entender en 30 segundos: “igual o mejor que los modelos cerrados más avanzados del mundo”. Esta frase es el texto original del blog oficial de K2.6.

Lo tercero es el clúster de agentes y el doble camino de código abierto. K2.6 actualizó una función llamada Claw Groups: un ecosistema de agentes heterogéneos donde agentes con distintos dispositivos, modelos y cadenas de herramientas operan en un espacio de colaboración, con K2.6 actuando como coordinador. 300 agentes secundarios en paralelo, 4000 pasos de cooperación, 5 días de funcionamiento autónomo.

Estos números están dirigidos a clientes empresariales, no a desarrolladores. Para un desarrollador, “300 agents en paralelo” no tiene sentido práctico—nadie ejecuta 300 agents en un proyecto local. Esta configuración solo tiene sentido para un tipo de cliente: grandes empresas que necesitan automatizar procesos completos con una matriz de agents.

The story is about Salesforce, not HuggingFace.

Al mismo tiempo, K2.6 está completamente de código abierto. Yang Zhilin dijo en el Foro Zhongguancun el 26 de marzo que el código abierto será una victoria absoluta.

Código abierto + clúster de agentes empresariales, este es el punto intermedio entre DeepSeek y Anthropic, con mitad de cada modelo. Suena como una buena historia. Pero al ocupar ambos lados, significa que hay que demostrar ambos.

El mercado de capitales realmente no se preocupa por si estas preguntas tienen respuestas. Solo requiere que cada línea tenga una historia.

Aumento de precios, comparación con, clúster de Agentes: estos tres elementos juntos tienen un punto en común inusual. Ninguno está destinado a la comunidad técnica.

El principio subyacente detrás de los modelos anteriores de Kimi era: si los desarrolladores me aprecian, los clientes empresariales eventualmente seguirán, y el mercado de capitales lo hará aún más. Este enfoque tiene un nombre: buena fe técnica.

K2.6 Ya no esperar. El aumento de precios es un anuncio directo del poder de fijación de precios del lado B, posicionar anticipadamente el valor frente a GPT-5.4, y los clústeres de Agentes y Claw Groups son modelos de muestra para la historia de servicios empresariales.

Cada punto corresponde a una pregunta en la presentación de la路演: ¿Cuál es tu capacidad de comercialización? ¿Cuál es tu posición de referencia? ¿Cuál es tu barrera B2B?

De la versión preliminar a la GA se redujo a 8 días, siguiendo la misma lógica. Las versiones anteriores de la serie K2 pasaron por períodos de previsualización de 2 a 3 meses, permitiendo que la comunidad realizara pruebas suficientes, aportara comentarios suficientes y se iterara lo suficiente. K2.6 no se dio ese espacio. No es que la tecnología madurara más rápido, es que el plazo no espera.

IPO en la segunda mitad de 2026; según el proceso de la Bolsa de Hong Kong, se necesitan de 4 a 6 meses para presentar la solicitud, responder preguntas, realizar audiencias, realizar giras de promoción, fijar el precio y el período de reflexión. Iniciar las giras de promoción en septiembre implica que el producto debe estar listo en abril.

No se emitirá GA en abril, y no habrá más oportunidades después.

K3 es el verdadero clímax

But K2.6 is not the strongest card Moonshot can bring to the table.

En el blog oficial hay una frase muy contenida: K2.6 es el "runway" preparado para K3.

Codificación de 12 horas, clúster de 300 agentes, compresor de contexto: estos no son los形态 finales de la serie K2, sino infraestructura de capa de ejecución que puede soportar un modelo base más grande. Moonshot no invertirá esfuerzos en hacer funcionar esto a menos que esté completamente segura de que un modelo más grande consumirá estas capacidades.

Reddit anteriormente filtró información sobre K3, con un tamaño de parámetros objetivo de 3 a 4 billones. En comparación con la escala de billones de la serie K2, esto representa un salto en la base.

Si K3 puede lanzarse antes de la ventana de presentación, esa será la verdadera respuesta. La pista preparada por K2.6 permite que K3 despegue.

La pregunta es si pueden alcanzar el plazo. ¿Cuánto tiempo lleva entrenar un modelo de 3-4 billones de parámetros? GPT-5 y Claude Opus 4.6 tienen un ciclo de preentrenamiento de aproximadamente 6-9 meses, más algunos meses adicionales para postentrenamiento y evaluación de seguridad. ¿Puede la capacidad de cómputo actual de Moonshot —según la colaboración con Alibaba Cloud y sus reservas de efectivo actuales— reducir este ciclo a 5-6 meses?

La apuesta se colocó en K2.6.

Ocho días de preview a GA, el clúster de agentes se expandió de 100 a 300 de un solo golpe, y la ejecución a largo plazo se incrementó de cientos de pasos a 4.000 pasos: cada acción comprime el tiempo y abre espacio para las posibilidades de K3.

Si K3 se lanza antes de agosto o septiembre, será el clímax del tour de presentación.

Si no logras llegar a tiempo, K3 se convertirá en un modelo que solo se lanzará después de la cotización, y K2.6 tendrá que soportar por sí solo toda la narrativa de valoración.

The Dark Side of the Moon bets that it can be done.

¿Qué respalda la valoración de 18 mil millones de dólares?

Volver a la valoración.

Hace tres meses, la valoración de Moonlight era de 4.300 millones de dólares; hace dos meses, de 5.500 millones de dólares; ahora, de 18.000 millones de dólares.

No es que Dark Side of the Moon se haya fortalecido cuatro veces en los últimos tres meses. Fue después del lanzamiento de Zhipu y MiniMax cuando aumentó cuatro veces, elevando el techo de toda la categoría. La capitalización de mercado de Zhipu en Hong Kong es de 305.000 millones de HKD, y la de MiniMax es de 309.200 millones de HKD: ambas superan el pico histórico de SenseTime.

La lógica de valorización de estas dos empresas no es "qué puede lograr la tecnología de próxima generación", sino "cuánto puede valorarse el activo de IA en este mercado de Hong Kong".

La valoración de 18 mil millones de dólares de Moonshot se basa en lo mismo. Ya no se trata de demostrar que es la empresa de IA china más fuerte, sino de demostrar que es una empresa de IA china que puede ser valorada.

K2.6 Todas las acciones — el aumento de precios, la comparación, el clúster de Agentes, la doble vía de código abierto — responden a esta proposición.

Pero hay una cosa que K2.6 aún no ha demostrado: ¿Están dispuestos los usuarios finales de Kimi a pagar por K2.6 tras el aumento de precios? ¿Los usuarios de suscripción pagada migrarán hacia DeepSeek o MiniMax? ¿Cuántos clientes empresariales están utilizando realmente Claw Groups, y cuántos solo firmaron un POC?

Estos números son los que los inversores seguramente preguntarán durante la ronda de presentaciones. K2.6 solo puede mostrar el producto ahora. Si puede convertirse en números dependerá de los próximos tres meses.

Cuando ZhiPu presentó su prospecto, aún no había logrado la rentabilidad; MiniMax también lo hizo. Los inversores aceptaron esta historia porque en ese momento se acababa de abrir la gran narrativa de los "activos de IA en China". Moonshot llegó seis meses tarde. El mismo problema: ZhiPu y MiniMax pueden decir "estamos validando", mientras que Moonshot debe decir "estamos monetizando".

Esta presión recae completamente en los tres meses entre K2.6 y K3.

Entonces, volviendo a la pregunta inicial: ¿es K2.6 la última gira de presentación antes del lanzamiento de MoonShadow?

No.

Si K3 logra captar la ventana de la gira de presentaciones, entonces K3 será el verdadero clímax. K2.6 solo habrá preparado la pista para ello. Si K3 no logra captar la ventana de la gira de presentaciones, K2.6 deberá asumir toda la narrativa del lanzamiento. Entonces, será la primera presentación que Yang ZhiLin se verá obligado a dar con anticipación.

Ninguno de los resultados era lo que Yang Zhilin quería hace cuatro meses.

Pero todo lo que sucedió en estos cuatro meses: el lanzamiento de Zhipu MiniMax, el aumento del techo de valoración y la reducción del período de oportunidad, hizo que alguien que no le gusta la prisa tuviera que apresurarse.

Cuando se lanzó K3, fue la segunda ronda.