Aliyun lanza almacenamiento en caché implícito para Qwen3.7-Max, reduciendo los costos de entrada hasta en un 80%

icon MarsBit
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Aliyun introduce la memoria caché implícita para Qwen3.7-Max, reduciendo los costos de entrada hasta en un 80%. La actualización ya está disponible en BaiLian, sin necesidad de cambios en el código. Los aciertos de caché ahora cuestan el 20% de los tokens de entrada, ideales para flujos de trabajo con textos largos y agentes. Las nuevas listas de tokens podrían beneficiarse de este impulso de eficiencia. El modelo también admite la memoria caché explícita al 10%, pero requiere configuración manual. Las noticias sobre precios de criptomonedas suelen destacar tales innovaciones impulsadas por el costo.

Según el monitoreo de Beating, el equipo Qwen de Alibaba anunció que, en la plataforma Bailian de Alibaba Cloud, el modelo principal Qwen3.7-Max tiene activado por defecto el almacenamiento en caché implícito automático. Los desarrolladores pueden aprovechar directamente la reducción de costos del caché sin modificar el código ni especificar parámetros adicionales. Bajo el nuevo mecanismo de facturación, el sistema identifica y extrae automáticamente los prefijos de contexto repetidos en las solicitudes. Cuando se produce un acierto en el caché, los tokens de entrada correspondientes a la parte acertada se cobran solo al 20% del precio unitario original, eliminando directamente el 80% del costo de entrada. El almacenamiento en caché implícito aborda directamente los altos costos en escenarios de textos largos y agentes inteligentes. El Qwen3.7-Max, con una ventana de contexto de 1 millón de tokens, requiere lecturas frecuentes y repetidas de grandes bibliotecas de código o documentos de conocimiento al ejecutar tareas avanzadas como codificación autónoma. Un desarrollador que probó Qwen3.7 reportó que, al construir un demo web de "Tank Battle" en menos de una hora, consumió casi 1 millón de tokens. Si se permite que el agente inteligente ejecute automáticamente revisiones de código e iteraciones cíclicas en segundo plano, el consumo diario puede superar fácilmente cientos de millones de tokens. La competencia en precios de caché entre rivales fue otro factor directo que impulsó la reducción de precios de Alibaba. Anteriormente, DeepSeek V4-Pro atrajo a numerosos desarrolladores gracias a sus precios extremadamente bajos para aciertos en caché. Tras anunciar una reducción permanente a finales de mayo, el costo por acierto en caché de DeepSeek V4-Pro se redujo a solo $0.003625 por millón de tokens (aproximadamente 0.025 yuanes chinos), lo que equivale a eliminar directamente el 99.17% del costo sobre el precio estándar de entrada. Muchos desarrolladores, combinando herramientas especializadas como Reasonix, lograron llevar la tasa de aciertos en caché por sesión hasta un límite del 99%, haciendo que las facturas de ejecución de agentes con sesiones largas fueran casi nulas. Ante la presión competitiva, Qwen3.7-Max no solo lanzó un caché implícito sin necesidad de configuración, sino que también mantuvo el modo de caché explícito, que requiere declarar manualmente la etiqueta cache_control. En comparación con el caché automático, el caché explícito ofrece una mayor certeza en los aciertos, con un costo por acierto tan bajo como el 10% del precio unitario estándar (un 90% de descuento). Sin embargo, al crear el caché por primera vez, se aplica un recargo del 125%, y los bloques de caché tienen una vida útil de solo 5 minutos (cada acierto reinicia el temporizador).

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.