MathCode 0.2.0 lanzado, los costos de la API reducidos en un 90%

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
MathCode 0.2.0 ya está en funcionamiento, reduciendo los costos de la API en un 90% para proyectos de IA y noticias de criptomonedas. La actualización mejora las tasas de aciertos en caché con diagnósticos de caché por prefijo y controles de política. Añade caché con múltiples puntos de interrupción, ajuste dinámico del esfuerzo y mejor gestión de tareas. Ahora se admiten límites de presupuesto de tokens, con integración al servidor Kimina Lean para una implementación más rápida. Las nuevas listas de tokens pueden beneficiarse de este impulso de eficiencia.
ME AI Noticia, según el monitoreo de Beating, el equipo Math-AI ha lanzado el agente de inteligencia artificial MathCode 0.2.0 para la formulación matemática y la demostración de teoremas, reduciendo hasta un 90% los costos de la API mediante la reestructuración de solicitudes de caché de prefijos y el control de estrategias. La nueva versión optimiza la estabilidad de la estructura de los prompts para aumentar la tasa de aciertos en la caché de prompts, abordando los altos costos asociados con demostraciones largas e interacciones multirround en modelos grandes. En escenarios de demostración de teoremas, el modelo debe acceder frecuentemente a grandes bibliotecas de código y axiomas. MathCode 0.2.0 introduce el mecanismo Prefix-cache request-shape diagnostics and policy controls. El sistema bloquea la atribución del encabezado del prompt para garantizar la estabilidad estructural, añadiendo caché de múltiples puntos de interrupción `MATHCODE_CACHE_MULTI_BREAKPOINT`, puertas de entrada explícitas de prefijo mínimo y estrategias TTL sensibles a la inactividad, alineando la forma subyacente de las solicitudes para maximizar la tasa de aciertos nativa de caché del proveedor y reducir las facturas de sesiones largas a una décima parte. La nueva versión también fortalece la gestión de tareas y el control de profundidad de razonamiento. Para evitar gastos excesivos en ejecuciones largas, el sistema permite establecer un límite superior de presupuesto de tokens mediante MATHCODE_GOAL_MAX_TOKEN_BUDGET y limita el número máximo de comandos anidados con barra inclinada para prevenir bucles infinitos. Además, las sesiones de demostración permiten ajustar dinámicamente la profundidad de razonamiento mediante --effort o /effort, ofreciendo niveles como `low`, `medium`, `high`, `max`, y permitiendo volver a la configuración predeterminada en cualquier momento. En cuanto a la aceleración de compilación y despliegue, la nueva versión admite el uso del compilador Kimina Lean Server, desarrollado por Project Numina, como un subproceso en ejecución permanente, redirigiendo las solicitudes de verificación de compilación al endpoint /verify. Asimismo, el script de instalación setup.sh ha sido reestructurado, incorporando comandos nuevos como --status y --clean, que permiten validar checksums release, verificar y reutilizar automáticamente el entorno Lean/Lake del sistema, reduciendo así la barrera de despliegue. (Fuente: BlockBeats)
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.