MathCode 0.2.0 publié, les coûts de l'API réduits de 90 %
KuCoinFlash
Partager
Résumé
MathCode 0.2.0 est désormais disponible, réduisant les coûts API de 90 % pour les projets d'IA et d'actualités crypto. Cette mise à jour améliore les taux de hits du cache grâce à des diagnostics de cache par préfixe et des contrôles de politique. Elle introduit le cache à plusieurs points d'arrêt, un ajustement dynamique de l'effort et une meilleure gestion des tâches. Les limites de budget en jetons sont désormais prises en charge, avec une intégration au serveur Kimina Lean pour un déploiement plus rapide. Les nouvelles listages de jetons peuvent bénéficier de cette amélioration d'efficacité.
ME AI Message, selon la surveillance de Beating, l'équipe Math-AI a publié l'agent intelligent MathCode 0.2.0 pour la forme mathématique et la preuve de théorèmes, réduisant les coûts API jusqu'à 90 % grâce à la forme des requêtes de cache de préfixe et au contrôle des stratégies. La nouvelle version optimise la stabilité de la structure des invites pour améliorer le taux de réussite du cache d'invite, en réponse aux coûts élevés des grands modèles lors de preuves longues et d'interactions en plusieurs étapes. Dans les scénarios de preuve de théorèmes, le modèle doit fréquemment accéder à de vastes bibliothèques de code et d'axiomes. MathCode 0.2.0 introduit un mécanisme de diagnostic et de contrôle des stratégies pour la forme des requêtes de cache de préfixe (Prefix-cache request-shape diagnostics and policy controls). Le système masque l'appartenance du début de l'invite pour garantir la stabilité structurelle, ajoute un cache à plusieurs points d'arrêt `MATHCODE_CACHE_MULTI_BREAKPOINT`, une passerelle explicite de préfixe minimal et une stratégie TTL sensible à l'inactivité, maximisant ainsi le taux de réussite du cache natif du fournisseur par l'alignement des formes de requêtes sous-jacentes et réduisant les factures des longues sessions à un dixième. La nouvelle version renforce également la gestion des tâches et le contrôle de la profondeur de réflexion. Pour éviter les dépassements de budget lors d'exécutions longues, le système permet de définir une limite supérieure de budget de tokens via MATHCODE_GOAL_MAX_TOKEN_BUDGET et limite le nombre maximal de commandes imbriquées avec slash pour prévenir les boucles infinies. De plus, les sessions de preuve permettent d'ajuster dynamiquement la profondeur de réflexion via --effort ou /effort, offrant des niveaux tels que `low`, `medium`, `high`, `max`, avec la possibilité de revenir à tout moment à la configuration par défaut. En ce qui concerne l'accélération de la compilation et le déploiement, la nouvelle version prend en charge l'exécution en arrière-plan du compilateur Kimina Lean Server développé par Project Numina en tant que processus enfant, en acheminant les requêtes de vérification de compilation vers l'interface /verify. Par ailleurs, le script d'installation setup.sh a été重构, avec l'ajout d'instructions telles que --status et --clean, permettant la vérification des sommes de contrôle release, la validation automatique et la réutilisation de l'environnement Lean/Lake système, réduisant ainsi les barrières au déploiement. (Source : BlockBeats)
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.