MathCode 0.2.0 publié, les coûts de l'API réduits de 90 %

ME AI Message, selon la surveillance de Beating, l'équipe Math-AI a publié l'agent intelligent MathCode 0.2.0 pour la forme mathématique et la preuve de théorèmes, réduisant les coûts API jusqu'à 90 % grâce à la forme des requêtes de cache de préfixe et au contrôle des stratégies. La nouvelle version optimise la stabilité de la structure des invites pour améliorer le taux de réussite du cache d'invite, en réponse aux coûts élevés des grands modèles lors de preuves longues et d'interactions en plusieurs étapes. Dans les scénarios de preuve de théorèmes, le modèle doit fréquemment accéder à de vastes bibliothèques de code et d'axiomes. MathCode 0.2.0 introduit un mécanisme de diagnostic et de contrôle des stratégies pour la forme des requêtes de cache de préfixe (Prefix-cache request-shape diagnostics and policy controls). Le système masque l'appartenance du début de l'invite pour garantir la stabilité structurelle, ajoute un cache à plusieurs points d'arrêt `MATHCODE_CACHE_MULTI_BREAKPOINT`, une passerelle explicite de préfixe minimal et une stratégie TTL sensible à l'inactivité, maximisant ainsi le taux de réussite du cache natif du fournisseur par l'alignement des formes de requêtes sous-jacentes et réduisant les factures des longues sessions à un dixième. La nouvelle version renforce également la gestion des tâches et le contrôle de la profondeur de réflexion. Pour éviter les dépassements de budget lors d'exécutions longues, le système permet de définir une limite supérieure de budget de tokens via MATHCODE_GOAL_MAX_TOKEN_BUDGET et limite le nombre maximal de commandes imbriquées avec slash pour prévenir les boucles infinies. De plus, les sessions de preuve permettent d'ajuster dynamiquement la profondeur de réflexion via --effort ou /effort, offrant des niveaux tels que `low`, `medium`, `high`, `max`, avec la possibilité de revenir à tout moment à la configuration par défaut. En ce qui concerne l'accélération de la compilation et le déploiement, la nouvelle version prend en charge l'exécution en arrière-plan du compilateur Kimina Lean Server développé par Project Numina en tant que processus enfant, en acheminant les requêtes de vérification de compilation vers l'interface /verify. Par ailleurs, le script d'installation setup.sh a été重构, avec l'ajout d'instructions telles que --status et --clean, permettant la vérification des sommes de contrôle release, la validation automatique et la réutilisation de l'environnement Lean/Lake système, réduisant ainsi les barrières au déploiement. (Source : BlockBeats)