GLM-5.1 occupe la première place parmi les modèles open source dans le benchmark Artificial Analysis Coding Agent

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
L'entreprise d'analyse on-chain Artificial Analysis a publié l'indice Coding Agent le 13 mai (UTC+8), évaluant les modèles sur SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 et SWE-Atlas-QnA. GLM-5.1 (exécuté sur Claude Code) a dominé les modèles open source, tandis qu'Opus 4.7 (Cursor CLI) a mené l'ensemble des modèles. Le benchmark évalue les tâches de codage, les opérations en terminal et les questions techniques en situation réelle. GLM-5.1 affiche les meilleures performances parmi les modèles open source, avec une augmentation de l'intérêt pour les modèles nationaux.

Message AIMPACT, 13 mai (UTC+8) : L'institution d'évaluation mondiale reconnue Artificial Analysis a publié le tout nouveau benchmark Coding Agent — Artificial Analysis Coding Agent Index — pour évaluer les performances des combinaisons d'Agent harnesses et de modèles sur trois benchmarks majeurs : SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 et SWE-Atlas-QnA. Dans ce benchmark, le modèle propriétaire Opus 4.7 (exécuté sur Cursor CLI) a obtenu la première place mondiale, tandis que GLM-5.1 (exécuté sur Claude Code) a été classé premier parmi les modèles open source. Ce benchmark couvre des tâches de programmation réelles, des tâches agentic en terminal et des questions techniques, dans le but de refléter les performances réelles des agents de programmation dans des scénarios concrets. Selon les opinions exprimées dans l'article, GLM-5.1 représente la capacité SOTA des grands modèles nationaux dans ce contexte. (Source : InFoQ)

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.