Opus 4.8 est le meilleur modèle de codage actuel. FrontierCode de Cognition est probablement le benchmark de codage de la plus haute qualité que nous ayons vu jusqu'à présent. Il va au-delà de l'utilisation uniquement des tests unitaires pour l'évaluation, et teste également la sécurité contre les régressions, la propreté mécanique, la correction des tests, la portée et la qualité du code. Plus de 20 développeurs open source ont conçu manuellement 150 tâches, chacune ayant nécessité plus de 40 heures de construction. Il teste également un ensemble plus diversifié de langages de programmation.

Partager









Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.