Benchmark PinchBench : Gemini 3 Flash mène les modèles d'IA avec un taux de réussite de 95,1 % sur les tâches OpenClaw

KuCoinFlash

Date de parution :

Résumé

La liquidité et les marchés crypto ont vu émerger un nouveau référentiel, Gemini 3 Flash ayant obtenu le meilleur résultat au test PinchBench avec un taux de réussite de 95,1 % sur les tâches OpenClaw. Minimax-m2.1 et Kimi-k2.5 ont suivi avec respectivement 93,6 % et 93,4 %. Claude Sonnet 4.5 et GPT-4o ont obtenu 92,7 % et 85,2 %. Le test s'est concentré sur les performances d'agents dans des scénarios du monde réel. Les régulateurs surveillant la conformité CFT pourraient suivre ces indicateurs pour assurer la transparence.

Odaily Planet Daily rapporte que 23pads, CISO de SlowMist, a publié sur la plateforme X que le benchmark PinchBench évalue les performances des grands modèles de langage IA dans les tâches d'agent OpenClaw. Les résultats montrent que Gemini 3 Flash obtient un taux de réussite de 95,1 %, en tête, suivie par minimax-m2.1 et kimi-k2.5 avec respectivement 93,6 % et 93,4 %. Claude Sonnet 4.5 atteint 92,7 %, tandis que GPT-4o enregistre 85,2 %.

Source:Afficher l'original

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.