OpenAI lance LifeSciBench, un nouveau benchmark conçu pour évaluer les capacités des systèmes d'IA dans des scénarios de recherche réels. LifeSciBench repose sur 750 tâches rédigées par des experts, couvrant 7 flux de travail de recherche et 7 domaines biologiques. Ces tâches proviennent de 173 chercheurs titulaires d'un doctorat et possédant une expérience dans les domaines de la biotechnologie ou de l'industrie pharmaceutique. Ce benchmark met l'accent sur l'évaluation de compétences de recherche complexes, telles que l'intégration de preuves, la conception d'expériences, l'analyse de données, le raisonnement scientifique et la communication scientifique, plutôt que sur des questions factuelles isolées. Plus de 79 % des tâches impliquent un raisonnement à plusieurs étapes, avec une moyenne d'environ 4 étapes de raisonnement par question, et incluent 1 062 pièces jointes réelles liées à la recherche (telles que des articles, des graphiques, des données séquentielles et des fichiers structuraux).
OpenAI lance LifeSciBench pour évaluer les systèmes d'IA dans la recherche scientifique réelle
TechFlowPartager
OpenAI a lancé LifeSciBench, un nouveau benchmark pour évaluer les systèmes d'IA dans la recherche scientifique réelle. L'outil comprend 750 tâches conçues par des experts dans sept domaines de la biologie, avec la contribution de 173 chercheurs ayant un doctorat. Il se concentre sur des compétences complexes telles que la conception expérimentale et l'analyse des données, 79 % des tâches nécessitant un raisonnement en plusieurs étapes. Les actualités sur les actifs du monde réel (RWA) soulignent l'inclusion de 1 062 fichiers de données scientifiques. Les observateurs des actualités sur l'IA et la cryptomonnaie peuvent noter l'intersection croissante entre l'IA et les outils de recherche spécialisés.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.