OpenAI lance LifeSciBench pour évaluer les systèmes d'IA dans la recherche scientifique réelle

iconTechFlow
Partager
AI summary iconRésumé

OpenAI lance LifeSciBench, un nouveau benchmark conçu pour évaluer les capacités des systèmes d'IA dans des scénarios de recherche réels. LifeSciBench repose sur 750 tâches rédigées par des experts, couvrant 7 flux de travail de recherche et 7 domaines biologiques. Ces tâches proviennent de 173 chercheurs titulaires d'un doctorat et possédant une expérience dans les domaines de la biotechnologie ou de l'industrie pharmaceutique. Ce benchmark met l'accent sur l'évaluation de compétences de recherche complexes, telles que l'intégration de preuves, la conception d'expériences, l'analyse de données, le raisonnement scientifique et la communication scientifique, plutôt que sur des questions factuelles isolées. Plus de 79 % des tâches impliquent un raisonnement à plusieurs étapes, avec une moyenne d'environ 4 étapes de raisonnement par question, et incluent 1 062 pièces jointes réelles liées à la recherche (telles que des articles, des graphiques, des données séquentielles et des fichiers structuraux).

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.