OpenAI запускает LifeSciBench для оценки ИИ-систем в реальных научных исследованиях

iconTechFlow
Поделиться
AI summary iconСводка

OpenAI выпустила новый оценочный стандарт LifeSciBench, предназначенный для измерения способностей ИИ-систем в реальных научных сценариях. LifeSciBench основан на 750 задачах, разработанных экспертами, охватывающих 7 типов научных рабочих процессов и 7 областей биологии. Задачи созданы на основе опыта 173 научных сотрудников, имеющих докторские степени и опыт в биотехнологической или фармацевтической отрасли. Стандарт акцентирует оценку сложных научных навыков, включая интеграцию доказательств, проектирование экспериментов, анализ данных, научное рассуждение и научную коммуникацию, а не только фактологические вопросы. Более 79% задач требуют многошаговых рассуждений, в среднем около 4 шагов на вопрос, и включают 1 062 реальных научных приложения (таких как статьи, графики, последовательностные данные и структурные файлы).

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.