OpenAI запускає LifeSciBench для оцінки AI-систем у реальних наукових дослідженнях

iconTechFlow
Поділитися
AI summary iconКороткий зміст

OpenAI випустила новий оцінювальний стандарт LifeSciBench, призначений для вимірювання здатності AI-систем у реальних наукових сценаріях. LifeSciBench базується на 750 завданнях, розроблених експертами, і охоплює 7 типів наукових робочих процесів та 7 біологічних галузей. Завдання походять від 173 науковців із докторським ступенем та досвідом у галузі біотехнологій або фармацевтики. Цей стандарт зосереджений на оцінці складних наукових здібностей, таких як інтеграція доказів, проектування експериментів, аналіз даних, наукове мислення та наукова комунікація, а не на окремих фактологічних запитаннях. Більше 79% завдань містять багатокрокове мислення, у середньому на одне завдання припадає близько 4 кроків мислення, а також містить 1 062 реальні наукові додатки (наприклад, статті, діаграми, послідовнісні дані та структурні файли).

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.