OpenAI、LifeSciBenchを発表し、実際の科学研究におけるAIシステムを評価

iconTechFlow
共有
AI summary icon概要

OpenAIは、AIシステムが実際の研究シーンで発揮する能力を評価することを目的とした新しいベンチマーク「LifeSciBench」をリリースしました。LifeSciBenchは、750の専門家が作成したタスクに基づいており、7つの研究ワークフローと7つの生物学分野をカバーしています。これらのタスクは、博士号を保有し、バイオテクノロジーまたは製薬業界の経験を持つ173名の研究者から提供されました。このベンチマークは、単一の事実性問題ではなく、証拠の統合、実験設計、データ分析、科学的推論、研究コミュニケーションなどの複雑な研究能力の評価に重点を置いています。79%以上のタスクが複数ステップの推論を含んでおり、平均して1問あたり約4つの推論ステップが必要です。また、1,062個の実際の研究関連データアタッチメント(論文、チャート、配列データ、構造ファイルなど)が含まれています。

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。