OpenAI、LifeSciBenchを発表し、実際の科学研究におけるAIシステムを評価

TechFlow

公開時期： 06/18/2026 12:52:56

概要

OpenAIは、実際の科学研究におけるAIシステムを評価するための新しいベンチマーク「LifeSciBench」をリリースしました。このツールは、7つの生物学分野にわたる750の専門家が設計したタスクを含み、173人の博士レベルの研究者が貢献しています。実験設計やデータ分析のような複雑なスキルに焦点を当てており、タスクの79％が複数ステップの推論を必要とします。リアルワールドアセット（RWA）のニュースでは、1,062の科学データファイルが含まれていることが注目されています。AI＋暗号通貨ニュースの観察者は、AIと専門的な研究ツールの交差が拡大していることに注目するかもしれません。

OpenAIは、AIシステムが実際の研究シーンで発揮する能力を評価することを目的とした新しいベンチマーク「LifeSciBench」をリリースしました。LifeSciBenchは、750の専門家が作成したタスクに基づいており、7つの研究ワークフローと7つの生物学分野をカバーしています。これらのタスクは、博士号を保有し、バイオテクノロジーまたは製薬業界の経験を持つ173名の研究者から提供されました。このベンチマークは、単一の事実性問題ではなく、証拠の統合、実験設計、データ分析、科学的推論、研究コミュニケーションなどの複雑な研究能力の評価に重点を置いています。79％以上のタスクが複数ステップの推論を含んでおり、平均して1問あたり約4つの推論ステップが必要です。また、1,062個の実際の研究関連データアタッチメント（論文、チャート、配列データ、構造ファイルなど）が含まれています。

出典:原文を表示

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。