OpenAI melancarkan piawaian penilaian baharu LifeSciBench, yang bertujuan untuk mengukur kemampuan sistem AI dalam skenario penyelidikan sebenar. LifeSciBench berdasarkan 750 tugas yang ditulis oleh pakar, meliputi 7 aliran kerja penyelidikan dan 7 bidang biologi, dengan tugas-tugas tersebut diambil daripada 173 penyelidik yang mempunyai ijazah doktor dan pengalaman dalam bidang bioteknologi atau farmaseutikal. Piawaian ini menekankan penilaian kemampuan penyelidikan yang kompleks, termasuk integrasi bukti, reka bentuk eksperimen, analisis data, penaakulan saintifik, dan komunikasi penyelidikan, bukan hanya soalan fakta tunggal. Lebih daripada 79% tugas mengandungi penaakulan berbilang langkah, dengan purata 4 langkah penaakulan setiap soalan, serta menyertakan 1,062 lampiran data berkaitan penyelidikan sebenar (seperti kertas kerja, grafik, data urutan, dan fail struktur).
OpenAI Melancarkan LifeSciBench untuk Menilai Sistem AI dalam Penyelidikan Saintifik Sebenar
TechFlowKongsi
OpenAI telah melancarkan LifeSciBench, tolok baharu untuk menilai sistem AI dalam penyelidikan saintifik sebenar. Alat ini merangkumi 750 tugas yang direka oleh pakar dalam tujuh bidang biologi, dengan sumbangan daripada 173 penyelidik tahap PhD. Ia berfokus pada kemahiran kompleks seperti reka bentuk eksperimen dan analisis data, dengan 79% tugas memerlukan penaakulan berbilang langkah. Berita aset dunia nyata (RWA) menekankan penglibatan 1,062 fail data saintifik. Pemantau berita AI + kripto mungkin memperhatikan persimpangan yang semakin meningkat antara AI dan alat penyelidikan khusus.
Sumber:Tunjukkan artikel asal
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini.
Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.