OpenAI, Gerçek Bilimsel Araştırmalarda AI Sistemlerini Değerlendirmek İçin LifeSciBench’i Başlatıyor

iconTechFlow
Paylaş
AI summary iconÖzet

OpenAI, LifeSciBench adlı yeni bir değerlendirme standardını yayınladı; bu standart, AI sistemlerinin gerçek bilimsel senaryolardaki yeteneklerini ölçmeyi amaçlıyor. LifeSciBench, 7 bilimsel çalışma akışı ve 7 biyoloji alanını kapsayan 750 adet uzman tarafından hazırlanan görevden oluşuyor. Bu görevler, biyoteknoloji veya ilaç endüstrisi deneyimine sahip 173 doktora sahibi bilim insanından gelmektedir. Bu değerlendirme standardı, tekil gerçek bilgi soruları yerine, kanıt entegrasyonu, deney tasarımı, veri analizi, bilimsel akıl yürütme ve bilimsel iletişim gibi karmaşık bilimsel yeteneklerin değerlendirilmesine odaklanmaktadır. Görevlerin %79'dan fazlası çok adımlı akıl yürütme gerektiriyor; ortalama her soru yaklaşık 4 adımlık akıl yürütme gerektiriyor ve 1.062 adet gerçek bilimsel veri eki (makaleler, grafikler, dizi verileri ve yapı dosyaları vb.) içeriyor.

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.