OpenAI, Gerçek Bilimsel Araştırmalarda AI Sistemlerini Değerlendirmek İçin LifeSciBench’i Başlatıyor

TechFlow

Çıkış zamanı: 06/18/2026 12:52:56

Paylaş

Özet

OpenAI, LifeSciBench adlı, yapay zeka sistemlerini gerçek bilimsel araştırmalarda değerlendirmek için yeni bir ölçütü piyasaya sürdü. Araç, 173 doktora düzeyinde araştırmacının katkılarıyla yedi biyoloji alanında 750 uzman tarafından tasarlanmış görev içeriyor. Deneysel tasarım ve veri analizi gibi karmaşık becerilere odaklanıyor ve görevlerin %79'u çok aşamalı akıl yürütme gerektiriyor. Gerçek dünya varlıkları (RWA) haberleri, 1.062 bilimsel veri dosyasının dahil edildiğini vurguluyor. Yapay zeka + kripto haber izleyicileri, yapay zeka ile özel araştırma araçları arasındaki artan kesişimi fark edebilir.

OpenAI, LifeSciBench adlı yeni bir değerlendirme standardını yayınladı; bu standart, AI sistemlerinin gerçek bilimsel senaryolardaki yeteneklerini ölçmeyi amaçlıyor. LifeSciBench, 7 bilimsel çalışma akışı ve 7 biyoloji alanını kapsayan 750 adet uzman tarafından hazırlanan görevden oluşuyor. Bu görevler, biyoteknoloji veya ilaç endüstrisi deneyimine sahip 173 doktora sahibi bilim insanından gelmektedir. Bu değerlendirme standardı, tekil gerçek bilgi soruları yerine, kanıt entegrasyonu, deney tasarımı, veri analizi, bilimsel akıl yürütme ve bilimsel iletişim gibi karmaşık bilimsel yeteneklerin değerlendirilmesine odaklanmaktadır. Görevlerin %79'dan fazlası çok adımlı akıl yürütme gerektiriyor; ortalama her soru yaklaşık 4 adımlık akıl yürütme gerektiriyor ve 1.062 adet gerçek bilimsel veri eki (makaleler, grafikler, dizi verileri ve yapı dosyaları vb.) içeriyor.

Kaynak:Orijinalini göster

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.