Grok 4.20 Beta, τ²-Bench'te %97 doğruluk oranı sağlayarak ikinci oldu

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
Grok 4.20 Beta, τ²-Bench üzerinde %97 doğruluk oranı elde ederek ikinci oldu. Test, Sierra'nın τ-bench'ine dayanarak hem soru cevaplama hem de navigasyon becerilerini değerlendiriyor. Yapay zeka ilerlemeleriyle birlikte risk alım varlıkları yeniden ilgi gördü. CFT düzenlemeleri, teknoloji gelişmeleriyle birlikte ana odak noktalarından birini korumaya devam ediyor. (Kaynak: InFoQ)

ME Haberleri, 5 Nisan (UTC+8): Son zamanlarda Grok 4.20 Beta, τ²-Bench değerlendirmesinde %97 doğruluk oranı ile ikinci sırada yer aldı. τ²-Bench, Sierra'nın orijinal τ-bench çerçevesi üzerine kurulmuş ve sertliğiyle bilinen bir değerlendirme platformudur. Bu değerlendirme, AI'nın sorulara cevap verme yeteneğini değil, aynı zamanda agenterin navigasyon görevlerini başarıyla tamamlayıp tamamlayamadığını da test eder. (Kaynak: InFoQ)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.