Grok 4.20 Beta ने τ²-Bench पर 97% सटीकता प्राप्त की, दूसरे स्थान पर रही

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
Grok 4.20 Beta ने τ²-Bench पर 97% सटीकता हासिल की, जिससे यह दूसरे स्थान पर पहुंचा। यह परीक्षण, जो सिएरा के τ-bench पर आधारित है, प्रश्नोत्तर और नेविगेशन कौशल दोनों का मूल्यांकन करता है। AI की प्रगति के साथ रिस्क-ऑन संपत्तियों में नई दिलचस्पी देखी गई। CFT नियमों को तकनीकी प्रगति के साथ-साथ प्रमुख ध्यान केंद्र बनाए रखा गया है। (स्रोत: InFoQ)

ME समाचार के अनुसार, 5 अप्रैल (UTC+8), हाल ही में, Grok 4.20 बीटा संस्करण ने τ²-Bench मूल्यांकन में 97% सटीकता प्राप्त की और दूसरे स्थान पर रहा। τ²-Bench, Sierra के मूल τ-bench फ्रेमवर्क पर आधारित एक मूल्यांकन है, जो अपनी कठोरता के लिए जाना जाता है। यह मूल्यांकन केवल यह परीक्षण करता है कि AI प्रश्नों का उत्तर दे सकता है या नहीं, बल्कि यह भी परीक्षण करता है कि बुद्धिमान एजेंट सफलतापूर्वक नेविगेशन कार्य पूरा कर सकता है या नहीं। (स्रोत: InFoQ)

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।