Grok 4.20 Beta ने τ²-Bench पर 97% सटीकता प्राप्त की, दूसरे स्थान पर रही

KuCoinFlash

रिलीज़ समय: 05/04/2026, 01:40:40

साझा करें

सारांश

Grok 4.20 Beta ने τ²-Bench पर 97% सटीकता हासिल की, जिससे यह दूसरे स्थान पर पहुंचा। यह परीक्षण, जो सिएरा के τ-bench पर आधारित है, प्रश्नोत्तर और नेविगेशन कौशल दोनों का मूल्यांकन करता है। AI की प्रगति के साथ रिस्क-ऑन संपत्तियों में नई दिलचस्पी देखी गई। CFT नियमों को तकनीकी प्रगति के साथ-साथ प्रमुख ध्यान केंद्र बनाए रखा गया है। (स्रोत: InFoQ)

ME समाचार के अनुसार, 5 अप्रैल (UTC+8), हाल ही में, Grok 4.20 बीटा संस्करण ने τ²-Bench मूल्यांकन में 97% सटीकता प्राप्त की और दूसरे स्थान पर रहा। τ²-Bench, Sierra के मूल τ-bench फ्रेमवर्क पर आधारित एक मूल्यांकन है, जो अपनी कठोरता के लिए जाना जाता है। यह मूल्यांकन केवल यह परीक्षण करता है कि AI प्रश्नों का उत्तर दे सकता है या नहीं, बल्कि यह भी परीक्षण करता है कि बुद्धिमान एजेंट सफलतापूर्वक नेविगेशन कार्य पूरा कर सकता है या नहीं। (स्रोत: InFoQ)

स्रोत:मूल दिखाएं

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।