Grok 4.20 Beta نے τ²-Bench پر 97% درستگی حاصل کی، دوسرے نمبر پر رینک کیا

iconKuCoinFlash
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
گروک 4.20 بیٹا نے τ²-Bench پر 97% درستگی حاصل کی، جس سے یہ دوسرے نمبر پر رہا۔ یہ ٹیسٹ، جو سیریا کے τ-bench پر مبنی ہے، سوالات کے جوابات اور نیویگیشن کے مہارتوں دونوں کا جائزہ لیتا ہے۔ AI کی ترقی کے ساتھ رِسک-آن اثاثوں میں نئی دلچسپی پیدا ہوئی۔ CFT کے انتظامات تکنیکی ترقی کے ساتھ ساتھ اہم توجہ کا مرکز بنے رہے۔ (ذریعہ: InFoQ)

ME خبروں کے مطابق، 5 اپریل (UTC+8)، حالیہ وقت میں، Grok 4.20 بیٹا ورژن نے τ²-Bench جائزے میں 97% درستگی حاصل کی اور دوسرے نمبر پر رہا۔ τ²-Bench، Sierra کے اصل τ-bench فریم ورک پر مبنی ایک جائزہ ہے جو اپنی سختی کے لیے مشہور ہے۔ یہ جائزہ صرف اس بات کا امتحان نہیں کرتا کہ AI سوالات کا جواب دے سکتی ہے، بلکہ یہ بھی جانچتا ہے کہ ذكاء کامیابی سے نیویگیشن کے کام مکمل کر سکتا ہے۔ (ذرائع: InFoQ)

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔