GLM-5.1 مصنوعی تجزیہ کوڈنگ ایجینٹ بینچ مارک میں اوپن سورس ماڈلز میں پہلے نمبر پر ہے

KuCoinFlash

ریلیز کا وقت: 13‏/05‏/2026، 13:41:04

بانٹیں

خلاصہ

آن-چین تجزیہ فرم Artificial Analysis نے 13 مئی (UTC+8) کو Coding Agent Index جاری کیا، جس نے SWE-Bench-Pro-Hard-AA، Terminal-Bench v2 اور SWE-Atlas-QnA پر ماڈلز کا جائزہ لیا۔ GLM-5.1 (Claude Code پر چل رہا) اوپن سورس ماڈلز میں سب سے اوپر رہا، جبکہ Opus 4.7 (Cursor CLI) کل میں سب سے آگے رہا۔ یہ بینچ مارک حقیقی دنیا کے کوڈنگ، ٹرمینل کاموں اور ٹیکنیکل سوالات کا جائزہ لیتا ہے۔ GLM-5.1 نے اوپن سورس کی بہترین کارکردگی دکھائی، جبکہ گھریلو ماڈلز میں اوپن انٹریسٹ بڑھ رہا ہے۔

AIMPACT کا پیغام، 13 مئی (UTC+8)، عالمی معیاری جائزہ ادارہ Artificial Analysis نے نیا Coding Agent انڈیکس جاری کیا ہے، جو Agent harnesses اور ماڈل کے کمبو کی SWE-Bench-Pro-Hard-AA، Terminal-Bench v2 اور SWE-Atlas-QnA تین اہم انڈیکسز پر کارکردگی کا جائزہ لیتا ہے۔ اس جائزے میں، بند ماڈل Opus 4.7 (Cursor CLI پر چل رہا ہے) عالمی سطح پر پہلے نمبر پر رہا، جبکہ GLM-5.1 (Claude Code پر چل رہا ہے) اوپن سورس میں پہلا ہے۔ یہ انڈیکس حقیقی پروگرامنگ کاموں، Agentic ٹرمینل کاموں اور تکنیکی سوالات کو شامل کرتا ہے، جس کا مقصد حقیقی پروگرامنگ Agent کے منظر میں حقیقی کارکردگی کو ظاہر کرنا ہے۔ مضمون میں کہا گیا ہے کہ GLM-5.1 اس منظر میں چینی بڑے ماڈلز کی SOTA صلاحیت کو ظاہر کرتا ہے۔ (ذرائع: InFoQ)

ذریعہ:اصل دکھائیں۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔