فودان یونیورسٹی اور میٹوان لانگکیٹ نے WBench کو اوپن سورس کیا ہے، جو انٹرایکٹو ورلڈ ماڈلز میں ویڈیو جنریشن کا جائزہ لینے کے لیے ایک بینچ مارک ہے۔ WBench میں 289 ٹیسٹ کیسز اور 1,058 انٹرایکشن راؤنڈز شامل ہیں، جن میں نیویگیشن، ایکشنز اور ویو پوائنٹ کنٹرول کے لیے سپورٹ اور ریزسٹنس میٹرکس شامل ہیں۔ بینچ مارک متن، 6-DoF پوزس اور ڈسکریٹ ایکشنز کا استعمال کرتا ہے تاکہ کراس کنٹرول کے موازنے کیے جا سکیں۔ جائزہ 22 میٹرکسز پر مشتمل ہے، جو انسانی ریٹنگز کے ساتھ مضبوط تعلق ظاہر کرتے ہیں۔ ٹیسٹنگ سے پتہ چلتا ہے کہ فزیکل اکوریسی اور رینڈرنگ مطابقت رکھتے ہیں، جبکہ کنٹرول کابILITIES پیچھے رہ جاتی ہیں۔ اوپن انٹریسٹ تجزیہ سے پتہ چلتا ہے کہ ماڈلز کو متعدد راؤنڈ انٹرایکشنز میں کمزوریاں ہیں، جن میں نیویگیشن کنٹرول سب سے تیزی سے کم ہو رہا ہے۔ HY-World 1.5 استحکام میں سب سے آگے ہے، جبکہ LingBot-World لگاتار پائیداری میں بہترین ہے۔ فرسٹ پرسن ویوز اور رجید سبجیکٹس ابھی بھی آسان ہیں، جبکہ نان-رجید سبجیکٹس مستقل چیلنجز پیدا کرتے ہیں۔
ME AI کی خبر، Beating مانیٹرنگ کے مطابق، فودان یونیورسٹی اور میٹوانگ Longcat ٹیم نے انٹرایکٹو ورلڈ مڈل بینچ مارک WBench کو اوپن سورس کیا ہے، جو ویڈیو جنریشن کی فزیکل رولز، اسپیس ٹائم کنسسٹنس اور انٹرایکشن کنٹرول کی بنیادی مڈلنگ صلاحیتوں کا جائزہ لیتا ہے۔ بینچ میں 289 ٹیسٹ کیسز اور 1058 انٹرایکشنز شamil ہیں، جن میں پہلے اور تیسرے شخص کے دو نظریات شامل ہیں، جس میں نیویگیشن کنٹرول، ایجینٹ ایکشنز، ایونٹ ایڈیٹنگ اور ویوز شفٹنگ شامل ہے۔ WBench نے ٹیکسٹ انستروکشنز، 6 ڈگری آف فریدم پوزیشن اور ڈسکریٹ ایکشن انٹرفیس کو اکھاڑ دیا ہے تاکہ مختلف کنٹرول پیراڈائمز کا موازنہ کیا جا سکے۔ اس جائزے کے نظام میں 22 خودکار اشارے شامل ہیں، جن کے اسکورز کا انسانی بلائنڈ ٹیسٹ کے فتح کے ساتھ سپیرمن رینک کاررلیشن کافی 0.94 ہے۔ ٹیسٹوں سے پتہ چلتا ہے کہ ویڈیو کوالٹی کے مقابلے میں انٹرایکشن کنٹرول، مڈل کے رینڈرنگ، کنسسٹنس اور فزکل لیول تقریباً الگ الگ ہیں۔ کیمرہ موشن کنٹرول ضرورتاً ایجینٹ کنسسٹنس نہیں گارنٹ کرتا، مثال کے طور پر نیویگیشن میں بہترین پرفارمنس دینے والے HY-World 1.5 اور Matrix-Game 3.0 تھرڈ پرسن ویوز میں ایجینٹ شناخت کھونے اور ویوز ڈرِفٹ کے باڑوں سے دوچار ہو رہے ہیں۔ ساتھ ہی، فزکل کرسپکنس اور رینڈرنگ کوالٹی مثبت طور پر متعلق ہے، لیکن کنٹرول صلاحیت سے تقریباً صفر تعلق رکھتی ہے۔ اوپن سورس ورلڈ مڈلز مختلف شعبوں میں لیدر بنا ہوئے ہیں، HY-World 1.5 نے نیویگیشن کنٹرول میں سب سے زیادہ اسکور حاصل کیا، LingBot-World نے کنسسٹنس میں پہلا مقام حاصل کیا، اور Matrix-Game 3.0 نے اکشن نیویگیشن میں پہلا مقام حاصل کیا۔ متعدد انٹرایکشنز سے پتہ چلتا ہے کہ تمام مڈلز کا پرفارمنس انٹرایکشنز کے ساتھ کم ہوتا جاتا ہے، جبکہ نیویگیشن کنٹرول ت tích سپشل بائسز کے ذخیرہ سب سے زیادہ متاثر ہوتا ہے۔ واضح جومترک کنٹرول ڈرِفٹ کو مؤثر طور پر کم کرتا ہے، مثال کے طور پر HY-World 1.5 کا متعدد انٹرایکشنز میں استحکام Kling 3.0 جو ٹیکسٹ ڈرائون ہے، سے بہت زائد ہے۔ منظر کا دینامک اور اجینٹ کا رِجڈ بُنناد بینچمارک کے مشقت کا بنیادی منطق بناتا ہے، پہلے شخص، ساکھ منظر اور رِجڈ روبوٹ اجینٹ آسان طور پر فعال ہوتے ہیں، جبکہ تندھو، جانوروں جیسے غیر رِجڈ اجینٹس جن میں شکل تبدّل اور رفتار پیدائش پیدا ہوتا ہے، صنعت کے لئے طوائل عرصے تک ایک چالنجز رہتے ہیں۔ (ذرائع: BlockBeats)
اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔
ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔