ফুডান এবং মেইটুয়ান লংক্যাট ওপেন-সোর্স ইন্টারেক্টিভ ওয়ার্ল্ড মডেল বেঞ্চমার্ক WBench

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
ফুডান বিশ্ববিদ্যালয় এবং মেইটুয়ান লংক্যাট ওয়েন্চ নামক একটি বেঞ্চমার্ক ওপেন-সোর্স করেছে, যা ইন্টারেক্টিভ বিশ্ব মডেলে ভিডিও জেনারেশন মূল্যায়নের জন্য ব্যবহার করা হয়। WBench-এ 289টি টেস্ট কেস এবং 1,058টি ইন্টারঅ্যাকশন রাউন্ড রয়েছে, যার মধ্যে নেভিগেশন, অ্যাকশন এবং ভিউপয়েন্ট কন্ট্রোলের উপর ভিত্তি করে সাপোর্ট এবং রেজিস্ট্যান্স মেট্রিক্স রয়েছে। বেঞ্চমার্কটি টেক্সট, 6-DoF পোজ এবং ডিসক্রিট অ্যাকশন ব্যবহার করে ক্রস-কন্ট্রোল তুলনা করে। মূল্যায়নে 22টি মেট্রিক ব্যবহার করা হয়, যা মানব রেটিংয়ের সাথে শক্তিশালীভাবে সম্পর্কিত। পরীক্ষা দেখায় যে, ভৌত সঠিকতা এবং রেন্ডারিং সমন্বিতভাবে কাজ করে, কিন্তু কন্ট্রোল ক্ষমতা পিছিয়ে। ওপেন ইন্টারেস্ট বিশ্লেষণের মাধ্যমে দেখা যায় যে, মডেলগুলির মাল্টি-রাউন্ড ইন্টারঅ্যাকশনের ক্ষেত্রে দুর্বলতা রয়েছে, যার মধ্যে নেভিগেশন কন্ট্রোলই সবচেয়ে দ্রুতহার। HY-World 1.5-এর স্থিতিশীলতা সবচেয়ে বেশি, যখন LingBot-World-এর সামঞ্জস্যতা সবচেয়ে ভালো। ফার্স্ট-পারসনভিউএসএবংঠিকভাবেপরিচালিতবিষয়গুলিএখনওসহজ,যখনঅ-ঠিকভাবেপরিচালিতবিষয়গুলিরজটিলতাঅব্যাহতআছে।
ME AI সংবাদ, অনুসন্ধান করে বলা হচ্ছে যে, ফুডান বিশ্ববিদ্যালয় এবং মেইটুয়ান Longcat দল পরস্পরের সহযোগিতায় ইন্টারেক্টিভ ওয়ার্ল্ড মডেল বেঞ্চমার্ক WBench ওপেন-সোর্স করেছে, যা ভিডিও জেনারেশনের ভৌত নিয়ম, স্থান-সময় সামঞ্জস্য এবং ইন্টারেকশন নিয়ন্ত্রণের মৌলিক মডেলিং ক্ষমতা মূল্যায়ন করে। বেঞ্চমার্কটিতে 289টি টেস্ট কেস এবং 1058টি ইন্টারেকশন রয়েছে, যা প্রথম এবং তৃতীয় পক্ষের দুটি দৃষ্টিভঙ্গি অন্তর্ভুক্ত করে, যা নেভিগেশন নিয়ন্ত্রণ, অবজেক্টের অ্যাকশন, ইভেন্ট এডিটিং এবং ভিউপয়েন্ট সুইচিংকে একীভূত করে। WBench টেক্সট ইনস্ট্রাকশন, 6-ডিগ্রি-অফ-ফ্রিডম পজিশন এবং ডিসক্রিট অ্যাকশন ইন্টারফেসকে একীভূত করে, যা বিভিন্ন নিয়ন্ত্রণ পদ্ধতির তুলনা সম্ভব করে। মূল্যায়ন সিস্টেমটিতে 22টি অটোমেটিক মেট্রিকস রয়েছে, যার স্কোরগুলির Spearman র‍্যাঙ্ক-করিলেশন কো-অপশনটি মানব-অনধিগত পরীক্ষার বিজয়ীর হারের সাথে 0.94-এরও বেশি। পরীক্ষা দেখায়, ভিডিও কোয়ালিটির সম্ভাব্যতা সমৃদ্ধির বিপরীতে, ইন্টারেকশন নিয়ন্ত্রণ, মডেলের রেন্ডারিং, সামঞ্জস্যতা এবং ভৌততা 几乎是 decoupled। камера-মোশন-কন্ট্রোলটি 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 15-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-World-এরও। HY-Worl
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।