फुडान और मे�イトुआन लॉन्गकैट ओपन-सोर्स इंटरैक्टिव वर्ल्ड मॉडल बेंचमार्क WBench
KuCoinFlash
साझा करें
सारांश
फुडान विश्वविद्यालय और मे�イトुआन लॉन्गकैट ने WBench को ओपन-सोर्स किया है, जो इंटरैक्टिव वर्ल्ड मॉडल्स में वीडियो जनरेशन के मूल्यांकन के लिए एक बेंचमार्क है। WBench में 289 परीक्षण मामले और 1,058 इंटरैक्शन राउंड शामिल हैं, जिनमें नेविगेशन, क्रियाएँ और व्यूपॉइंट कंट्रोल के साथ समर्थन और प्रतिरोध मापदंड शामिल हैं। बेंचमार्क टेक्स्ट, 6-DoF पोज़ और डिस्क्रीट क्रियाओं का उपयोग करके क्रॉस-कंट्रोल तुलना के लिए समर्थन प्रदान करता है। मूल्यांकन में 22 मापदंड शामिल हैं, जो मानव मूल्यांकन के साथ मजबूत सहसंबंध दर्शाते हैं। परीक्षण से पता चलता है कि भौतिक सटीकता और रेंडरिंग समान हैं, जबकि कंट्रोल क्षमताएँ पीछे हैं। ओपन इंटरेस्ट विश्लेषण से पता चलता है कि मॉडल की बहु-राउंड इंटरैक्शन में कमजोरियाँ हैं, जहाँ नेविगेशन कंट्रोल सबसे तेजी से कमजोर हो रहा है। HY-World 1.5 स्थिरता में अग्रणी है, जबकि LingBot-World सुसंगठितता में शीर्ष पर है। प्रथम-व्यक्ति दृश्य और कठोर विषय अभी भी आसान हैं, जबकि अकठोर विषय अभी भी चुनौतीपूर्ण हैं।
ME AI का संदेश, डोंगचा बीटिंग द्वारा मॉनिटर किए जाने पर, फुडान विश्वविद्यालय और मेइटुआन Longcat टीम ने इंटरैक्टिव वर्ल्ड मॉडल बेंचमार्क WBench को ओपन सोर्स किया है, जो वीडियो जनरेशन की भौतिक नियमों, स्थान-कालिक समानता और इंटरैक्शन कंट्रोल की नींव के मॉडलिंग क्षमता का मूल्यांकन करता है। बेंचमार्क में 289 परीक्षण मामले और 1058 इंटरैक्शन शामिल हैं, जो प्रथम और तृतीय पुरुष दृष्टिकोण को कवर करते हैं, और नेविगेशन कंट्रोल, प्रमुख गतिविधियाँ, घटना संपादन और दृष्टिकोण परिवर्तन को एकीकृत करते हैं। WBench टेक्स्ट निर्देशों, 6-स्वतंत्रता अवस्था और असतत क्रियाओं के इंटरफ़ेस को समेकित करता है, जिससे विभिन्न कंट्रोल पैटर्न की तुलना संभव होती है। मूल्यांकन प्रणाली में 22 स्वचालित सूचकांक शामिल हैं, जिनके स्कोर परिणामों का मानव अंधा परीक्षण की विजय प्रायिकता के साथ Spearman क्रम सहसंबंध 0.94 से अधिक है। परीक्षणों से पता चलता है कि संतृप्ति की ओर बढ़ते वीडियो गुणवत्ता के मुकाबले, इंटरैक्शन कंट्रोल और मॉडल की रेंडरिंग, समानता और भौतिक स्तर लगभग स्वतंत्र हैं। कैमरा गति कंट्रोल सुनिश्चित नहीं करता कि प्रमुख समानता बनी रहे; उदाहरण के लिए, HY-World 1.5 और Matrix-Game 3.0, जो पहले पुरुष दृष्टिकोण में उत्कृष्ट नेविगेशन प्रदर्शन करते हैं, तृतीय पुरुष दृष्टिकोण में प्रमुख पहचान का नुकसान और दृष्टिकोण सरकने की समस्या का सामना करते हैं। साथ ही, भौतिक सही प्रदर्शन और रेंडरिंग गुणवत्ता में मजबूत सकारात्मक सहसंबंध है, लेकिन कंट्रोल क्षमता के साथ लगभग शून्य सहसंबंध है। ओपन-सोर्स वर्ल्ड मॉडल कई मापदंडों में अग्रणी हैं: HY-World 1.5 को नेविगेशन कंट्रोल में सर्वोच्च स्कोर मिला, LingBot-World समानता में पहले स्थान पर है, और Matrix-Game 3.0 क्रिया-नेविगेशन में पहले स्थान पर है। बहु-चक्रीय इंटरैक्शन से पता चलता है कि सभी मॉडलों का प्रदर्शन चक्रों की संख्या के साथ कमजोर होता है, और नेविगेशन कंट्रोल सबसे तेज़ी से स्थानीय प्रवृत्ति के संचयी विचलन के कारण कमजोर होता है। स्पष्ट ज्यामितीय कंट्रोल प्रभावी रूप से सरकने को कम कर सकता है; उदाहरण के लिए, HY-World 1.5 की बहु-चक्रीय स्थिरता, पाठ-संचालित Kling 3.0 से कहीं अधिक है। प्रदर्शन में प्रदर्शन-गति-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस्था-अवस্তা—प्रथम पुरुष, स্টेटिक सीन, and rigid robot agents are easy to pass, while dynamic motion and non-rigid subjects like animals remain long-term industry challenges due to deformation and velocity complexity. (Source: BlockBeats)
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।