अलीबाबा द्वारा Qwen-Image-Bench ओपन-सोर्स किया गया, GPT Image 2 पांच श्रेणियों में शीर्ष पर

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
अलीबाबा की क्वेन टीम ने क्वेन-इमेज-बेंच को ओपन-सोर्स किया है, जो टेक्स्ट-टू-इमेज जनरेशन का मूल्यांकन करने के लिए एक बेंचमार्क है। यह टूल मॉडल्स का पांच क्षेत्रों में मूल्यांकन करता है: गुणवत्ता, सौंदर्य, समायोजन, वास्तविक दुनिया की विश्वसनीयता और रचनात्मकता। GPT Image 2 ने 64.69 स्कोर किया और सभी श्रेणियों में अग्रणी रहा। Nano Banana 2.0 और GPT Image 1.5 उसके बाद आए। CFT प्रयास लिक्विडिटी और क्रिप्टो बाजारों को सुरक्षित और पारदर्शी बनाए रखने पर भी केंद्रित हैं। Qwen Image 2.0 Pro ने 57.84 स्कोर के साथ पांचवां स्थान प्राप्त किया।
ME AI की सूचना, डिनामिक चेक द्वारा मॉनिटर किए जाने पर, अलीबाबा के Qwen टीम ने Qwen-Image-Bench नामक एक नया ओपन-सोर्स इमेज एवलुएशन बेंचमार्क लॉन्च किया है, जो बड़े मॉडल्स की टेक्स्ट-टू-इमेज (T2I) क्षमता—अर्थात् टेक्स्ट इनपुट के आधार पर चित्र उत्पन्न करने की क्षमता—का मूल्यांकन करने के लिए विशेष रूप से डिज़ाइन किया गया है। साथ ही, Qwen3.6-27B पर गहन प्रशिक्षण के आधार पर एक समानीकृत विजुअल जज मॉडल Q-Judger भी लॉन्च किया गया है। बेंचमार्क एक पेशेवर कला सृजन प्रवाह का अनुकरण करता है, जिसमें छवि गुणवत्ता, सौंदर्य, पाठ और छवि का समन्वय, और नवीनतम वास्तविक दुनिया की सटीकता तथा रचनात्मकता—कुल 5 मुख्य पहलुओं को शामिल किया गया है, जिनमें 23 सब-क्षमताएँ और 56 विस्तृत सूचक हैं। Qwen-Image-Bench में 1000 मध्य-अंग्रेजी द्विभाषी प्रॉम्प्ट हैं, जिनमें से 500 लंबे और 500 छोटे हैं, और औसतन 4 से अधिक पहलुओं का मूल्यांकन किया जाता है। सूक्ष्म मूल्यांकन के लिए, Q-Judger विजुअल जज मॉडल को कला संस्थानों से 80 पेशेवर समीक्षकों के मार्गदर्शन में, अंधा मूल्यांकन और त्रि-समीक्षा प्रक्रिया के माध्यम से प्रशिक्षित किया गया है, जिसमें 1.3 लाख से अधिक द्विभाषी पेशेवर-अंकित जोड़े शामिल हैं। मॉडल 56 पहलुओं के संरचित स्कोर प्रदान करता है, जो मानव-विशेषज्ञों के स्कोर से 92% सहमति प्रदर्शित करता है। पहले 18 प्रमुख इमेज-जनरेशन मॉडल्स के मूल्यांकन के परिणामों के अनुसार, GPT Image 2 64.69 के समग्र स्कोर के साथ पहले स्थान पर है, और सभी 5 मुख्य पहलुओं में प्रथम है। Nano Banana 2.0 का स्कोर 59.82 है, GPT Image 1.5 का 59.65 है, Nano Banana Pro का 59.45 है, जो क्रमशः दूसरे, तीसरे, और चौथे स्थान पर हैं। Alibaba के स्वयं के Qwen Image 2.0 Pro का स्कोर 57.84 है, जो पाँचवें स्थान पर है, जबकि GLM Image 48.19 के साथ सबसे पीछे है। डेटा से पता चलता है कि वास्तविक-दुनिया की सटीकता और रचनात्मकता मॉडलों के समूहों को प्रभावित करने में महत्वपूर्ण सूचक हैं। मूल्यांकन में पता चला है कि पेशेवरों में समान सीमाएँ हैं—हाथों की हड्डियों, गुरुत्वाकर्षण, प्रकाश-छाया, और वस्तुओं के मध्य प्रवेश (clipping) की समस्याओं में AI-चित्रण मॉडल सामान्यतः त्रुटि करते हैं, और सबसे शीर्ष मॉडलों के सभी पहलुओं पर स्कोर 44 से कम ही है। (स्रोत: BlockBeats)
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।