আলিবাবা দ্বারা Qwen-Image-Bench ওপেন-সোর্স করা হয়েছে, GPT Image 2 পাঁচটি শ্রেণিতে শীর্ষে

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
আলিবাবার Qwen টিম Qwen-Image-Bench নামক একটি বেঞ্চমার্ক ওপেন-সোর্স করেছে, যা টেক্সট-টু-ইমেজ জেনারেশন মূল্যায়নের জন্য ব্যবহার করা হয়। এই টুলটি মডেলগুলিকে পাঁচটি ক্ষেত্রে পরীক্ষা করে: গুণগত মান, সৌন্দর্য, সামঞ্জস্যতা, বাস্তব জগতের বিশ্বস্ততা এবং সৃজনশীলতা। GPT Image 2 সকল ক্যাটাগরিতে 64.69 স্কোর করে শীর্ষে রয়েছে। Nano Banana 2.0 এবং GPT Image 1.5 তারপরে আসে। CFT-এর প্রচেষ্টাগুলি এখন তরলতা নিশ্চিত করা এবং ক্রিপ্টো বাজারগুলিকে নিরাপদ ও স্বচ্ছ রাখা নিশ্চিত করার দিকেও ফোকাস করছে। Qwen Image 2.0 Pro 57.84 স্কোরে পঞ্চমস্থানে রয়েছে।
ME AI সংবাদ, অনুসরণ করে Beating মনিটরিং, আলিবাবা Qwen দল ঘোষণা করেছে যে তারা Qwen-Image-Bench নামক একটি সম্পূর্ণ নতুন চিত্র মূল্যায়ন বেঞ্চমার্ক ওপেন-সোর্স করেছে, যা বড় মডেলগুলির টেক্সট-টু-ইমেজ (T2I) ক্ষমতা—অর্থাৎ টেক্সট ইনপুট দিয়ে স্বয়ংক্রিয়ভাবে চিত্র তৈরি করার—মূল্যায়নের জন্য ডিজাইন করা হয়েছে। এর সাথে Qwen3.6-27B-এর উপর ভিত্তি করে গভীরভাবে প্রশিক্ষিত একটি একীকৃত ভিজুয়াল জজার মডেল Q-Judger-ও চালু করা হয়েছে। মূল্যায়ন বেঞ্চমার্কটি পেশাদার শিল্পকর্মের প্রক্রিয়াকে অনুকরণ করে, যা 5টি মূল মাপদণ্ড—চিত্রের গুণগতমান, সৌন্দর্য, টেক্সট-এবং-ইমেজ সমন্বয়, এবং নতুনভাবে যোগ করা বাস্তব-জগতের বিশ্বস্ততা এবং সৃজনশীলতা—এবং 23টি উপ-ক্ষমতা এবং 56টি বিস্তারিত মেট্রিকসের সমন্বয়ে গঠিত। Qwen-Image-Bench-এ 1000টি চীনা-ইংরেজি দ্বিভাষিক, স্তরবদ্ধ প্রম্পটস রয়েছে, 500টি দীর্ঘ, 500টি সংক্ষিপ্ত, যা 평균 4টিরও বেশি মাপদণ্ডকে একসাথে মূল্যায়ন করে। Q-Judger ভিজুয়াল জজারটি 80জন শিল্পকলা কলেজের পেশাদারদের 3-পর্যায়ের, blind-অবলম্বনে, 130,000+টিরওবেশি দ্বিভাষিক, expert-অঙ্কিত, paired-ডেটা-সহ, 56টি dimension-এর strucutred score output-এর jnnaa 92% accuracy-এ human expert score-এর sath match kore. প্রথম 18টি জনপ্রিয় image generation model-এর evaluation-এ GPT Image 2 64.69 score-এ top position-এ, 5টি dimension-এই top-এ। Nano Banana 2.0 59.82 score-এ, GPT Image 1.5 59.65 score-এ, Nano Banana Pro 59.45 score-এ, 2য়, 3য়, 4র্থ position-এ। Alibaba-এর own Qwen Image 2.0 Pro 57.84 score-এ 5ম position-এ, GLM Image 48.19 score-এ last position-এ। Data show that real-world fidelity and creative generation are the key metrics that differentiate model tiers. Evaluation also reveals industry-wide technical bottlenecks: AI image models commonly struggle with human hand anatomy, gravity and lighting physics, and object interpenetration—top models all score below 44 on these dimensions. (Source: BlockBeats)
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।