ME সংবাদের মতে, ১৬ এপ্রিল (UTC+৮), অ্যানালিসিস বিটিং-এর মনিটরিং অনুযায়ী, Nucleus AI টিম Nucleus-Image নামক টেক্সট-টু-ইমেজ মডেল প্রকাশ করেছে, যা সমান্তরালে মডেল ওয়েট, ট্রেনিং কোড এবং ট্রেনিং ডেটাসেট ওপেন-সোর্স করা হয়েছে, লাইসেন্স Apache 2.0। মডেলটি স্পার্স মিক্সড এক্সপার্ট (MoE) ডিফিউশন ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে, যার মোট প্যারামিটার 17B, যা প্রতিটি স্তরে 64টি রাউটিং এক্সপার্টে বিতরণ করা হয়েছে, এবং প্রতিটি ইনফারেন্সে শুধুমাত্র ~2B প্যারামিটার সক্রিয় হয়, যা একই প্যারামিটার স্কেলের ঘন মডেলগুলির তুলনায় ইনফারেন্স খরচ উল্লেখযোগ্যভাবে কমিয়েছে। তিনটি স্ট্যান্ডার্ড বেঞ্চমার্কে, Nucleus-Image বন্ধ উৎসের শীর্ষস্থানীয় মডেলগুলির সমান বা তাৎপর্যপূর্ণভাবে উন্নত: GenEval-এ 0.87 স্কোর, যা Qwen Image Model-এর সমান, এবং স্পেশিয়াল পজিশনিং সাব-স্কোর (0.85) সমস্ত তুলনামূলক মডেলের মধ্যে শীর্ষে; DPG-Bench-এ 88.79 স্কোর, যা সমগ্রতায় ১ম; OneIG-Bench-এ 0.522 স্কোর, Google Imagen4 (0.515) এবং Recraft V3 (0.502)-এর চেয়েও বেশি। উপরের সবগুলি ফলাফলই শুধুমাত্র প্রি-ট্রেনিংয়ের ভিত্তিতে, DPO, রিইনফোর্সমেন্ট লার্নিং, বা মানব-পছন্দ-অনুকূলনের (human preference tuning) কোনও ধরনের ফাইন-টিউনিংয়ের ছাড়া। Nucleus AI-এর অফিসিয়ালদের মতে, "এই কোয়ালিটি লেভেলের প্রথমওয়ান, 100% Open-Source MoE Diffusion Model"। ট্রেনিংয়ের জন্যওয়েবসাইটগুলির থেকে 700M+ ইমেজকেই (প্রক্রিয়াকরণ: 3টি-পর্যায়ক্রমিক filtering, deduplication, and aesthetic scoring) 1.5B+ text-image pairs-এর (পদক্ষেপ: 256 → 1024 resolution-এ 3টি phase-এ 1.7M steps)। Text Encoder Qwen3-VL-8B-Instruct diffusers library-এর through call, and built-in text KV cache across denoising steps to further reduce inference overhead. Local image generation deployment-এর জন্য 17B parameter but only activate 2B design means even consumer-grade GPU can run it. Full open-source (weights + training code + dataset) is rare — most open-source image models only release weights; datasets and training details remain closed, which is one of the main bottlenecks for reproducible research in text-to-image domain. (Source: BlockBeats)
17B প্যারামিটার সহ Nucleus-Image ওপেন-সোর্সড, প্রতিটি ইনফারেন্সে 2B সক্রিয়
KuCoinFlashশেয়ার






১৬ এপ্রিল (UTC+8)-এ, নিউক্লিয়াস এআই অ্যাপাচি ২.০-এর অধীনে নিউক্লিয়াস-ইমেজ মডেলটি ওপেন-সোর্স করেছে। মেটাএরা-এর উপর ভিত্তি করে তৈরি এই মডেলটিতে ১৭B প্যারামিটার সহ একটি স্পার্স MoE ডিফিউশন ট্রান্সফরমার রয়েছে, কিন্তু উপযোগের সময় শুধুমাত্র ২B প্যারামিটারই সক্রিয় থাকে যাতে খরচ কমে। পোস্ট-ট্রেনিং ছাড়াই এটি তিনটি বেঞ্চমার্কে শীর্ষ বন্ধ সোর্স মডেলগুলির চেয়ে ভালো বা সমান পারফরম্যান্স দেখিয়েছে। এই পদক্ষেপটি বিশ্বব্যাপী ক্রিপ্টো বাজারে রিস্ক-অন অ্যাসেট এবং CFT-এর প্রতি ব্যাপক আগ্রহের সাথে সঙ্গতিপূর্ণ।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।