أخبار ME، في 16 أبريل (UTC+8)، وفقًا لمراقبة Beating، أطلق فريق Nucleus AI نموذج توليد الصور من النص Nucleus-Image، وفتح مصادر أوزان النموذج ورمز التدريب ومجموعة بيانات التدريب تحت ترخيص Apache 2.0 قابل للتجارة. يستخدم النموذج بنية ناقل التشتت المختلطة النادرة (MoE)، بحجم إجمالي قدره 17B موزعًا على 64 خبير توجيهي في كل طبقة، حيث يتم تفعيل حوالي 2B من المعلمات فقط أثناء الاستدلال، مما يقلل تكلفة الاستدلال بشكل ملحوظ مقارنةً بالنمذجة الكثيفة ذات الحجم المماثل. في ثلاثة معايير قياسية، يتساوى Nucleus-Image مع أو يتفوق على النماذج الرائدة المغلقة: حصل على درجة 0.87 في GenEval، مساويًا لنموذج صور Qwen، وحقق أعلى درجة في عنصر الموقع المكاني (0.85) بين جميع النماذج المقارنة؛ حصل على درجة 88.79 في DPG-Bench، متقدمًا في الترتيب العام الأول؛ وحصل على درجة 0.522 في OneIG-Bench، متفوقًا على Google Imagen4 (0.515) وRecraft V3 (0.502). جميع هذه النتائج تم تحقيقها باستخدام التدريب البحت فقط، دون أي تحسين باستخدام DPO أو التعلم المعزز أو تحسين تفضيلات الإنسان. وصفت Nucleus AI رسميًا هذا بأنه "أول نموذج تشتت MoE مفتوح المصدر بالكامل على هذا المستوى من الجودة". تم جمع بيانات التدريب من خلال التجميع الواسع النطاق من الإنترنت، ثم تصفية وحذف التكرارات وتقييم الجمال عبر عدة مراحل للحفاظ على 700 مليون صورة، مما أنتج 1.5 مليار زوج نص-صورة؛ وتم التدريب على ثلاث مراحل متدرجة من دقة 256 إلى 1024، بإجمالي 1.7 مليون خطوة. يستخدم مُ кодير النص Qwen3-VL-8B-Instruct، ويتم استدعاؤه عبر مكتبة diffusers، مع تضمين ذاكرة مؤقتة للنص KV عبر خطوات التخلص من الضوضاء، مما يقلل المزيد من تكاليف الاستدلال. بالنسبة للمطورين الذين يحتاجون إلى نشر توليد الصور محليًا، فإن التصميم الذي يمتلك 17B معلمة لكنه ينشط فقط 2B يعني أن وحدات معالجة الرسومات الاستهلاكية لديها القدرة على تشغيله. إن الفتح الكامل (الأوزان + كود التدريب + مجموعة البيانات) نادر نسبيًا — فمعظم نماذج الصور المفتوحة المصدر تنشر الأوزان فقط، بينما تظل مجموعة البيانات وتفاصيل التدريب مغلقة، وهي أحد العوائق الرئيسية في مجال البحث القابل للتكرار في توليد الصور من النص. (المصدر: BlockBeats)
تم فتح مصدر Nucleus-Image بـ 17 مليار معلمة، مع تفعيل 2 مليار لكل استنتاج
KuCoinFlashمشاركة






في 16 أبريل (UTC+8)، أصدرت Nucleus AI نموذج Nucleus-Image كمصدر مفتوح بموجب ترخيص Apache 2.0. يعتمد النموذج على MetaEra، ويتميز بمحول تفاضلي نادر MoE يحتوي على 17 مليار معلمة، لكن فقط 2 مليار منها نشطة أثناء الاستنتاج لتقليل التكاليف. وقد تفوق النموذج أو حقق أداءً مماثلاً لأفضل النماذج المغلقة على ثلاثة مقاييس دون تدريب إضافي. يتوافق هذا الإجراء مع الاهتمام الأوسع بالأصول ذات المخاطر المرتفعة وجهود CFT في أسواق التشفير العالمية.
المصدر:عرض النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات.
يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.