ME Haberleri'ne göre, 16 Nisan (UTC+8) tarihinde Beating tarafından izlendiğine göre, Nucleus AI ekibi, Nucleus-Image adlı metinden görsel oluşturma modelini duyurdu ve model ağırlıklarını, eğitim kodlarını ve eğitim veri setini aynı anda açık kaynak hale getirdi; lisans Apache 2.0'dır ve ticari kullanım için uygundur. Model, seyrek karışık uzmanlar (MoE) dağılım transformeri mimarisini kullanır; toplam parametre sayısı 17B'dir ve her katmanda 64 rota uzmanı arasında dağıtılmıştır; her çıkarım sırasında yaklaşık 2B parametre aktif hale getirilir ve bu, aynı parametre boyutuna sahip yoğun modellere kıyasla çıkarım maliyetini önemli ölçüde düşürür. Üç standart benchmark'ta Nucleus-Image, kapalı kaynak önde gelen modellerle eşit veya daha iyi performans gösterdi: GenEval puanı 0,87, Qwen görsel modeliyle eşit ve mekansal konum alt puanı (0,85) tüm karşılaştırılan modeller arasında en yüksektir; DPG-Bench puanı 88,79 ile genel sıralamada birincidir; OneIG-Bench puanı 0,522 ile Google Imagen4 (0,515) ve Recraft V3 (0,502)'ü geçmiştir. Tüm bu sonuçlar yalnızca ön eğitimle elde edilmiştir; DPO, pekiştirmeli öğrenme veya insan tercihleri ile ince ayar yapılmamıştır. Nucleus AI resmi olarak bunu "bu kalite seviyesindeki ilk tamamen açık kaynak MoE dağılım modeli" olarak tanımlamıştır. Eğitim verileri, ağdan büyük ölçekli olarak toplanmış, çok sayıda filtreleme, tekrar silme ve estetik puanlama işleminden geçirildikten sonra 700 milyon görüntü korunmuş ve 1,5 milyar görsel-metin çifti oluşturulmuştur. Eğitim, 256'dan 1024 çözünürlüğe kadar üç aşamalı olarak 1,7 milyon adım boyunca yürütülmüştür. Metin kodlayıcı olarak Qwen3-VL-8B-Instruct kullanılmış ve diffusers kütüphanesi aracılığıyla çağrılmıştır; ayrıca, gürültü giderme adımları arasında metin KV önbelleği entegre edilerek çıkarım maliyeti daha da düşürülmüştür. Görsel oluşturma işlemini yerel olarak dağıtmak isteyen geliştiriciler için, 17B parametreli ancak yalnızca 2B'sinin aktif olması gereken bu tasarım, tüketici düzeyi GPU'larla çalıştırılabilirlik sağlar. Tamamen açık kaynak (ağırlıklar + eğitim kodları + veri seti) nadirdir — çoğu açık kaynak görsel model yalnızca ağırlıkları paylaşır; veri seti ve eğitim detayları kapalı kalır ve bu da metinden görsel oluşturma alanında yeniden üretilebilir araştırmaların ana engellerinden biridir. (Kaynak: BlockBeats)
Nucleus-Image, 17M parametre ile açık kaynaklı hale getirildi, her çıkarımda 2B aktif
KuCoinFlashPaylaş






16 Nisan'da (UTC+8), Nucleus AI, Nucleus-Image modelini Apache 2.0 altında açık kaynak kodlu hale getirdi. MetaEra üzerine inşa edilen bu model, 17 milyar parametreye sahip seyrek MoE difüzyon transformer'dır, ancak çıkarım sırasında yalnızca 2 milyar parametre aktiftir ve maliyetleri azaltmak için tasarlanmıştır. Eğitim sonrası ayarlamasız olarak üç farklı testte en iyi kapalı kaynaklı modelleri geçti ya da eşitledi. Bu adım, küresel kripto piyasalarında risk alıcı varlıklara yönelik artan ilgi ve CFT çabalarıyla uyumludur.
Kaynak:Orijinalini göster
Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir.
Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.