ByteDance, 128 A100 GPU üzerinde eğitilen 3 milyar parametreli çoklu modelli model Lance'i açık kaynak hale getirdi

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
ByteDance, 3 milyar parametreli çoklu modelli modeli Lance’i 19 Mayıs'ta açık kaynak yaptı ve 128 adet A100 GPU kullanarak eğitti. Model, resim ve video görevlerini tek bir çerçevede işliyor. Zincir üzerindeki veriler, AI tabanlı kripto projelerinde artan açık pozisyonları gösteriyor. Lance, maliyetleri düşürürken güçlü performansı korumak için çift akışlı MoE tasarımı ve modallik bilinçli döndürme kodlamasını kullanıyor. Bu çeyrek içinde AI ile ilgili tokenlarda açık pozisyonlar düzenli olarak arttı.

ME Haberleri, 19 Mayıs (UTC+8), Beating izleme sistemine göre, ByteDance Research, orijinal evrensel çokmodlu büyük model Lance’ı resmen açık kaynak hale getirdi. Bu, yalnızca 3B aktif parametreye sahip hafif bir modeldir ve tek bir çerçevede hem görüntü hem de video anlama, üretme ve düzenleme yeteneklerini destekler. Mevcut evrensel modeller genellikle parametre boyutunu artırma veya metinden görsel oluşturma mimarisini kullanmaya dayanırken, Lance çok düşük hesaplama gücüyle koordineli bir yol izledi. Geliştirme ekibi, modeli tamamen sıfırdan eğitti ve toplam hesaplama bütçesini yalnızca 128 adet A100 GPU ile sınırladı. Farklı modallar ve görevler arasındaki iç çatışmaları çözmek için Lance mimarisinde iki katı izolasyon uyguladı: - Paylaşılan alt düzey bağlamı korurken, anlama ve üretme hesaplama yollarını ayrıştırmak için çift akışlı karışık uzman (MoE) mimarisi kullandı. - Görüntü ve video heterojen görsel tokenleri arasındaki sinyal girişimini doğrudan azaltmak için modallık algılayan döner konum kodlaması ekledi. Aşırı hesaplama sıkıştırması, performans sınırını düşürmedi. Sadece 3B aktif parametreyle, Lance’in görüntü ve video üretme ve düzenleme performansı, çoğu benchmark testinde mevcut açık kaynak evrensel modelleri geride bıraktı ve küçük parametrelerle hem üretme hem de semantik anlama kapasitesini dengeleyen düşük maliyetli bir yol izledi. (Kaynak: BlockBeats)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.