ByteDance Membuka Sumber Model Multimodal 3 Miliar Parameter Lance yang Dilatih pada 128 GPU A100

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
ByteDance melepaskan model multimodal 3 miliar parameter-nya, Lance, pada 19 Mei, dilatih menggunakan 128 GPU A100. Model ini menangani tugas gambar dan video dalam satu kerangka kerja. Data on-chain menunjukkan peningkatan open interest pada proyek kripto berbasis AI. Lance menggunakan desain MoE dual-stream dan encoding rotasi yang sadar modalitas untuk mengurangi biaya sambil tetap mempertahankan kinerja yang kuat. Open interest pada token terkait AI telah tumbuh secara stabil sepanjang kuartal ini.

Berita ME, 19 Mei (UTC+8), menurut pemantauan Beating, ByteDance Research secara resmi melepaskan model bahasa besar multimodal asli Lance sebagai sumber terbuka. Model ringan ini memiliki hanya 3B parameter aktif dan mendukung pemahaman, generasi, serta pengeditan gambar dan video dalam satu kerangka kerja tunggal. Saat ini, model unifikasi utama sangat bergantung pada peningkatan ukuran parameter atau penggunaan arsitektur teks-ke-gambar, sementara Lance berhasil menerapkan pendekatan kolaboratif dengan kebutuhan komputasi sangat rendah. Tim pengembang melatih model sepenuhnya dari awal dan membatasi anggaran komputasi total selama siklus pelatihan hingga 128 GPU A100. Untuk mengatasi konflik internal antara modality dan tugas yang berbeda, Lance menerapkan dua isolasi ketat dalam arsitekturnya: - Menggunakan arsitektur campuran ahli ganda (MoE) untuk menangani urutan multimodal yang saling terkait, sambil membagi konteks bawah dan memisahkan jalur komputasi pemahaman dan generasi. - Memperkenalkan positional encoding rotasi yang peka modality, yang secara langsung mengurangi gangguan sinyal antara token visual heterogen gambar dan video. Kompresi kekuatan komputasi ekstrem tidak mengurangi batas kinerja. Dengan hanya 3B parameter aktif, kinerja Lance dalam generasi dan pengeditan gambar serta video memimpin sebagian besar pengujian benchmark dibandingkan model unifikasi sumber terbuka yang ada, berhasil menggabungkan generasi dan pemahaman semantik dengan parameter kecil dengan biaya rendah. (Sumber: BlockBeats)

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.