MiniMax Meluncurkan Metode MSA Sparse Attention dan Model MiniMax-M3
KuCoinFlashBagikan
Berita on-chain mengungkap bahwa MiniMax telah meluncurkan MSA (MiniMax Sparse Attention), metode perhatian jarang yang dibangun berdasarkan Grouped Query Attention. Metode ini membagi perhatian menjadi cabang indeks dan cabang utama, dengan cabang indeks memilih 16 blok token per grup GQA dan cabang utama melakukan perhatian softmax presisi pada blok-blok tersebut. MSA dilatih pada model MoE dengan 109 miliar parameter, dan MiniMax membuka sumber kode kernel inferensi `fmha_sm100` untuk GPU NVIDIA SM100 di bawah lisensi MIT. Perusahaan juga meluncurkan model produksi MiniMax-M3, yang sebanding dengan baseline perhatian penuh di berbagai benchmark. Pencatatan token baru mungkin mendapat manfaat dari kemajuan ini dalam efisiensi dan kinerja model.
Sumber:Tampilkan versi asli
Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini.
Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.