MiniMax Melancarkan Kaedah MSA Sparse Attention dan Model MiniMax-M3
KuCoinFlashKongsi
Berita di rantai menunjukkan bahawa MiniMax telah melancarkan MSA (MiniMax Sparse Attention), kaedah perhatian jarang yang dibina berdasarkan Grouped Query Attention. Kaedah ini memisahkan perhatian kepada cabang indeks dan cabang utama, dengan cabang indeks memilih 16 blok token setiap kumpulan GQA dan cabang utama melakukan perhatian softmax tepat pada blok-blok tersebut. MSA dilatih pada model MoE dengan 109B parameter, dan MiniMax membuka sumber kernel inferens `fmha_sm100` untuk GPU NVIDIA SM100 di bawah lesen MIT. Syarikat tersebut juga melancarkan model pengeluaran MiniMax-M3, yang sepadan dengan garis dasar perhatian penuh di pelbagai tolok ukur. Pelancaran token baharu mungkin mendapat manfaat daripada kemajuan ini dalam kecekapan dan prestasi model.
Sumber:Tunjukkan artikel asal
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini.
Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.