MiniMax, MSA Seyrek Dikkat Yöntemini ve MiniMax-M3 Modelini Başlatıyor
KuCoinFlashPaylaş
On-chain haberlere göre, MiniMax, Grouped Query Attention üzerine kurulan MSA (MiniMax Sparse Attention) adlı seyrek dikkat yöntemini tanıttı. Yöntem, dikkati bir endeks dalı ve bir ana dala ayırır; endeks dalı her GQA grubu başına 16 token bloğu seçer, ana dal ise bu bloklar üzerinde hassas softmax dikkati gerçekleştirir. MSA, 109 milyar parametreli bir MoE modeli üzerinde eğitildi ve MiniMax, `fmha_sm100` çıkarım çekirdeğini NVIDIA SM100 GPU’lar için MIT lisansı altında açık kaynak yaptı. Şirket ayrıca, çeşitli testlerde tam dikkat temel modelleriyle eşit performans gösteren üretim modeli MiniMax-M3’ü piyasaya sürdü. Yeni token listelemeleri, bu model verimliliği ve performans ilerlemelerinden faydalanabilir.
Kaynak:Orijinalini göster
Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir.
Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.