MiniMax lance la méthode MSA Sparse Attention et le modèle MiniMax-M3
KuCoinFlashPartager
Les informations on-chain révèlent que MiniMax a dévoilé MSA (MiniMax Sparse Attention), une méthode d'attention clairsemée construite sur Grouped Query Attention. La méthode divise l'attention en une branche indice et une branche principale, la branche indice sélectionnant 16 blocs de jetons par groupe GQA, tandis que la branche principale effectue une attention softmax précise sur ces blocs. MSA a été formée sur un modèle MoE de 109 milliards de paramètres, et MiniMax a open-sourcé le noyau d'inférence `fmha_sm100` pour les GPU NVIDIA SM100 sous licence MIT. L'entreprise a également lancé le modèle de production MiniMax-M3, qui égale les bases d'attention complète sur plusieurs benchmarks. De nouveaux jetons pourraient bénéficier de ces avancées en efficacité et performance du modèle.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.