MiniMax lança o método MSA Sparse Attention e o modelo MiniMax-M3
KuCoinFlashCompartilhar
Notícias on-chain revelam que a MiniMax apresentou o MSA (MiniMax Sparse Attention), um método de atenção esparsa construído sobre o Grouped Query Attention. O método divide a atenção em um ramo de índice e um ramo principal, com o ramo de índice selecionando 16 blocos de tokens por grupo GQA e o ramo principal realizando atenção softmax precisa sobre esses blocos. O MSA foi treinado em um modelo MoE com 109 bilhões de parâmetros, e a MiniMax open-sourcou o kernel de inferência `fmha_sm100` para GPUs NVIDIA SM100 sob a licença MIT. A empresa também lançou o modelo de produção MiniMax-M3, que corresponde aos baselines de atenção completa em diversos benchmarks. Novas listagens de tokens podem se beneficiar desses avanços em eficiência e desempenho do modelo.
Fonte:Mostrar original
Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações.
Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.