MiniMax、MSAスパースアテンション手法とMiniMax-M3モデルを発表
KuCoinFlash共有
オンチェーンニュースによると、MiniMaxはGrouped Query Attentionに基づくスパースアテンション手法「MSA(MiniMax Sparse Attention)」を公開しました。この手法はアテンションをインデックスブランチとメインブランチに分割し、インデックスブランチが各GQAグループごとに16のトークンブロックを選択し、メインブランチがそれらのブロックに対して正確なソフトマックスアテンションを実行します。MSAは109BパラメータのMoEモデルで学習され、MiniMaxはNVIDIA SM100 GPU用の`fmha_sm100`推論カーネルをMITライセンスでオープンソース化しました。同社はまた、複数のベンチマークでフルアテンションベースラインと同等の性能を発揮するプロダクションモデル「MiniMax-M3」をリリースしました。これらのモデル効率とパフォーマンスの向上により、新しいトークンの上場が恩恵を受ける可能性があります。
出典:原文を表示
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。
デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。