MiniMax ने MSA स्पार्स अटेंशन विधि और MiniMax-M3 मॉडल लॉन्च किया

iconKuCoinFlash
साझा करें
AI summary iconसारांश
ME AI संदेश, MiniMax ने MSA (MiniMax Sparse Attention) जारी किया, जो Grouped Query Attention पर आधारित एक स्पार्स ध्यान विधि है। यह ध्यान को इंडेक्स शाखा और मुख्य शाखा में विभाजित करता है: इंडेक्स शाखा प्रत्येक GQA समूह के लिए ब्लॉक स्तर (डिफ़ॉल्ट 128 टोकन) पर 16 टोकन ब्लॉक चुनती है (निश्चित बजट 2048 कीवल टोकन), मुख्य शाखा केवल इन ब्लॉक्स पर सटीक softmax ध्यान लागू करती है। MSA को 109B पैरामीटर MoE मॉडल पर प्रशिक्षित किया गया है, और NVIDIA SM100 GPU के लिए `fmha_sm100` इनफ़ेरेंस कर्नेल (MIT लाइसेंस, BF16/FP8/NVFP4/FP4 समर्थित) ओपन सोर्स किया गया है, और उत्पादन मॉडल MiniMax-M3 जारी किया गया है। MSA-PT ने MMLU, GSM8K, HumanEval, RULER-8K, RULER-32K पर क्रमशः 67.2, 77.7, 64.0, 84.2, 77.5 प्राप्त किए, जो पूर्ण ध्यान आधारित बेसलाइन के समान हैं। 128K संदर्भ में, इसका exp-free Top-k चयन `torch.topk` से 5.1 गुना तेज़ है। (स्रोत: AiHot)
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।