Beating मॉनिटरिंग के अनुसार, भारतीय बड़े मॉडल निर्माता MiniMax ने Hugging Face पर मूल बहुमॉडल मिक्स्ड एक्सपर्ट (MoE) मॉडल MiniMax M3 के वेट्स को ओपन सोर्स किया है। MiniMax M3 की कुल पैरामीटर संख्या 4280 अरब है, जिसमें प्रति Token 230 अरब पैरामीटर सक्रिय होते हैं, और यह मूल रूप से 100 लाख अत्यधिक लंबे कॉन्टेक्स्ट का समर्थन करता है। डिप्लॉयमेंट के लिए GPU मेमोरी ओवरहेड को कम करने के लिए, डेवलपमेंट टीम ने MXFP8 क्वांटाइज्ड संस्करण भी जारी किया है और SGLang, vLLM, Transformers जैसे प्रमुख इन्फरेंस फ्रेमवर्क्स के साथ इसे अनुकूलित किया है। बहुमॉडल डिज़ाइन में, MiniMax M3 प्री-ट्रेनिंग चरण में ही पाठ, छवि और वीडियो का संयुक्त प्रशिक्षण करता है, ताकि मूल सामग्री संयोजन प्राप्त हो सके, और पोस्ट-ट्रेनिंग स्तर पर मल्टीमॉडल अलाइनमेंट नहीं किया जाता। कार्यप्रणाली के संदर्भ में, मॉडल दो इन्फरेंस मोड प्रदान करता है: जटिल तर論 और टूल ऑर्केस्ट्रेशन के लिए Thinking (सोच) मोड, और कम लेटेंसी डायलॉग और कोड जनरेशन के लिए Non-thinking (असोच) मोड। 100 लाख अत्यधिक लंबे कॉन्टेक्स्ट का समर्थन करने वाला नीचला कोर, MiniMax Sparse Attention (MSA) के नाम से सार्वजनिक रूप से उपलब्ध हल्का ध्यान कोर लाइब्रेरी है। आधिकारिक डेटा के अनुसार, MSA GQA (Grouped Query Attention) ब्लॉक-आधारित रिट्रीवल मैकेनिज़म का उपयोग करता है। 100 लाख Token के अत्यधिक लंबे कॉन्टेक्स्ट में, NVIDIA Blackwell (SM100) आर्किटेक्चर के लिए अनुकूलित MSA ऑपरेटर, पारंपरिक पूर्ण-ध्यान मैकेनिज़म की तुलना में प्री-फिलिंग में 9x से अधिक स्पीडअप और डिकोडिंग में 15x स्पीडअप प्रदान करता है, साथ ही इन्फरेंस कोष्ठक को महत्वपूर्ण रूप से कम करता है।
MiniMax M3 को नेटिव मल्टीमॉडल समर्थन और 1M संदर्भ लंबाई के साथ ओपन-सोर्स किया गया
MarsBitसाझा करें
MiniMax ने Hugging Face पर अपना स्वदेशी बहुमोडल MoE मॉडल M3 ओपन-सोर्स किया है, जिसमें 428 अरब पैरामीटर और 1 मिलियन टोकन कंटेक्स्ट लंबाई शामिल है। यह मॉडल टेक्स्ट, इमेज और वीडियो डेटा को स्वदेशी सेमेंटिक फ्यूजन के साथ सपोर्ट करता है। एक MXFP8 क्वांटाइज्ड संस्करण उपलब्ध है, जो SGLang, vLLM और Transformers के साथ संगत है। बड़े मॉडल टूल्स में ओपन इंटरेस्ट अभी भी उच्च है। M3 ओपन-सोर्स MiniMax Sparse Attention (MSA) कर्नेल का उपयोग करता है, जो प्रीफिलिंग और डिकोडिंग को तेज करता है। भय और लालच सूचकांक में प्रतिबिंबित बाजार संवेदनशीलता AI इंफ्रास्ट्रक्चर में बढ़ती हुई आत्मविश्वास को दर्शाती है।
स्रोत:मूल दिखाएं
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।