NVIDIA ने Mamba-Transformer हाइब्रिड MoE आर्किटेक्चर के साथ 550B Nemotron 3 Ultra मॉडल को ओपन सोर्स किया

icon MarsBit
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
NVIDIA ने 4 जून, 2026 को अपना 550B Nemotron 3 Ultra मॉडल ओपन-सोर्स किया, जिसमें Mamba-Transformer हाइब्रिड MoE आर्किटेक्चर शामिल है। यह मॉडल Artificial Analysis के बुद्धिमत्ता सूचकांक पर 48 अंक प्राप्त करके संयुक्त राज्य अमेरिका में ओपन-वेट मॉडल्स में दूसरे स्थान पर है। इसमें 1 मिलियन टोकन कंटेक्स्ट विंडो का समर्थन है जिसमें कम मेमोरी उपयोग और 5x अधिक थ्रूपुट है। एजेंट टूलकिट में NemoClaw और OpenShell शामिल हैं। ऑन-चेन विश्लेषण से पता चलता है कि AI-संचालित ट्रेडिंग टूल्स में खुली रुचि बढ़ रही है। यह मॉडल Hugging Face, NVIDIA NIM और OpenRouter पर उपलब्ध है।

Beating मॉनिटरिंग के अनुसार, न्यूमैन ने 4 जून को 5500 अरब पैरामीटर और 550 अरब एक्टिवेशन के साथ अपने फ्लैगशिप लार्ज लैंग्वेज मॉडल, Nemotron 3 Ultra को ओपन सोर्स किया, जिसे जटिल योजनाबद्धता, तर्क और टूल कॉलिंग जैसी लंबी अवधि के एजेंट कार्यों के लिए अनुकूलित किया गया है। तीसरे पक्ष के बेंचमार्क प्लेटफॉर्म Artificial Analysis के स्मार्टनेस स्कोर में, Nemotron 3 Ultra को 48 अंक मिले हैं, जो वर्तमान में संयुक्त राज्य अमेरिका में सबसे शक्तिशाली ओपन सोर्स वेट मॉडल है, जो महीने के अंधेरे के 54 अंक प्राप्त Kimi K2.6 के बाद स्थित है। तकनीकी संरचना के संदर्भ में, मॉडल Mamba-Transformer मिश्रित विशेषज्ञ संरचना MoE का उपयोग करता है, जो Mamba-2 स्टेट स्पेस मॉडल परतों और Transformer स्व-ध्यान परतों का 번번 प्रयोग करके, अत्यधिक लंबे संदर्भ के दौरान KV कैश के वर्गीय वृद्धि के मेमोरी बॉटलनेक से बचता है, और अत्यंत कम मेमोरी खर्च पर 100 लाख token की संदर्भ खिड़की का समर्थन करता है। समान आकार के dense मॉडल की तुलना में, मिश्रित संरचना एजेंट कार्यों में 5 गुना अधिक थ्रूपुट प्रदान करती है और 30% तक निष्पादन लागत कम करती है। पारिस्थितिकी समर्थन के संदर्भ में, न्यूमैन ने NemoClaw ऑर्केस्ट्रेशन ब्लूप्रिंट और OpenShell रनटाइम के साथ Agent Toolkit प्रकाशित किया है। ओपन सोर्स सामग्री में सीधे मॉडल वजन, डेटासेट और प्रशिक्षण प्रक्रिया समाहित हैं। मॉडल Hugging Face, NVIDIA NIM और OpenRouter पर उपलब्ध है, और Glean जैसी कंपनी-स्तरीय AI सर्च सेवा प्रदाता पहले ही समाहित होने कीघोषणा कर चुकी हैं, जो वाणिज्यिक-बंद सोर्स लार्ज मॉडल के विकल्प के रूप में प्रयोग के लिए है।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।