source avatarDavid Arnal

साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy

वर्षों में सबसे विस्तृत एफ्रंटियर LLM प्रशिक्षण रिपोर्ट में से एक। माइक्रोसॉफ्ट ने हाल ही में अपने तर्क-केंद्रित मॉडल MAI-Thinking-1 का एक गहन तकनीकी विश्लेषण प्रकाशित किया है: • 35B सक्रिय / 1T कुल पैरामीटर MoE • 256k संदर्भ विंडो (~600 पृष्ठों का दस्तावेज) • 8,000 GB200 GPU के क्लस्टर पर प्रशिक्षित दिलचस्प बात: यहाँ नवीन आर्किटेक्चर पर नहीं, बल्कि डेटा की गुणवत्ता और प्रशिक्षण विधि पर ध्यान केंद्रित किया गया है। शायद भविष्य में एफ्रंटियर मॉडल के लाभ का बहुत बड़ा हिस्सा इसी ओर जा रहा है। इसे ओपन-सोर्स नहीं किया जा रहा है, लेकिन माइक्रोसॉफ्ट API के माध्यम से फाइन-ट्यूनिंग प्रदान करने की योजना बना रहा है। अगर अधिक बड़े टेक लैब्स इस स्तर की विस्तृत जानकारी साझा करना शुरू करते हैं, तो शोधकर्ता और निर्माताओं को सचमुच क्या महत्वपूर्ण है, इसकी स्पष्टता मिलेगी। क्या आपको लगता है कि अगले बड़े प्रगति के कदम बेहतर आर्किटेक्चर से होंगे—या बेहतर डेटा और प्रशिक्षण पाइपलाइन से?

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।