त्सिंगहुआ विश्वविद्यालय और मियानबी दुनिया का पहला AI-कोडिंग प्री-ट्रेनिंग फ्रेमवर्क ForgeTrain ओपन-सोर्स करते हैं

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
त्सिंगहुआ विश्वविद्यालय और मियानबी ने ForgeTrain को ओपन-सोर्स किया, जो AI + क्रिप्टो समाचार के लिए दुनिया का पहला AI-द्वारा लिखा गया प्री-ट्रेनिंग फ्रेमवर्क है। यह फ्रेमवर्क NVIDIA के Megatron से बेहतर प्रदर्शन करता है और Huawei Ascend पर 10% तेज़ है। इसने MiniCPM5-1B, एक शीर्ष-रैंक किए गए संकुचित मॉडल को भी विकसित किया है। यह प्रोजेक्ट AI उपकरणों के विकास के साथ वास्तविक दुनिया के संपत्ति (RWA) समाचार एकीकरण की संभावना पर प्रकाश डालता है।
ME AI संदेश, डॉनचा द्वारा मॉनिटर किए जाने पर, मियानबिंग इंटेलिजेंस और त्सिंहुआ विश्वविद्यालय के NLP प्रयोगशाला ने OpenBMB समुदाय में दुनिया का पहला पूर्णतः AI द्वारा लिखा गया उत्पादन-स्तरीय बड़े मॉडल प्री-ट्रेनिंग फ्रेमवर्क ForgeTrain को ओपन सोर्स किया है, और ForgeTrain द्वारा प्रशिक्षित एंड-साइड छोटे मॉडल MiniCPM5-1B को जारी किया है। 'AI द्वारा AI का निर्माण' के इंजीनियरिंग सर्कल को दर्शाने वाला पहला नमूना, ForgeTrain समान हार्डवेयर पर NVIDIA के Megatron से बेहतर प्रदर्शन करता है, और Huawei Ascend पर प्री-ट्रेनिंग के दौरान 10% तक की गति में वृद्धि करता है। साथ ही, MiniCPM5-1B Artificial Analysis के ओपन-वेट मॉडल रैंकिंग में पहले स्थान पर पहुंच गया है। AI को स्वयं नींव की प्री-ट्रेनिंग बुनियादी ढांचे की रचना करने की क्षमता प्रदान करने के लिए, मियानबिंग इंटेलिजेंस ने 'फॉर्ज इंजीनियरिंग' (Forge Engineering) सॉफ़्टवेयर प्रोग्रामिंग पैटर्न पेश किया है, जो सभी हार्डवेयर और कार्यों के साथ संगतता के सामान्य फ्रेमवर्क को छोड़कर, AI की कम लागत वाली कोड जेनरेशन क्षमता का उपयोग करके विशिष्ट मॉडल और हार्डवेयर के लिए स्थानीय रूप से विशेष कोड का निर्माण करता है। ForgeTrain की संरचना में तीन-चरणीय पद्धति का प्रयोग किया गया है: पहले, मौजूदा प्री-ट्रेनिंग फ्रेमवर्क से महत्वपूर्ण डेटा संकलित करके परीक्षण हैंडल (Harness) बनाया जाता है, फिर स्वचालित समाप्ति-चक्र में बाइनरी-समान फ्रेमवर्क कोड का पुनरावृत्ति से उत्पादन किया जाता है, और अंत में प्रतिबंधों को हटाकर संदर्भ कार्यान्वयन को पार किया जाता है। पूरी स्वचालित प्रगति AI द्वारा AI के L3 से L4 स्तर के संगत है। ForgeTrain के पहले उत्पाद मॉडल MiniCPM5-1B में 1.08 अरब पैरामीटर हैं, जिसकी मुख्य संरचना मानक LlamaForCausalLM पर आधारित है, जिससे डाउनस्ट्रीम एकीकरण और इनफ़्रेंस प्रस्तुति की सीमा में काफी कमी हुई है। Artificial Analysis में, मॉडल 18 अंकों के साथ 2B साइज़ Qwen3.5-2B (16) को पार करता है, Qwen3.5-0.8B (11) और LFM2.5-1.2B-Thinking (8) से आगे है। मॉडल MLX 4-bit और GGUF Q4_K_M सहित सभी प्रकार के प्रस्तुति प्रपत्रों का समर्थन करता है, INT4 क्वांटाइज़ेशन के बाद वजन मात्र 0.5GB है, और 131,072 tokens के लंबे प्रसंगों के साथ-साथ enable_thinking पर आधारित मिश्रित डुअल-मोड़इनफ़्रेंस का समर्थन प्रदान करता है।अति-कम हार्डवेयर प्रयासों के सहारे, OpenBMB ने MiniCPM Desk Pet, पूरी तरह सेऑफ़लाइन-चलने वाली मेज़बान-फ़्लोटिंग-प्रतिसंस्कृति (desktop floating companion) ऐप, Open Source की है,जो CursorजैसेडेवलपमेंटटूलसमेंकोडिंगगतिविधियोंऔरLoRAप्रोफ़ाइलस्विचकेसमयप्रतिक्रियाएँदेतीहै।(स्रोत: BlockBeats)
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।