ByteDance ने 128 A100 GPU पर प्रशिक्षित 3B पैरामीटर मल्टीमॉडल मॉडल Lance को ओपन सोर्स किया है

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
ByteDance ने 19 मई को 3B पैरामीटर वाला बहुआयामी मॉडल Lance ओपन-सोर्स किया, जिसे 128 A100 GPU का उपयोग करके प्रशिक्षित किया गया। यह मॉडल एक ही फ्रेमवर्क में छवि और वीडियो कार्यों को संभालता है। ऑन-चेन डेटा दर्शाता है कि AI-संचालित क्रिप्टो प्रोजेक्ट्स में खुली रुचि बढ़ रही है। Lance एक डुअल-स्ट्रीम MoE डिज़ाइन और मॉडैलिटी-अवेयर रोटेशन एन्कोडिंग का उपयोग करता है ताकि लागत कम हो और प्रदर्शन मजबूत बना रहे। इस तिमाही में AI-संबंधित टोकन में खुली रुचि स्थिर रूप से बढ़ी है।

ME News की सूचना के अनुसार, 19 मई (UTC+8) को, Beating द्वारा निगरानी के अनुसार, ByteDance Research ने अपना मूल एकीकृत बहुआयामी बड़ा मॉडल Lance को ओपन सोर्स कर दिया है। यह एक हल्का मॉडल है जिसके केवल 3B एक्टिवेटेड पैरामीटर हैं, जो एक ही फ्रेमवर्क में छवि और वीडियो की समझ, उत्पादन और संपादन दोनों को समर्थन करता है। वर्तमान में प्रमुख एकीकृत मॉडल बड़े पैरामीटर स्केल या टेक्स्ट-टू-इमेज आर्किटेक्चर पर अधिकतर निर्भर करते हैं, जबकि Lance अत्यंत कम कैलकुलेशन पावर के साथ सह-विकास का मार्ग अपनाता है। रिसर्च टीम ने मॉडल को पूरी तरह से शून्य से प्रशिक्षित किया है और पूरे प्रशिक्षण चक्र के लिए कुल कैलकुलेशन बजट को 128 A100 GPU तक सीमित कर दिया है। विभिन्न मोडल्स और कार्यों के बीच आंतरिक संघर्षों को हल करने के लिए, Lance के आर्किटेक्चर में दो कठोर अलगाव किए गए हैं: - साझा नीचले संदर्भ के साथ, समझ और उत्पादन के कैलकुलेशन पथों को अलग करने के लिए, मिश्रित-विशेषज्ञ (MoE) आर्किटेक्चर का उपयोग किया गया है। - छवि और वीडियो के हेटरोजेनस विजुअल token के बीच संकेत हस्तक्षेप को सीधे कम करने के लिए, मोडल-संवेदनशील रोटेशनल पज़िशनल कोडिंग का प्रयोग किया गया है। अत्यधिक कैलकुलेशन संपीड़न से प्रदर्शन सीमा में कमी नहीं हुई है। केवल 3B एक्टिवेटेड पैरामीटर के साथ, Lance का छवि और वीडियो उत्पादन और संपादन प्रदर्शन, अधिकांश मानक परीक्षणों में मौजूदा ओपन-सोर्स एकीकृत मॉडल्स को पीछे छोड़ता है, और कम पैरामीटर के साथ-साथ उत्पादन और सेमेंटिक समझ के साथ-साथ मल्टीटास्क सह-अनुकूलन का मार्ग प्रदर्शित करता है। (स्रोत: BlockBeats)

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।