निविडिया और एफपीटी कॉर्पोरेशन ने 900,000 कृत्रिम व्यक्तित्वों का डेटासेट जारी किया है, जो एआई मॉडल्स को वियतनाम की भाषा, संस्कृति और जनसांख्यिकी को समझने में मदद करने के लिए डिज़ाइन किया गया है। 5 जून को लॉन्च किया गया नेमट्रॉन-पर्सनास-वियतनाम डेटासेट, Hugging Face पर CC-BY-4.0 लाइसेंस के तहत जारी किया गया है, जिसका अर्थ है कि यह किसी भी व्यक्ति द्वारा वाणिज्यिक रूप से उपयोग किया जा सकता है।
डेटासेट में वास्तव में क्या है
इस संग्रह में प्रत्येक व्यक्ति के लिए 31 क्षेत्र शामिल हैं, जो वियतनामी जनसांख्यिकी, भौगोलिक वितरण, भाषाई विविधता और श्रम विशेषताओं को कवर करते हैं। ये वास्तविक व्यक्तियों के उत्खात प्रोफ़ाइल नहीं हैं। इन्हें वास्तविक जनसंख्या पैटर्न को दर्शाने के लिए एल्गोरिदमिक रूप से उत्पन्न किया गया है, जबकि वास्तविक व्यक्तिगत डेटा के उपयोग के साथ आने वाले गोपनीयता के खतरों से बचा जाता है।
डेटासेट Nvidia के NeMo टूल्स के साथ संगत है, जो कंपनी का एआई मॉडल बनाने और कस्टमाइज़ करने के लिए फ्रेमवर्क है। FPT कॉर्पोरेशन, जो Nvidia क्लाउड पार्टनर के रूप में संचालित होता है, ने व्यक्तित्वों को सांस्कृतिक और भाषाई रूप से सटीक बनाने के लिए स्थानीय विशेषज्ञता प्रदान की।
सार्वभौमिक AI प्ले
यह रिलीज Nvidia के व्यापक Nemotron-Personas पहल का हिस्सा है, जिसने पहले ही सिंगापुर, कोरिया और अमेरिका के लिए समान क्षेत्र-विशिष्ट डेटासेट तैयार किए हैं। इस लॉन्च का समय Nvidia GTC Taipei और Computex 2026 के साथ मेल खाता है, जो एशियाई टेक कैलेंडर पर सबसे बड़ी दो घटनाएँ हैं।
Nvidia के साझेदारी देश में FPT के बाहर भी फैली हुई हैं। एक अन्य प्रमुख वियतनामी टेक कंपनी, Viettel, Nvidia के इंफ्रास्ट्रक्चर पर राष्ट्रीय AI एप्लिकेशन बनाने में शामिल है। FPT की Nvidia प्राथमिक साझेदार के रूप में भूमिका वियतनाम के बाहर भी फैली हुई है, जहां कंपनी वियतनाम और जापान में AI फैक्ट्रियों को बढ़ावा दे रही है।
इसका एआई और टेक लैंडस्केप पर क्या असर होगा
CC-BY-4.0 के तहत वाणिज्यिक उपयोग के लिए डेटासेट को मुफ्त उपलब्ध कराने से, नविडिया और FPT स्टार्टअप्स, विश्वविद्यालयों और छोटी कंपनियों को 900,000 पर्सोनास मुफ्त में उपयोग करने की सुविधा प्रदान कर रहे हैं। सिंथेटिक डेटा जनरेशन AI प्रशिक्षण में वास्तविक व्यक्तिगत डेटा के उपयोग के बजाय, बढ़ती हुई कठोर डेटा सुरक्षा नियमों को भी टालता है और अनुपालन-अनुकूल विकल्प प्रदान करता है।
