أطلقت Nvidia وFPT Corporation مجموعة بيانات تحتوي على 900,000 شخصية اصطناعية مصممة لمساعدة نماذج الذكاء الاصطناعي على فهم اللغة والثقافة والخصائص السكانية لفيتنام. وقد تم إطلاق مجموعة بيانات Nemotron-Personas-Vietnam في 5 يونيو على Hugging Face بموجب ترخيص CC-BY-4.0، مما يعني أنه يمكن لأي شخص استخدامها لأغراض تجارية.
ما المحتوى الفعلي في مجموعة البيانات
تشمل المجموعة 31 حقلًا لكل شخصية، وتغطي التركيبة السكانية الفيتنامية، والتوزيع الجغرافي، وتنوع اللغات، وخصائص القوى العاملة. هذه ليست ملفات شخصية مُستخلصة من أفراد حقيقيين، بل تم توليدها خوارزميًا لتعكس أنماط السكان الحقيقية مع تجنب مخاطر الخصوصية المرتبطة باستخدام البيانات الشخصية الحقيقية.
البيانات متوافقة مع أدوات Nvidia NeMo، وهي الإطار الذي تستخدمه الشركة لبناء وتوسيع نماذج الذكاء الاصطناعي. وقد قدمت شركة FPT Corporation، التي تعمل كشريك سحابي لـ Nvidia، الخبرة المحلية اللازمة لضمان دقة السمات من الناحية الثقافية واللغوية.
لعبة الذكاء الاصطناعي السيادي
يُعد هذا الإصدار جزءًا من مبادرة Nemotron-Personas الأوسع لشركة Nvidia، والتي أنتجت بالفعل مجموعات بيانات مشابهة مخصصة للمناطق لسنغافورة وكوريا والولايات المتحدة. وتم الإطلاق بالتزامن مع حدثي Nvidia GTC تايبيه وComputex 2026، وهما من أكبر الفعاليات على التقويم التقني الآسيوي.
تمتد شراكات Nvidia وراء FPT في البلاد. فيتيل، وهي شركة تكنولوجية فيتنامية كبرى أخرى، تشارك في بناء تطبيقات الذكاء الاصطناعي الوطنية على بنية Nvidia. كما تمتد دور FPT كشريك مفضل لـ Nvidia خارج فيتنام، مع تعزيز الشركة لمصانع الذكاء الاصطناعي في كل من فيتنام واليابان.
ما يعنيه ذلك لمشهد الذكاء الاصطناعي والتكنولوجيا
من خلال جعل مجموعة البيانات متاحة مجانًا للاستخدام التجاري بموجب ترخيص CC-BY-4.0، توفر Nvidia وFPT لشركات الناشئة والجامعات والشركات الأصغر 900,000 شخصية للعمل بها مجانًا. كما أن توليد البيانات الاصطناعية يتجنب اللوائح الصارمة المتزايدة لحماية البيانات، ويوفر بديلاً متوافقًا مع المتطلبات القانونية لاستخدام البيانات الشخصية الحقيقية في تدريب الذكاء الاصطناعي.
