Nvidia ve FPT Corporation, AI modellerinin Vietnam'ın dilini, kültürünü ve nüfus yapısını anlamasına yardımcı olmak üzere 900.000 sentetik kişilik oluşturmak için bir veri seti yayınladı. 5 Haziran'da başlatılan Nemotron-Personas-Vietnam veri seti, Hugging Face üzerinde CC-BY-4.0 lisansı altında yayınlandı ve bu, herkes tarafından ticari olarak kullanılabilir olduğu anlamına gelir.
Veri kümesinde aslında ne var
Koleksiyon, her birey için 31 alanı kapsıyor ve vietnamlı nüfusun demografik yapısını, coğrafi dağılımını, dil çeşitliliğini ve işgücü özelliklerini içeriyor. Bunlar, gerçek bireylerden çekilen profiller değildir; gerçek nüfus desenlerini yansıtmak için algoritmik olarak üretilmişlerdir ve gerçek kişisel verilerin kullanılmasıyla gelen gizlilik risklerinden kaçınılmıştır.
Veri kümesi, Nvidia'nın AI modelleri oluşturma ve özelleştirme için kullandığı NeMo araçları ile uyumludur. Nvidia Bulut Ortağı olarak faaliyet gösteren FPT Corporation, karakterlerin kültürel ve dilsel olarak doğru olmasını sağlamak için yerel uzmanlığı sağladı.
Egemen AI oyunu
Bu sürüm, Singapur, Kore ve ABD için zaten benzer bölgeye özel veri kümeleri üretmiş olan Nvidia’nın daha geniş Nemotron-Personas girişimi kapsamında yer alıyor. Yayın, Asya teknoloji takvimindeki en büyük etkinliklerden olan Nvidia GTC Taipei ve Computex 2026 ile aynı zamana denk geldi.
Nvidia’nın ülkedeki ortaklıkları FPT’yi aşmaktadır. Viettel, başka bir büyük Vietnam teknoloji firması, Nvidia altyapısı üzerinde ulusal AI uygulamaları inşa etmektedir. FPT’nin Nvidia Tercih Edilen Ortaklığı rolü, hem Vietnam hem de Japonya’da AI fabrikalarını geliştirmek suretiyle Vietnam’ın dışına da uzanmaktadır.
Bu, yapay zeka ve teknoloji ortamı için ne anlama geliyor
Nvidia ve FPT, veri kümesini CC-BY-4.0 altında ticari kullanım için ücretsiz olarak sunarak, başlangıç şirketlerine, üniversitelere ve daha küçük firmalara hiçbir maliyet olmadan 900.000 persona sağlamaktadır. Yapay veri üretimi, aynı zamanda AI eğitimi için gerçek kişisel veriler kullanmanın yerine, giderek daha sıkılaşan veri koruma düzenlemelerini atlamaktadır.
