Ang Nvidia at ang FPT Corporation ay naglabas ng isang dataset ng 900,000 na sintetikong persona na disenyo upang tulungan ang mga AI model na maunawaan ang wika, kultura, at demograpiko ng Vietnam. Ang Nemotron-Personas-Vietnam dataset, na inilunsad noong June 5, ay inilabas sa Hugging Face sa ilalim ng lisensya na CC-BY-4.0, kaya ito ay komersyal na gamitin ng sinuman.
Ano ang nasa dataset
Ang koleksyon ay naglalaman ng 31 na field bawat persona, na kumakapal ng demograpiko ng Vietnam, distribusyon heograpiko, kakaibang wika, at mga katangian ng puwersa ng paggawa. Hindi ito mga profile na kinuha mula sa mga totoong indibidwal. Ito ay algorithmically na nilikha upang magsalamin ng totoong pattern ng populasyon habang iiwas sa mga panganib sa privacy na dumadating sa paggamit ng totoong personal na data.
Ang dataset ay compatible sa mga kasangkapan ng Nvidia’s NeMo, ang framework ng kumpanya para sa pagbuo at pag-customize ng AI models. Ang FPT Corporation, na nagpapatakbo bilang Nvidia Cloud Partner, ang nagdala ng lokal na ekspertis na kailangan upang gawing kultural at wikaang tama ang mga persona.
Ang sovereign AI play
Ang bersyon na ito ay bahagi ng mas malawak na Nemotron-Personas initiative ni Nvidia, na nagsagawa na ng katulad na dataset na espesipiko sa rehiyon para sa Singapore, Korea, at US. Ang paglunsad ay nangyari kasabay ng Nvidia GTC Taipei at Computex 2026, dalawa sa mga pinakamalalaking event sa kalendaryo ng teknolohiya sa Asya.
Ang mga ugnayan ni Nvidia ay higit pa sa FPT sa bansa. Ang Viettel, isa pang malaking vietnameseng teknolohiyang kumpanya, ay nakikilahok sa pagbuo ng mga pambansang AI application sa imprastruktura ni Nvidia. Ang papel ng FPT bilang Nvidia Preferred Partner ay umaabot pa sa labas ng Vietnam, kasama ang pagpapalakas ng AI factories sa Vietnam at Japan.
Ano ang ibig sabihin nito para sa mga larangan ng AI at teknolohiya
Sa pamamagitan ng pagpapalayang libre para sa komersyal na paggamit sa ilalim ng CC-BY-4.0, ang Nvidia at FPT ay nagbibigay ng 900,000 mga persona para gamitin nang walang bayad ng mga startup, unibersidad, at mas maliit na kumpanya. Ang pagbuo ng sintetikong data ay naglalagay din sa paligid ng mga palatuntunan sa pagprotekta sa data na lalong nagiging mahigpit, at nag-aalok ng isang alternatibong komplyante sa paggamit ng totoong personal na data sa pagtuturo ng AI.
