Nvidia та FPT Corporation випустили набір з 900 000 синтетичних персон, створених для допомоги моделям ШІ зрозуміти мову, культуру та демографію В’єтнаму. Набір Nemotron-Personas-Vietnam, запущений 5 червня, з’явився на Hugging Face за ліцензією CC-BY-4.0, що означає, що його можна використовувати в комерційних цілях будь-хто.
Що саме міститься у наборі даних
Колекція охоплює 31 поле на особу, включаючи вієтнамські демографічні дані, географічний розподіл, мовну різноманітність та характеристики праці. Це не зібрані профілі реальних осіб. Вони генеруються алгоритмічно, щоб відображати справжні патерни населення, уникнувши при цьому проблем з конфіденційністю, пов’язаних із використанням реальних персональних даних.
Даний набір даних сумісний із інструментами Nvidia NeMo — платформою компанії для створення та налаштування моделей ШІ. FPT Corporation, яка діє як партнер Nvidia у хмарі, забезпечила місцеву експертизу, необхідну для досягнення культурної та мовної точності персонажів.
Гравець суверенного ШІ
Цей реліз є частиною ширшої ініціативи Nvidia Nemotron-Personas, яка вже створила подібні регіональні набори даних для Сінгапуру, Кореї та США. Запуск збігся з Nvidia GTC Taipei та Computex 2026 — двома найбільшими заходами на азійському технологічному календарі.
Партнерства Nvidia поширюються за межі FPT у країні. Viettel, ще одна велика в’єтнамська технологічна компанія, залучена до розробки національних AI-застосунків на інфраструктурі Nvidia. Роль FPT як переважного партнера Nvidia поширюється також за межі В’єтнаму, оскільки компанія розширює AI-фабрики як у В’єтнамі, так і в Японії.
Що це означає для ландшафту ШІ та технологій
Надаючи набір даних безкоштовно для комерційного використання за ліцензією CC-BY-4.0, Nvidia та FPT надають стартапам, університетам та меншим компаніям 900 000 персонажів для роботи безкоштовно. Генерація синтетичних даних також обходить все більш суворі норми захисту даних, пропонуючи альтернативу, що відповідає вимогам законодавства, замість використання реальних персональних даних у навчанні ШІ.
