Nvidia และบริษัท FPT ได้เปิดตัวชุดข้อมูลของบุคคลเสมือน 900,000 ราย ที่ออกแบบมาเพื่อช่วยให้โมเดล AI เข้าใจภาษา วัฒนธรรม และลักษณะประชากรของเวียดนาม ชุดข้อมูล Nemotron-Personas-Vietnam ที่เปิดตัวเมื่อวันที่ 5 มิถุนายน ได้รับการเผยแพร่บน Hugging Face ภายใต้ใบอนุญาต CC-BY-4.0 ซึ่งหมายความว่าทุกคนสามารถใช้งานเพื่อวัตถุประสงค์เชิงพาณิชย์ได้
มีอะไรอยู่ในชุดข้อมูล
ชุดข้อมูลครอบคลุม 31 ฟิลด์ต่อแต่ละบุคคล ครอบคลุมข้อมูลประชากรเวียดนาม การกระจายตัวทางภูมิศาสตร์ ความหลากหลายทางภาษา และลักษณะแรงงาน ไม่ใช่โปรไฟล์ที่ดึงมาจากบุคคลจริง แต่ถูกสร้างขึ้นด้วยอัลกอริทึมเพื่อสะท้อนรูปแบบประชากรที่แท้จริง โดยหลีกเลี่ยงปัญหาด้านความเป็นส่วนตัวที่เกิดจากการใช้ข้อมูลส่วนบุคคลจริง
ชุดข้อมูลนี้ใช้งานร่วมกับเครื่องมือ NeMo ของ Nvidia ซึ่งเป็นกรอบงานของบริษัทสำหรับการสร้างและปรับแต่งโมเดลปัญญาประดิษฐ์ FPT Corporation ซึ่งดำเนินงานในฐานะพันธมิตรคลาวด์ของ Nvidia ได้นำความเชี่ยวชาญในท้องถิ่นมาใช้เพื่อให้บุคลิกภาพมีความถูกต้องทางวัฒนธรรมและภาษา
การลงทุนใน AI ของรัฐบาล
การเปิดตัวครั้งนี้เป็นส่วนหนึ่งของโครงการ Nemotron-Personas ของ Nvidia ซึ่งได้สร้างชุดข้อมูลเฉพาะภูมิภาคที่คล้ายกันมาแล้วสำหรับสิงคโปร์ เกาหลี และสหรัฐอเมริกา การเปิดตัวครั้งนี้ตรงกับ Nvidia GTC Taipei และ Computex 2026 ซึ่งเป็นสองเหตุการณ์ที่ใหญ่ที่สุดในปฏิทินเทคโนโลยีของเอเชีย
ความร่วมมือของ Nvidia ขยายออกไปเกินกว่า FPT ในประเทศนี้ โดย Viettel บริษัทเทคโนโลยีรายใหญ่อีกแห่งของเวียดนาม ได้เข้าร่วมในการพัฒนาแอปพลิเคชัน AI ระดับชาติบนโครงสร้างพื้นฐานของ Nvidia บทบาทของ FPT ในฐานะพันธมิตรที่ได้รับการแนะนำจาก Nvidia ยังขยายออกไปเกินกว่าเวียดนาม โดยบริษัทได้เสริมสร้างโรงงาน AI ทั้งในเวียดนามและญี่ปุ่น
สิ่งนี้หมายถึงอะไรต่อภูมิทัศน์ของปัญญาประดิษฐ์และเทคโนโลยี
โดยการให้ชุดข้อมูลนี้สามารถใช้เพื่อวัตถุประสงค์ทางการค้าได้ฟรีภายใต้ใบอนุญาต CC-BY-4.0 Nvidia และ FPT กำลังมอบตัวตน 900,000 แบบให้กับสตาร์ทอัพ มหาวิทยาลัย และบริษัทขนาดเล็กเพื่อใช้งานโดยไม่มีค่าใช้จ่าย การสร้างข้อมูลเทียมยังหลีกเลี่ยงกฎระเบียบด้านการคุ้มครองข้อมูลที่เข้มงวดขึ้นเรื่อยๆ พร้อมเสนอทางเลือกที่สอดคล้องกับข้อบังคับแทนการใช้ข้อมูลส่วนบุคคลจริงในการฝึกอบรมปัญญาประดิษฐ์
