Nvidia và FPT phát hành bộ dữ liệu 900.000 nhân vật giả lập dành cho Việt Nam

iconCryptoBriefing
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Nvidia và FPT đã công bố bộ dữ liệu 900.000 nhân vật tổng hợp dành cho Việt Nam, bao gồm ngôn ngữ, văn hóa và nhân khẩu học. Bộ dữ liệu Nemotron-Personas-Vietnam, ra mắt ngày 5 tháng Sáu, có sẵn trên Hugging Face dưới giấy phép CC-BY-4.0. Nó bao gồm 31 trường thông tin mỗi nhân vật và hỗ trợ phát triển tin tức AI + crypto. Tương thích với các công cụ NeMo của Nvidia, bộ dữ liệu tận dụng chuyên môn địa phương của FPT. Đây là một phần trong sáng kiến Nemotron-Personas rộng hơn của Nvidia, cũng bao gồm Singapore, Hàn Quốc và Hoa Kỳ. Việc phát hành này phù hợp với các sự kiện tin tức trên chuỗi như GTC Taipei và Computex 2026. Bộ dữ liệu miễn phí để sử dụng thương mại, nhằm hỗ trợ các startup và tránh các vấn đề về quyền riêng tư dữ liệu.

Nvidia và Công ty Cổ phần FPT đã công bố bộ dữ liệu gồm 900.000 nhân vật tổng hợp được thiết kế để giúp các mô hình AI hiểu rõ ngôn ngữ, văn hóa và đặc điểm nhân khẩu học của Việt Nam. Bộ dữ liệu Nemotron-Personas-Vietnam, được ra mắt vào ngày 5 tháng Sáu, đã được đăng tải trên Hugging Face dưới giấy phép CC-BY-4.0, nghĩa là bất kỳ ai cũng có thể sử dụng nó cho mục đích thương mại.

Thực chất dữ liệu gồm những gì

Bộ sưu tập bao gồm 31 trường thông tin mỗi nhân vật, bao gồm các đặc điểm nhân khẩu học Việt Nam, phân bố địa lý, đa dạng ngôn ngữ và đặc điểm lao động. Đây không phải là hồ sơ được thu thập từ các cá nhân thực tế. Chúng được tạo ra bằng thuật toán để phản ánh các mô hình dân số thực tế, đồng thời tránh được những rủi ro về quyền riêng tư khi sử dụng dữ liệu cá nhân thật.

Quảng cáo

Bộ dữ liệu tương thích với các công cụ NeMo của Nvidia, nền tảng của công ty để xây dựng và tùy chỉnh các mô hình AI. Tập đoàn FPT, hoạt động với tư cách là Đối tác Đám mây của Nvidia, đã mang đến chuyên môn địa phương cần thiết để đảm bảo các nhân vật có độ chính xác về văn hóa và ngôn ngữ.

Cuộc chơi AI chủ quyền

Bản phát hành này là một phần của sáng kiến Nemotron-Personas rộng lớn hơn của Nvidia, vốn đã tạo ra các bộ dữ liệu đặc thù theo khu vực cho Singapore, Hàn Quốc và Hoa Kỳ. Việc ra mắt trùng với sự kiện Nvidia GTC Taipei và Computex 2026, hai sự kiện lớn nhất trong lịch trình công nghệ châu Á.

Các đối tác của Nvidia mở rộng vượt quá FPT trong nước. Viettel, một công ty công nghệ lớn khác của Việt Nam, đang tham gia xây dựng các ứng dụng AI quốc gia trên cơ sở hạ tầng của Nvidia. Vai trò của FPT với tư cách là Đối tác Ưu tiên của Nvidia cũng mở rộng ra ngoài Việt Nam, khi công ty tăng cường các nhà máy AI tại cả Việt Nam và Nhật Bản.

Điều này có nghĩa gì đối với cảnh quan AI và công nghệ

Bằng cách cung cấp miễn phí bộ dữ liệu này cho mục đích thương mại theo giấy phép CC-BY-4.0, Nvidia và FPT đang trao cho các startup, trường đại học và các công ty nhỏ hơn 900.000 nhân vật để sử dụng miễn phí. Việc tạo dữ liệu tổng hợp cũng tránh được các quy định bảo vệ dữ liệu ngày càng nghiêm ngặt, mang đến một giải pháp thay thế tuân thủ thay vì sử dụng dữ liệu cá nhân thực tế trong đào tạo AI.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.