নভিডিয়া এবং এফপিটি কর্পোরেশন ভিয়েতনামের ভাষা, সংস্কৃতি এবং জনপরিসংখ্যান বুঝতে এআই মডেলগুলিকে সহায়তা করার জন্য 900,000টি সিনথেটিক ব্যক্তিত্বের ডেটাসেট প্রকাশ করেছে। 5 জুন চালু হওয়া নেম্ট্রন-পারসোনাস-ভিয়েতনাম ডেটাসেটটি এইচআইগিং ফেসে সিসি-বাই-4.0 লাইসেন্সের অধীনে প্রকাশিত হয়েছে, যার অর্থ এটি যেকোনো ব্যক্তির জন্য বাণিজ্যিকভাবে ব্যবহারযোগ্য।
ডেটাসেটে বাস্তবে কী আছে
এই সংগ্রহটি প্রতিটি ব্যক্তির জন্য ৩১টি ক্ষেত্র অন্তর্ভুক্ত করে, যা ভিয়েতনামী জনসংখ্যাগত বৈশিষ্ট্য, ভৌগোলিক বণ্টন, ভাষাগত বৈচিত্র্য এবং শ্রমিক বৈশিষ্ট্যকে কভার করে। এগুলি বাস্তব ব্যক্তিদের প্রোফাইল থেকে স্ক্র্যাপ করা হয়নি। এগুলি বাস্তব জনসংখ্যার প্যাটার্নকে প্রতিফলিত করার জন্য অ্যালগরিদমিকভাবে তৈরি করা হয়েছে, যেখানে বাস্তব ব্যক্তিগত ডেটা ব্যবহারের সাথে আসা গোপনীয়তা ঝুঁকি এড়ানো হয়েছে।
ডেটাসেটটি নভিডিয়ার নেমো টুলস, যা কোম্পানির এআই মডেল তৈরি এবং কাস্টমাইজ করার জন্য ফ্রেমওয়ার্ক, এর সাথে সামঞ্জস্যপূর্ণ। নভিডিয়া ক্লাউড পার্টনার হিসেবে কাজ করা FPT কর্পোরেশন ব্যক্তিত্বগুলিকে সাংস্কৃতিকভাবে এবং ভাষাগতভাবে সঠিক করার জন্য স্থানীয় বিশেষজ্ঞতা প্রদান করেছে।
সুযোগ বাহিনী AI প্লে
এই রিলিজটি নভিডিয়ার ব্রডার নেমট্রন-পারসোনাস প্রকল্পের অংশ, যা ইতিমধ্যেই সিঙ্গাপুর, কোরিয়া এবং মার্কিন যুক্তরাষ্ট্রের জন্য সদৃশ অঞ্চল-নির্ভর ডেটাসেট তৈরি করেছে। এই লঞ্চটি নভিডিয়া GTC তাইপেই এবং Computex 2026-এর সাথে মিলে গেছে, যা এশিয়ান টেক ক্যালেন্ডারের দুটি সবচেয়ে বড় ইভেন্ট।
নভিডিয়ার অংশীদারিত্ব দেশে FPT-এর বাইরেও বিস্তৃত। অন্যতম প্রধান ভিয়েতনামি প্রযুক্তি কোম্পানি ভিটেল, নভিডিয়ার ইনফ্রাস্ট্রাকচারে জাতীয় AI অ্যাপ্লিকেশন তৈরির সাথে জড়িত। FPT-এর নভিডিয়া প্রিফার্ড পার্টনার হিসেবে ভূমিকা ভিয়েতনামের বাইরেও বিস্তৃত, যেখানে কোম্পানিটি ভিয়েতনাম এবং জাপানে AI ফ্যাক্টরি উন্নয়নে সহায়তা করছে।
এটি কৃত্রিম বুদ্ধিমত্তা এবং প্রযুক্তির দৃশ্যের জন্য কী অর্থ বহন করে
CC-BY-4.0-এর অধীনে কমার্শিয়াল ব্যবহারের জন্য ডেটাসেটটি মুক্তভাবে উপলব্ধ করে দিয়ে, নভিডিয়া এবং এফপিটি ৯০০,০০০টি পারসোনা বিনামূল্যে স্টার্টআপ, বিশ্ববিদ্যালয় এবং ছোট কোম্পানিগুলির জন্য প্রদান করছে। সিনথেটিক ডেটা জেনারেশন এছাড়াও বাড়তে থাকা ডেটা সুরক্ষা নিয়ম-কানুনকে এড়িয়ে চলে, যা AI প্রশিক্ষণের জন্য বাস্তব ব্যক্তিগত ডেটা ব্যবহারের পরিবর্তে একটি সঙ্গতিপূর্ণ বিকল্প প্রদান করে।
