لکھنے والے: The Guardian
ترجمہ: شن چاؤ ٹیک فلو
شین چاؤ کا خلاصہ: اس تحقیقی رپورٹ میں ایک تیزی سے بڑھ رہے گرے اسکیل کے صنعت کا انکشاف کیا گیا ہے: دنیا بھر کے ہزاروں لوگ اپنی آواز، چہرے، فون کال ریکارڈ اور روزمرہ کے ویڈیوز فروخت کرکے AI ٹریننگ کے لیے کمائیں۔
یہ صرف خصوصیات کے بارے میں عام بحث نہیں ہے، بلکہ ایک تحقیق ہے جس میں حقیقی افراد، حقیقی رقمیں اور حقیقی نتائج شامل ہیں — ایک اداکار جس نے اپنے چہرے کو بیچ دیا، بعد میں انسٹاگرام پر "اپنے" کو کسی نامعلوم طبی مصنوعات کے لیے تبلیغ کرتے ہوئے دیکھتا ہے، اور کمنٹس میں لوگ اس کے "ظاہری پہلو" پر تبصرہ کر رہے ہیں۔
جب AI کمپنیوں کی ڈیٹا کی بھوک اور عالمی معاشی فرق کو ملا دیا جائے، تو ایک ناانصافی والی سودا بنا رہا ہے۔
مکمل متن درج ذیل ہے:
گزشتہ سال ایک صبح، جیکوبس لو، جو جنوبی افریقہ کے کیپ ٹاؤن میں رہتا تھا، اپنی معمول کی سیر کے لیے نکلا اور راستے میں سمندری چڑیا کو کھانا دیا۔ لیکن اس بار اس نے کچھ ویڈیوز ریکارڈ کیں — جن میں وہ سڑک پر چلتے ہوئے اور اپنے منظر کو فلمایا گیا۔ اس ویڈیو نے اسے 14 امریکی ڈالر کمائے، جو ملک کی حداقل تنخواہ کے تقریباً 10 گنا ہے اور اس 27 سالہ جوان کے لیے تقریباً نصف ہفتے کا خرچہ ہے۔
یہ لوو نے Kled AI پر ایک "شہری نیویگیشن" ٹاسک مکمل کیا ہے۔ Kled AI ایک ایپ ہے جو صارفین کو AI ماڈلز کے تربیت کے لیے تصویریں، ویڈیوز اور دیگر ڈیٹا اپ لوڈ کرنے پر ادائیگی کرتی ہے۔ صرف کچھ ہفتوں میں، لوو نے اپنی روزمرہ کی زندگی کی تصویریں اور ویڈیوز اپ لوڈ کرکے 50 امریکی ڈالر کمانے ہیں۔
ہزاروں میل دور، بھارت کے رانچی میں، 22 سالہ طالب علم ساہل تگا سلینسیو ایپ کے ذریعے منظم آواز کے ڈیٹا کو AI ٹریننگ کے لیے جمع کرنے کے لیے اپنے فون کے مائیکروفون کو استعمال کرکے ریستوراں کے اندر یا بھیڑ بھاڑ والے جunctions پر ماحولیاتی شور جمع کرتے ہوئے منظم آمدنی حاصل کرتے ہیں۔ وہ اپنی آواز کے ریکارڈنگ بھی اپ لوڈ کرتے ہیں۔ ساہل خاص مناظر، جیسے سلینسیو کے نقشے پر اب تک ریکارڈ نہ ہونے والے ہوٹل لابیوں کے لیے خصوصی طور پر جاتے ہیں۔ وہ اس سے ماہانہ 100 ڈالر سے زائد کمانے کا مظاہرہ کرتے ہیں، جو ان کے تمام خوراک کے اخراجات کو پورا کرنے کے لیے کافی ہے۔
شکاگو میں، 18 سالہ ویلڈنگ کا طالب علم رامیلیو ہل نے اپنے دوستوں اور خاندان کے ذاتی موبائل چیٹ ریکارڈز کو Neon Mobile — جو ایک مکالماتی AI ٹریننگ پلیٹ فارم ہے — کو فی منٹ 0.50 امریکی ڈالر کے حساب سے بیچ کر کچھ سو ڈالر کمائے۔ ہل کے لیے، یہ حساب بہت آسان تھا: وہ سمجھتا تھا کہ ٹیک کمپنیاں پہلے ہی اس کے بہت سارے ذاتی ڈیٹا کو掌握 کر چکی ہیں، اس لیے وہ خود بھی اس سے فائدہ اٹھانا چاہتا تھا۔
یہ "AI ٹریننگ گیگز" — جن میں اردگرد کے مناظر، اپنی تصاویر، ویڈیوز اور آڈیو اپ لوڈ کیے جاتے ہیں — عالمی نئے ڈیٹا کے سونے کی دوڑ کے سب سے آگے کھڑے ہیں۔ جب سلیکون ویلی کی اعلیٰ انسانی ڈیٹا کی خواہش کو کھلے انٹرنیٹ سے حاصل ہونے والے ڈیٹا سے زیادہ ہو گئی، تو اس خلا کو پُر کرنے کے لیے ایک تیزی سے بڑھتے ہوئے ڈیٹا مارکیٹ صنعت پیدا ہوئی۔ کیپ ٹاؤن سے لے کر شکاگو تک، ہزاروں لوگ اپنی بائیومیٹرک شناخت اور نجی ڈیٹا کو نسل اگلے AI کے لیے مائکرو لائسنس دے رہے ہیں۔
لیکن اس نئے گیگ اقتصاد کے ساتھ قیمت بھی جڑی ہوئی ہے۔ کچھ ڈالروں کے بدلے، یہ تربیت دینے والے ایک ایسے صنعت کو توانائی فراہم کر رہے ہیں جو بالآخر ان کے مہارت کو زائد پڑ سکتی ہے، اور خود کو گہرے جھوٹے ڈیٹا، شناخت چوری اور ڈیجیٹل استحصال کے مستقبل کے خطرات کے لیے معرض خطرہ بنارہے ہیں—جس کے بارے میں ان کو ابھی صرف ابتدائی تصور ہے۔
AI گیئر کو گھوماتے رہیں
AI زبانی ماڈلز جیسے ChatGPT اور Gemini کو بہتر بنانے کے لیے بہت زیادہ تعلیمی مواد کی ضرورت ہوتی ہے، لیکن وہ اب تعلیمی مواد کی کمی کا سامنا کر رہے ہیں۔ C4، RefinedWeb اور Dolma جیسے سب سے زیادہ استعمال ہونے والے تربیتی ڈیٹا سورسز ویب کے سب سے بہترین ڈیٹا سیٹس کا ایک چوتھائی حصہ قبضہ کرتے ہیں، اور اب یہ جنریٹو AI کمپنیوں کو اپنے ڈیٹا کو ماڈلز کی تربیت کے لیے استعمال کرنے سے روک رہے ہیں۔ تحقیق کاروں کا اندازہ ہے کہ AI کمپنیاں جلد سے جلد 2026 تک دستیاب نئے اور معیاری متن کا خاتمہ کر دیں گی۔ حالانکہ کچھ لیبز نے AI کے خود تخلیق کردہ مصنوعی ڈیٹا کو واپس تربیت کے لیے استعمال کرنا شروع کر دیا ہے، لیکن یہ رجحان ماڈلز کو غلطیوں سے بھرپور "کچرا" پیدا کرنے کی طرف لے جاتا ہے، جس سے ان میں خرابی پیدا ہوتی ہے۔

Kled AI اور Silencio جیسے ایپلیکیشنز یہیں پر ظاہر ہوئے ہیں۔ ان ڈیٹا مارکیٹس میں لاکھوں لوگ اپنی شناخت کی ڈیٹا فروخت کر کے AI کو پال رہے اور تربیت دے رہے ہیں۔ Kled AI، Silencio اور Neon Mobile کے علاوہ، AI ٹرینرز کے لیے کئی اور اختیارات موجود ہیں: مشہور انسکیولیٹر Y-Combinator کے تعاون سے بنایا گیا Luel AI، جو متعدد زبانوں کے مکالمات کو منٹ کے حساب سے تقریباً 0.15 امریکی ڈالر کے ریٹ پر حاصل کرتا ہے؛ ElevenLabs آپ کو اپنی آواز کا ڈیجیٹل کلون بنانے کی اجازت دیتا ہے اور دوسرے لوگوں کو اسے منٹ کے حساب سے بنیادی ریٹ 0.02 امریکی ڈالر پر استعمال کرنے کی اجازت دیتا ہے۔
لندن کے بادشاہی کالج کے اقتصادیات کے پروفیسر بوکے کلین ٹیسلنک کا کہنا ہے کہ AI ٹریننگ کا گیگ نوکری کا ایک نیا طبقہ ہے جو کافی حد تک بڑھے گا۔
ٹیسلنک کہتے ہیں کہ AI کمپنیاں جانتی ہیں کہ لوگوں کو ڈیٹا کی اجازت کے لیے ادائیگی کرنا، مکمل طور پر ویب سکریپنگ پر انحصار کرنے سے ہونے والے کاپی رائٹ تنازعات سے بچنے میں مدد کرتا ہے۔ AI ریسرچر وینیامن ویسیلووسکی کہتے ہیں کہ ان کمپنیوں کو نئے، بہتر شکل دیے گئے رویوں کو ماڈل کرنے کے لیے اعلیٰ معیار کا ڈیٹا بھی درکار ہوتا ہے۔ "اب تک، انسانی ڈیٹا ماڈل کی تقسیم سے باہر سے نمونہ لینے کا سنہری معیار ہے،" ویسیلووسکی نے مزید کہا۔
ان مشینوں کو چلانے والے انسان—خاص طور پر ترقی پذیر ممالک کے لوگ—اکثر اس رقم کی ضرورت رکھتے ہیں اور ان کے لیے تقریباً کوئی دوسرا انتخاب نہیں ہوتا۔ AI ٹریننگ کے لیے کام کرنے والوں کے لیے، یہ کام معاشی فرق کا ایک عملی جواب ہے۔ بے روزگاری کے اعلیٰ اور مقامی کرنسی کی قیمت میں کمی والے ممالک میں، ڈالر کمانا مقامی نوکریوں کے مقابلے میں زیادہ مستحکم اور منافع بخش ہوتا ہے۔ کچھ لوگوں کو شروعاتی نوکریاں نہیں ملتیں، اور وہ روزی روٹی کے لیے AI ٹریننگ کرتے ہیں۔ حتیٰ کہ مزید دولت مند ممالک میں بھی، زندگی کے اخراجات میں اضافہ اپنے آپ کو بیچنا ایک منطقی مالی فیصلہ بناتا ہے۔
کیپ ٹاؤن کے AI ٹرینر لاؤ کو اس کے پرائیویسی کے اخراجات کا واضح خیال ہے۔ اگرچہ ان کی آمدنی بے ثبات ہے اور ان کے ماہانہ اخراجات کو پورا نہیں کرتی، لیکن وہ پیسہ کمانے کے لیے ان شرائط کو قبول کرتے ہیں۔ انہوں نے سالوں تک عصبی بیماری سے جھلّا، جس کی وجہ سے انہیں نوکری نہیں مل سکی، لیکن AI ڈیٹا مارکیٹ (Kled AI سمیت) میں کمانے والی رقم نے انہیں 500 امریکی ڈالر جمع کرنے میں مدد کی، جس سے انہوں نے ایک سپا ٹریننگ کورس میں داخلہ لیا اور مساج تھراپسٹ بن گئے۔
"جنوبی افریقی کے طور پر، ڈالر حاصل کرنا دوسرے لوگوں کے خیال سے زیادہ قیمتی ہے،" لاؤ نے کہا۔
اکسفورڈ یونیورسٹی کے انٹرنیٹ جیوگرافی پروفیسر اور کتاب "فیڈنگ دی ماشین" کے مصنف مارک گراہم نے تسلیم کیا کہ ترقی پذیر ممالک کے افراد کے لیے یہ رقم مختصر مدت میں عملی معنی رکھ سکتی ہے، لیکن وہ انتباہ دیتے ہیں کہ "ساختی طور پر، یہ نوکری عدم استحکام کے ساتھ ہے، کوئی ترقی کا راستہ نہیں، اور دراصل ایک موت کا راستہ ہے۔"
گراہم نے مزید کہا کہ AI ڈیٹا مارکیٹ "تنافسی تنخواہوں میں کمی" اور "انسانی ڈیٹا کی عارضی مانگ" پر منحصر ہے۔ جب یہ مانگ بدل جائے، تو "کام کرنے والوں کے پاس کوئی گارنٹی، کوئی منتقل کرنا ممکن مہارت، اور کوئی سیفٹی نیٹ نہیں ہوگا۔"
گراہم نے کہا کہ واحد فاتح " شمالی نصف گولے کے پلیٹ فارم " ہیں، جنہوں نے تمام مستقل قیمت حاصل کر لی ہے۔

مکمل اختیارات
شیکاگو کے AI ٹرینر ہل کو اپنی نجی موبائل بات چیت کو Neon Mobile کو بیچنے کے بارے میں مختلط جذبات ہیں۔ تقریباً 11 گھنٹے کی بات چیت سے اسے 200 امریکی ڈالر کمانے کے باوجود، وہ کہتے ہیں کہ یہ ایپ بار بار آف لائن ہو جاتی ہے اور ادائیگیوں میں تاخیر ہوتی ہے۔ "میری نظر میں Neon ہمیشہ مشکوک رہا ہے، لیکن میں صرف بِل ادا کرنے کے لیے کچھ اضافی پیسے کمانے کے لیے اس کا استعمال جاری رکھتا رہا،" ہل نے کہا۔
اب وہ اس رقم کو لے کر سوچ رہا ہے کہ کیا یہ واقعی اتنی آسان تھی۔ گزشتہ سال ستمبر میں، Neon Mobile کو صرف کچھ ہفتے چلنے کے بعد بند کر دیا گیا، کیونکہ TechCrunch نے ایک سیکورٹی خامی دریافت کی جس کی وجہ سے کوئی بھی صارفین کے فون نمبرز، کال ریکارڈز اور متن ریکارڈز تک رسائی حاصل کر سکتا تھا۔ ہل نے کہا کہ Neon Mobile نے اس بات کا انہیں کبھی اطلاع نہیں دیا، اور اب وہ ڈر رہا ہے کہ اس کی آواز انٹرنیٹ پر غلط طریقے سے استعمال ہو سکتی ہے۔
استنفورڈ یونیورسٹی کے انسانی مرکوز AI انسٹی ٹیوٹ کی ڈیٹا پرائیویسی ریسرچر جینیفر کنگ کو فکر ہے کہ AI ڈیٹا مارکیٹ میں صارفین کے ڈیٹا کا استعمال کس طرح اور کہاں کیا جائے گا، یہ واضح نہیں ہے۔ وہ مزید کہتی ہیں کہ اپنے حقوق کے بارے میں ناواقف ہونے اور اس بات پر مذاکرات نہ کرنے کی صورت میں، "صارفین کو اس خطرے کا سامنا ہے کہ ان کا ڈیٹا ان کی پسند نہ ہونے، ان کو سمجھ نہ آنے یا ان کی توقع سے باہر طریقے سے دوبارہ استعمال کیا جائے گا، اور اس صورت میں ان کے پاس تقریباً کوئی راستہ نہیں ہوگا جس سے وہ اپنے حقوق کا دفاع کر سکیں۔"
جب AI ٹرینرز Neon Mobile اور Kled AI پر ڈیٹا شیئر کرتے ہیں، تو وہ ایک مکمل اور عالمی، منفرد، غیر قابل واپسی، منتقل کرنا یا رائلٹی کے بغیر اجازت دیتے ہیں جس کے تحت پلیٹ فارم ان کی تصویر کو فروخت، استعمال، عوامی طور پر دکھانا اور محفوظ کرنا، اور اس کی بنیاد پر مشتق اشیاء تخلیق کرنا چاہے۔
کلیڈ AI کے بانی ایوی پٹیل نے کہا کہ ان کی کمپنی کا ڈیٹا پروٹوکول صرف AI ٹریننگ اور تحقیق کے مقاصد کے لیے محدود ہوگا۔ "پورا کاروباری ماڈل صارفین کے اعتماد پر منحصر ہے۔ اگر شرکاء کو لگے کہ ان کا ڈیٹا غلط طریقے سے استعمال ہو سکتا ہے، تو پلیٹ فارم کام نہیں کر سکتا۔" انہوں نے کہا کہ کمپنی ڈیٹا سیٹس کی فروخت سے پہلے خریداروں کا جائزہ لے گی، جس سے "مشکوک نیت" والے اداروں، جیسے پورن صنعت، اور وہ "حکومتی ادارے" جنہیں وہ اعتماد کے خلاف طریقے سے ڈیٹا استعمال کرنے کا خدشه رکھتے ہیں، کے ساتھ تعاون نہیں ہوگا۔
نیون موبائل نے تبصرہ کی درخواست پر رد نہیں دیا۔
لندن شہر کے سینٹ جارج یونیورسٹی کے قانون کے پروفیسر انریکو بوناڈیو نے کہا کہ ان معاہدوں کے شرائط پلیٹ فارم اور اس کے صارفین کو "اس مواد کے ساتھ تقریباً کوئی بھی کام کرنے کی اجازت دیتے ہیں، مستقل طور پر، مزید ادائیگی کے بغیر، اور شریکین کے پاس حقیقی طریقہ نہیں ہے کہ وہ رضامندی واپس لیں یا دوبارہ مذاکرات کریں۔"
مزید فکر کی بات یہ ہے کہ ٹرینر کے ڈیٹا کو گہری جھوٹھی تخلیقات اور شناخت کی دھوکہ دہی کے لیے استعمال کیا جا سکتا ہے۔ بونادیو کے مطابق، جبکہ ڈیٹا مارکیٹس دعویٰ کرتی ہیں کہ وہ اپنے ڈیٹا میں شناخت کی معلومات (جیسے نام اور مقام) کو فروخت سے پہلے ختم کر دیتی ہیں، لیکن بائیومیٹرک پیٹرنز کو حقیقی طور پر اناں کرنا بنیادی طور پر مشکل ہے۔
فروخت کار کا افسوس
اگرچہ AI ٹرینرز کو ڈیٹا کے استعمال کے بارے میں زیادہ تفصیلی حفاظتی شرائط حاصل کرنے کا موقع مل سکتا ہے، لیکن وہ پھر بھی اس بات پر پچھتا سکتے ہیں۔ 2024 میں، نیو یارک کے اداکار ایڈم کوئی نے اپنی تصویر کو کیپشنز کو 1000 امریکی ڈالر میں بیچ دیا—ایک AI ویڈیو ایڈیٹنگ سافٹ ویئر جس کا نام اب میراج رکھا گیا ہے۔ ان کے معاہدے میں یہ شرط شامل تھی کہ ان کی شناخت کو کسی بھی سیاسی مقصد کے لیے استعمال نہیں کیا جائے گا، نہ ہی الکحل، تھوڑے یا جنسی مواد کو فروغ دینے کے لیے، اور اجازت کی مدت ایک سال تک تھی۔
کیپشنز نے تبصرہ کے لیے درخواست کا جواب نہیں دیا۔
جلد ہی، ایڈم کے دوستوں نے اپنے آن لائن پر پائے گئے ویڈیوز کو شیئر کرنا شروع کر دیا، جن میں اس کا چہرہ اور آواز استعمال کی جا رہی تھی اور ان کی ویوز ملینوں تک پہنچ گئیں۔ ایک انستاگرام ویڈیو میں، ایڈم کا AI کاپی اپنے آپ کو "ویجن ڈاکٹر" کہہ رہا تھا اور حمل اور پوسٹ پارٹم خواتین کے لیے ثابت شدہ نہیں ہونے والے طبی مکملات کو فروغ دے رہا تھا۔
"دوسروں کو اس بات کی وضاحت کرنا میرے لیے الجھن کا باعث ہے،" کوئی نے کہا۔
کوئی نے مزید کہا، "کمنٹس سیکشن عجیب ہے کیونکہ وہ میری ظاہری شکل کا جائزہ لے رہے ہیں، لیکن وہ میری شکل نہیں ہے۔" "جب میں نے (تصویریں بیچنے کا) فیصلہ کیا تو میرا خیال یہ تھا کہ زیادہ تر ماڈلز پہلے ہی آن لائن ڈیٹا اور تصاویر کو اکٹھا کر رہے ہوتے ہیں، تو بہتر ہے کہ میں اس کے لیے رقم حاصل کروں۔"
کوئی نے کہا کہ اس کے بعد اس نے کوئی بھی AI ڈیٹا فری لانس نہیں لیا۔ اس نے کہا کہ صرف اسی صورت میں وہ دوبارہ کرنے پر غور کرے گا جب کوئی کمپنی بڑا اجرت پیش کرے۔
