آپ نے 15 سال تک گوگل کے AI کو تربیت دی ہے۔ آپ کو پتہ نہیں تھا۔

ماخذ: شربل، انفنجٹیبل کے مشترکہ بانی

لیلا، بلاکبیٹس

ایڈیٹورز نوٹ: کیپچا (CAPTCHA) وہ ڈیجیٹل یا تصویری علامتیں ہیں جنہیں آپ ہر بار ویب سائٹ پر لاگ ان ہوتے ہیں تو کلک کرتے ہیں، جو ہر انٹرنیٹ صارف کے لیے بہت معلوم ہیں۔ لیکن جب آپ بار بار "میں روبوٹ نہیں ہوں" پر کلک کرتے ہیں، تو آپ سمجھتے ہیں کہ آپ صرف اپنا شناخت تصدیق کر رہے ہیں، جبکہ اصل میں آپ دنیا کے سب سے بڑے اور سب سے پوشیدہ ڈیٹا تخلیقی عمل میں شرکت کر رہے ہیں۔ لوئس فون اہن نے reCAPTCHA کو شروع کیا، جس نے منفرد انسانی سرگرمیوں کو گوگل اور اس کی متعلقہ خودکار گاڑیوں کی کمپنی Waymo جیسے مرکزی کاروباروں کے لیے ڈیٹا کی بنیاد بنانے کے لیے جمع کیا۔

"مفت" اور "محفوظ" کے ظاہری جھوٹ کے نیچے، انٹرنیٹ ایک نئی مزدوری کے تعلق کو دوبارہ شکل دے رہا ہے: آپ اپنے آپ کو انسان ثابت کرنے کے لیے وقت صرف کرتے ہیں، لیکن AI کی تربیت میں اپنا حصہ ڈالتے ہیں، اور جب AI سیکھ جاتا ہے تو یہ مزدوری مکمل طور پر بدل جاتی ہے۔ یہ مضمون جاری ہونے کے صرف 20 گھنٹوں میں ٹویٹر پر 950 لاکھ سے زیادہ بار دیکھا جا چکا ہے۔ درج ذیل اصل مواد ہے:

روزانہ تقریباً 500,000 گھنٹے کی انسانی مزدوری، گوگل کے ذریعہ مفت استعمال کی جاتی ہے۔ اور ان کا اہم ترین کارنامہ صرف بینک کی ویب سائٹ پر لاگ ان کرنا ہے۔

reCAPTCHA انٹرنیٹ کے تاریخ میں سب سے کامیاب پوشیدہ ڈیٹا آپریشن ہے۔ اس کے اعلیٰ نقطہ پر، روزانہ 200 ملین افراد نے تصدیق مکمل کی۔ لیکن تقریباً کوئی بھی نہیں جانتا کہ ہر کلک کے پیچھے کیا ہے۔

گوگل کی خودکار گاڑیوں کی کمپنی Waymo، جس کی موجودہ قیمت 45 ارب ڈالر ہے، اس کا زیادہ تر مرکزی تربیتی ڈیٹا آپ کے مختلف ویب سائٹس پر جانے کے دوران مفت طور پر فراہم کردہ ڈیٹا ہے۔

یہ مکمل کہانی ہے：

نشان: ایک ذکی تصور

2000 میں، اسپیم روبوٹس انٹرنیٹ کو تباہ کر رہے تھے۔ فورمز بھر دیے جا رہے تھے، این بکس بھر گئے تھے، اور ویب سائٹس کو انسانوں اور مشینوں کے درمیان فرق کرنے کا طریقہ درکار تھا۔

کارنیگی میلون یونیورسٹی کے پروفیسر لوس وون اہن نے اس مسئلے کا حل نکالا۔ انہوں نے کیپچا (CAPTCHA) دریافت کیا: ایک ایسا مڑا ہوا متن جو صرف انسان ہی پڑھ سکتے ہیں، روبوٹ نہیں۔

لیکن ون اہن نے اس سے زیادہ دیکھا۔ لاکھوں لوگ اس چیلنج میں اپنا وقت ضائع کر رہے ہیں۔ اگر اس توانائی کو ایک ساتھ دو کاموں کے لیے استعمال کیا جا سکے؟

2007 میں، اس نے reCAPTCHA متعارف کرایا۔ اس کی عمدہ بات یہ ہے کہ یہ کسی بے ترتیب کوڈ نہیں دکھاتا، بلکہ دو الفاظ دکھاتا ہے۔ ایک تو سسٹم کو معلوم ہے، دوسرا ایک ایسا حقیقی سکین شدہ کتاب کا لفظ ہے جسے کمپیوٹر ابھی تک پہچان نہیں پایا۔ اور آپ کا جواب ان کتابوں کے ڈیجیٹلائزیشن میں مدد کرتا ہے۔

یہ کتابیں نیو یارک ٹائمز کے آرکائیو اور گوگل بکس سے ہیں، جن کی تعداد 130 ملین تک ہے۔

آپ سوچ رہے ہیں کہ آپ صرف ایک عام ویب سائٹ پر لاگ ان ہو رہے ہیں، جبکہ آپ دنیا کی سب سے بڑی ڈیجیٹل لائبریری کے لیے OCR (آپٹیکل کریکٹر ریکگنیشن) کر رہے ہیں۔

2009 میں، گوگل نے reCAPTCHA کو خرید لیا۔

بعد میں، گوگل نے کھیل بدل دیا

بگڑے ہوئے حروف کا دور تقریباً 2012 میں ختم ہو گیا۔

گوگل کو دوبارہ نیا چیلنج کا سامنا ہے: اسٹریٹ ویو گاڑیاں دنیا بھر کی ہر سڑک کی تصاویر لے چکی ہیں، لیکن تصاویر صرف ابتدائی ڈیٹا ہیں۔ AI کو کام کرنے کے لیے، اسے اپنے دیکھے گئے اشیاء کو سمجھنا ہوگا: راستہ نشان، زیبرا کراسنگ، رنگین چراغ، دکانوں کے منظر۔

تو گوگل نے reCAPTCHA v2 کو دوبارہ ڈیزائن کیا۔ اب اس میں تحریف شدہ حروف نہیں بلکہ فوٹو گرڈ ہیں۔ “سب سگنلز والے مربعز پر کلک کریں۔” “ہر زیبرا کراسنگ کو منتخب کریں۔” “دکانوں کو شناخت کریں۔”

یہ تصاویر گوگل اسٹریٹ ویو سے براہ راست حاصل کی گئی ہیں۔ آپ کا کلک ہی لیبل ہے۔

ہر انتخاب گوگل کے کمپیوٹر ویژن ماڈل کو یہ بتا رہا ہے کہ یہ پکسلز کا گروپ سگنل ہے، اور یہ شکل زیبرا کراسنگ ہے۔ آپ ٹیسٹ دے رہے نہیں ہیں، آپ ڈیٹا سیٹ تعمیر کر رہے ہیں۔

تخیل سے بھی زیادہ بڑا پیمانہ

اپنے اوج پر، روزانہ 200 ملین reCAPTCHA حل کیے جاتے تھے۔ ہر چیلنج 10 سیکنڈ کا ہوتا ہے، جس سے روزانہ 2 ارب سیکنڈ کی انسانی مزدوری پیدا ہوتی ہے۔ یعنی: روزانہ 500,000 گھنٹے۔

مفت طور پر حاصل کی جانے والی مزدوری کی قیمت، کم سے کم معیار کے مطابق، روزانہ 5 ملین امریکی ڈالر تک ہو سکتی ہے۔

اور reCAPTCHA صرف کسی ایک ایپ میں محدود نہیں ہے۔ یہ ہر بینک، ہر حکومتی پورٹل، اور ہر الیکٹرانک کمرشل ویب سائٹ پر پایا جاتا ہے۔ آپ کے پاس کوئی انتخاب نہیں: کیا آپ اپنا اکاؤنٹ لاگ ان کرنا چاہتے ہیں؟ پہلے ڈیٹا سیٹ کو لیبل کریں۔ گوگل نے کبھی آپ کی رائے نہیں مانگی، کبھی آپ کو ایک بھی پیسہ تنخواہ نہیں دی، اور نہ ہی آپ کو اس بات کے بارے میں بتایا۔

یہ سب کیا بناتا ہے؟

یہ ڈیٹا دونوں پروڈکٹس کو براہ راست فراہم کیا گیا ہے:

- گوگل میپس: دنیا کا سب سے زیادہ استعمال ہونے والا نیویگیشن ٹول۔ اس کی سڑک کے بورڈ، دکانوں اور شہری جغرافیہ کی شناخت کی صلاحیت، لاکھوں افراد کی ویب سائٹ پر لاگ ان ہونے پر کیے گئے تبصرے کی وجہ سے ہے۔

-waymo: گوگل کا خودکار گاڑی کا منصوبہ۔ محفوظ نیویگیشن کے لیے، خودکار گاڑیوں کو ہزاروں بصری نمونوں کو تقریباً مکمل طور پر پہچاننا ہوگا۔

وہ سچائی کے تربیتی ڈیٹا جو ان کاموں کی شناخت کرتے ہیں، سینکڑوں ملین لوگوں نے reCAPTCHA کے ذریعے غیر جانبدارانہ طور پر لیبل کیے تھے۔ ویمو نے 2024 میں 4 ملین سے زیادہ ادائیگی والے سفر مکمل کیے اور اس کی قیمت 45 ارب ڈالر ہے۔ اس کی بنیاد، وہی "مفت انٹرنیٹ صارفین" نے رکھی جنہوں نے صرف اپنا ای میل چیک کرنا تھا۔

کیوں کوئی بھی اس ماڈل کو نقل نہیں کر سکتا؟

ڈیٹا لیبلنگ بہت مہنگی ہوتی ہے۔ Scale AI، Appen اور Labelbox جیسی کمپنیاں اس مسئلے کو حل کرنے کے لیے وجود رکھتی ہیں، جو لاکھوں مزدوروں کو ملازمت دیتی ہیں، جن کی گھنٹے کی تنخواہ کبھی کبھی ایک ڈالر سے کم ہوتی ہے۔

گوگل کا حل الگ تھلا ہے: انہوں نے اینٹیگنگ کو اجباری بنادیا۔ ادائیگی کی ضرورت نہیں، رضامندی کی ضرورت نہیں، بلکہ انٹرنیٹ کے ہر کونے تک پہنچنے کی "ٹکٹ" کے طور پر۔ نتیجہ: اربوں لیبل والی تصاویر، عالمی کوریج، 24/7 موسم، دنیا کے ہر شہر۔ کوئی بھی اینٹیگنگ کمپنی اسے حاصل نہیں کرسکتی۔ انٹرنیٹ خود ایک فیکٹری ہے، اور ہر انٹرنیٹ صارف ایک معاہدہ نہیں کرنے والا ملازم ہے۔

آپ اب بھی شریک ہیں

2018 میں متعارف کرائے گئے reCAPTCHA v3 میں چیلنجز نہیں دکھائے جاتے۔ یہ آپ کے ماؤس کو حرکت دینے کے طریقے، اسکرول کرنے کی رفتار، اور رکنے کے وقت کا مشاہدہ کرتا ہے۔ آپ کا رویہ فنگرپرنٹ اسے بتاتا ہے کہ آپ انسان ہیں یا نہیں۔ یہ رویہ کے ڈیٹا کو گوگل کے AI سسٹم میں بھی واپس بھیجا جاتا ہے۔

آپ نے کبھی خود بخود شمولیت کا انتخاب نہیں کیا، کبھی کوئی چیک باکس آپ کے لیے دستیاب نہیں تھا۔ لیکن اب، آپ جن بھی ویب سائٹس پر جا رہے ہیں، آپ اب بھی یہی کر رہے ہیں۔

پریشان کن مزاح

لوئس فون اہن کا اصل مقصد عقلمندانہ تھا: انسانوں کی وہ بے کار صرف ہونے والی توانائی جو مفید پیداوار میں تبدیل ہو جائے۔ لیکن گوگل نے اس خیال کو استعمال کرنے کا طریقہ الگ تھا۔ انہوں نے صارفین کو استعمال کرنے پر مجبور کیے جانے والے سیکورٹی میکانزم کو پورے ویب پر لاگو کیا، اور اس سے سوداگرانہ مصنوعات تعمیر کی جس کی قیمت سو ارب ڈالر سے زائد ہے۔ صارفین کو کچھ نہیں ملا، بلکہ انہیں اس بات کا بھی علم نہیں ہوا۔

سب سے بڑی مزاحیہ بات یہ ہے کہ آپ نے کئی سال تک اپنے آپ کو انسان ثابت کرنے کے لیے وقت صرف کیا، جبکہ AI ابھی تک ویژل ریکگنیشن کام نہیں کر سکتا تھا۔ لیکن جب AI نے ان چیزوں کو سیکھ لیا، تو انسانوں کی ویژل اینوٹیشن کی ضرورت ختم ہو گئی۔

آپ نے ثابت کیا کہ آپ انسان ہیں، لیکن اس کا نتیجہ یہ ہوا کہ آپ قابلِ تبدیلی بن گئے۔

اصل لنک

لیو دونگ BlockBeats کے خالی پوسٹس جاننے کے لیے کلک کریں

لیکٹ میشن BlockBeats کے آفیشل سوشل گروپ میں شامل ہوں:

ٹیلیگرام سبسکرائپ گروپ：https://t.me/theblockbeats

ٹیلیگرام گروپ：https://t.me/BlockBeats_App

ٹویٹر کا باقاعدہ اکاؤنٹ：https://twitter.com/BlockBeatsAsia