صارفین نے 15 سال تک CAPTCHA کے ذریعے گوگل کے AI کو بے خبری سے ٹرین کیا

iconBlockbeats
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
AI اور کرپٹو خبروں کے مطابق، مقبول CAPTCHA سسٹم reCAPTCHA نے 15 سال سے زیادہ عرصہ تک گوگل کے AI کو تربیت دی ہے۔ صارفین نے CAPTCHA چیلنجز مکمل کرکے گوگل میپس اور وائمو کے لیے غیر جانبدارانہ طور پر ڈیٹا لیبل کیا۔ اس کے اعلیٰ نقطہ پر، یہ سسٹم روزانہ 200 ملین سیکنڈ انسانی محنت جمع کرتا تھا — 500,000 گھنٹے — بنا کسی معاوضے کے۔ سود کے اعداد و شمار اور AI کی ترقیات مسلسل ٹیک اور کرپٹو منظر کو شکل دے رہے ہیں۔
آپ نے 15 سال تک گوگل کے AI کو تربیت دی ہے۔ آپ کو پتہ نہیں تھا۔
ماخذ: شربل، انفنجٹیبل کے مشترکہ بانی
لیلا، بلاکبیٹس


ایڈیٹورز نوٹ: کیپچا (CAPTCHA) وہ ڈیجیٹل یا تصویری علامتیں ہیں جنہیں آپ ہر بار ویب سائٹ پر لاگ ان ہوتے ہیں تو کلک کرتے ہیں، جو ہر انٹرنیٹ صارف کے لیے بہت معلوم ہیں۔ لیکن جب آپ بار بار "میں روبوٹ نہیں ہوں" پر کلک کرتے ہیں، تو آپ سمجھتے ہیں کہ آپ صرف اپنا شناخت تصدیق کر رہے ہیں، جبکہ اصل میں آپ دنیا کے سب سے بڑے اور سب سے پوشیدہ ڈیٹا تخلیقی عمل میں شرکت کر رہے ہیں۔ لوئس فون اہن نے reCAPTCHA کو شروع کیا، جس نے منفرد انسانی سرگرمیوں کو گوگل اور اس کی متعلقہ خودکار گاڑیوں کی کمپنی Waymo جیسے مرکزی کاروباروں کے لیے ڈیٹا کی بنیاد بنانے کے لیے جمع کیا۔


"مفت" اور "محفوظ" کے ظاہری جھوٹ کے نیچے، انٹرنیٹ ایک نئی مزدوری کے تعلق کو دوبارہ شکل دے رہا ہے: آپ اپنے آپ کو انسان ثابت کرنے کے لیے وقت صرف کرتے ہیں، لیکن AI کی تربیت میں اپنا حصہ ڈالتے ہیں، اور جب AI سیکھ جاتا ہے تو یہ مزدوری مکمل طور پر بدل جاتی ہے۔ یہ مضمون جاری ہونے کے صرف 20 گھنٹوں میں ٹویٹر پر 950 لاکھ سے زیادہ بار دیکھا جا چکا ہے۔ درج ذیل اصل مواد ہے:


روزانہ تقریباً 500,000 گھنٹے کی انسانی مزدوری، گوگل کے ذریعہ مفت استعمال کی جاتی ہے۔ اور ان کا اہم ترین کارنامہ صرف بینک کی ویب سائٹ پر لاگ ان کرنا ہے۔


reCAPTCHA انٹرنیٹ کے تاریخ میں سب سے کامیاب پوشیدہ ڈیٹا آپریشن ہے۔ اس کے اعلیٰ نقطہ پر، روزانہ 200 ملین افراد نے تصدیق مکمل کی۔ لیکن تقریباً کوئی بھی نہیں جانتا کہ ہر کلک کے پیچھے کیا ہے۔


گوگل کی خودکار گاڑیوں کی کمپنی Waymo، جس کی موجودہ قیمت 45 ارب ڈالر ہے، اس کا زیادہ تر مرکزی تربیتی ڈیٹا آپ کے مختلف ویب سائٹس پر جانے کے دوران مفت طور پر فراہم کردہ ڈیٹا ہے۔


یہ مکمل کہانی ہے:


نشان: ایک ذکی تصور


2000 میں، اسپیم روبوٹس انٹرنیٹ کو تباہ کر رہے تھے۔ فورمز بھر دیے جا رہے تھے، این بکس بھر گئے تھے، اور ویب سائٹس کو انسانوں اور مشینوں کے درمیان فرق کرنے کا طریقہ درکار تھا۔


کارنیگی میلون یونیورسٹی کے پروفیسر لوس وون اہن نے اس مسئلے کا حل نکالا۔ انہوں نے کیپچا (CAPTCHA) دریافت کیا: ایک ایسا مڑا ہوا متن جو صرف انسان ہی پڑھ سکتے ہیں، روبوٹ نہیں۔


لیکن ون اہن نے اس سے زیادہ دیکھا۔ لاکھوں لوگ اس چیلنج میں اپنا وقت ضائع کر رہے ہیں۔ اگر اس توانائی کو ایک ساتھ دو کاموں کے لیے استعمال کیا جا سکے؟


2007 میں، اس نے reCAPTCHA متعارف کرایا۔ اس کی عمدہ بات یہ ہے کہ یہ کسی بے ترتیب کوڈ نہیں دکھاتا، بلکہ دو الفاظ دکھاتا ہے۔ ایک تو سسٹم کو معلوم ہے، دوسرا ایک ایسا حقیقی سکین شدہ کتاب کا لفظ ہے جسے کمپیوٹر ابھی تک پہچان نہیں پایا۔ اور آپ کا جواب ان کتابوں کے ڈیجیٹلائزیشن میں مدد کرتا ہے۔


یہ کتابیں نیو یارک ٹائمز کے آرکائیو اور گوگل بکس سے ہیں، جن کی تعداد 130 ملین تک ہے۔


آپ سوچ رہے ہیں کہ آپ صرف ایک عام ویب سائٹ پر لاگ ان ہو رہے ہیں، جبکہ آپ دنیا کی سب سے بڑی ڈیجیٹل لائبریری کے لیے OCR (آپٹیکل کریکٹر ریکگنیشن) کر رہے ہیں۔


2009 میں، گوگل نے reCAPTCHA کو خرید لیا۔



بعد میں، گوگل نے کھیل بدل دیا


بگڑے ہوئے حروف کا دور تقریباً 2012 میں ختم ہو گیا۔


گوگل کو دوبارہ نیا چیلنج کا سامنا ہے: اسٹریٹ ویو گاڑیاں دنیا بھر کی ہر سڑک کی تصاویر لے چکی ہیں، لیکن تصاویر صرف ابتدائی ڈیٹا ہیں۔ AI کو کام کرنے کے لیے، اسے اپنے دیکھے گئے اشیاء کو سمجھنا ہوگا: راستہ نشان، زیبرا کراسنگ، رنگین چراغ، دکانوں کے منظر۔


تو گوگل نے reCAPTCHA v2 کو دوبارہ ڈیزائن کیا۔ اب اس میں تحریف شدہ حروف نہیں بلکہ فوٹو گرڈ ہیں۔ “سب سگنلز والے مربعز پر کلک کریں۔” “ہر زیبرا کراسنگ کو منتخب کریں۔” “دکانوں کو شناخت کریں۔”


یہ تصاویر گوگل اسٹریٹ ویو سے براہ راست حاصل کی گئی ہیں۔ آپ کا کلک ہی لیبل ہے۔


ہر انتخاب گوگل کے کمپیوٹر ویژن ماڈل کو یہ بتا رہا ہے کہ یہ پکسلز کا گروپ سگنل ہے، اور یہ شکل زیبرا کراسنگ ہے۔ آپ ٹیسٹ دے رہے نہیں ہیں، آپ ڈیٹا سیٹ تعمیر کر رہے ہیں۔



تخیل سے بھی زیادہ بڑا پیمانہ


اپنے اوج پر، روزانہ 200 ملین reCAPTCHA حل کیے جاتے تھے۔ ہر چیلنج 10 سیکنڈ کا ہوتا ہے، جس سے روزانہ 2 ارب سیکنڈ کی انسانی مزدوری پیدا ہوتی ہے۔ یعنی: روزانہ 500,000 گھنٹے۔


مفت طور پر حاصل کی جانے والی مزدوری کی قیمت، کم سے کم معیار کے مطابق، روزانہ 5 ملین امریکی ڈالر تک ہو سکتی ہے۔


اور reCAPTCHA صرف کسی ایک ایپ میں محدود نہیں ہے۔ یہ ہر بینک، ہر حکومتی پورٹل، اور ہر الیکٹرانک کمرشل ویب سائٹ پر پایا جاتا ہے۔ آپ کے پاس کوئی انتخاب نہیں: کیا آپ اپنا اکاؤنٹ لاگ ان کرنا چاہتے ہیں؟ پہلے ڈیٹا سیٹ کو لیبل کریں۔ گوگل نے کبھی آپ کی رائے نہیں مانگی، کبھی آپ کو ایک بھی پیسہ تنخواہ نہیں دی، اور نہ ہی آپ کو اس بات کے بارے میں بتایا۔



یہ سب کیا بناتا ہے؟


یہ ڈیٹا دونوں پروڈکٹس کو براہ راست فراہم کیا گیا ہے:


- گوگل میپس: دنیا کا سب سے زیادہ استعمال ہونے والا نیویگیشن ٹول۔ اس کی سڑک کے بورڈ، دکانوں اور شہری جغرافیہ کی شناخت کی صلاحیت، لاکھوں افراد کی ویب سائٹ پر لاگ ان ہونے پر کیے گئے تبصرے کی وجہ سے ہے۔


-waymo: گوگل کا خودکار گاڑی کا منصوبہ۔ محفوظ نیویگیشن کے لیے، خودکار گاڑیوں کو ہزاروں بصری نمونوں کو تقریباً مکمل طور پر پہچاننا ہوگا۔


وہ سچائی کے تربیتی ڈیٹا جو ان کاموں کی شناخت کرتے ہیں، سینکڑوں ملین لوگوں نے reCAPTCHA کے ذریعے غیر جانبدارانہ طور پر لیبل کیے تھے۔ ویمو نے 2024 میں 4 ملین سے زیادہ ادائیگی والے سفر مکمل کیے اور اس کی قیمت 45 ارب ڈالر ہے۔ اس کی بنیاد، وہی "مفت انٹرنیٹ صارفین" نے رکھی جنہوں نے صرف اپنا ای میل چیک کرنا تھا۔


کیوں کوئی بھی اس ماڈل کو نقل نہیں کر سکتا؟


ڈیٹا لیبلنگ بہت مہنگی ہوتی ہے۔ Scale AI، Appen اور Labelbox جیسی کمپنیاں اس مسئلے کو حل کرنے کے لیے وجود رکھتی ہیں، جو لاکھوں مزدوروں کو ملازمت دیتی ہیں، جن کی گھنٹے کی تنخواہ کبھی کبھی ایک ڈالر سے کم ہوتی ہے۔


گوگل کا حل الگ تھلا ہے: انہوں نے اینٹیگنگ کو اجباری بنادیا۔ ادائیگی کی ضرورت نہیں، رضامندی کی ضرورت نہیں، بلکہ انٹرنیٹ کے ہر کونے تک پہنچنے کی "ٹکٹ" کے طور پر۔ نتیجہ: اربوں لیبل والی تصاویر، عالمی کوریج، 24/7 موسم، دنیا کے ہر شہر۔ کوئی بھی اینٹیگنگ کمپنی اسے حاصل نہیں کرسکتی۔ انٹرنیٹ خود ایک فیکٹری ہے، اور ہر انٹرنیٹ صارف ایک معاہدہ نہیں کرنے والا ملازم ہے۔



آپ اب بھی شریک ہیں


2018 میں متعارف کرائے گئے reCAPTCHA v3 میں چیلنجز نہیں دکھائے جاتے۔ یہ آپ کے ماؤس کو حرکت دینے کے طریقے، اسکرول کرنے کی رفتار، اور رکنے کے وقت کا مشاہدہ کرتا ہے۔ آپ کا رویہ فنگرپرنٹ اسے بتاتا ہے کہ آپ انسان ہیں یا نہیں۔ یہ رویہ کے ڈیٹا کو گوگل کے AI سسٹم میں بھی واپس بھیجا جاتا ہے۔


آپ نے کبھی خود بخود شمولیت کا انتخاب نہیں کیا، کبھی کوئی چیک باکس آپ کے لیے دستیاب نہیں تھا۔ لیکن اب، آپ جن بھی ویب سائٹس پر جا رہے ہیں، آپ اب بھی یہی کر رہے ہیں۔


پریشان کن مزاح


لوئس فون اہن کا اصل مقصد عقلمندانہ تھا: انسانوں کی وہ بے کار صرف ہونے والی توانائی جو مفید پیداوار میں تبدیل ہو جائے۔ لیکن گوگل نے اس خیال کو استعمال کرنے کا طریقہ الگ تھا۔ انہوں نے صارفین کو استعمال کرنے پر مجبور کیے جانے والے سیکورٹی میکانزم کو پورے ویب پر لاگو کیا، اور اس سے سوداگرانہ مصنوعات تعمیر کی جس کی قیمت سو ارب ڈالر سے زائد ہے۔ صارفین کو کچھ نہیں ملا، بلکہ انہیں اس بات کا بھی علم نہیں ہوا۔


سب سے بڑی مزاحیہ بات یہ ہے کہ آپ نے کئی سال تک اپنے آپ کو انسان ثابت کرنے کے لیے وقت صرف کیا، جبکہ AI ابھی تک ویژل ریکگنیشن کام نہیں کر سکتا تھا۔ لیکن جب AI نے ان چیزوں کو سیکھ لیا، تو انسانوں کی ویژل اینوٹیشن کی ضرورت ختم ہو گئی۔


آپ نے ثابت کیا کہ آپ انسان ہیں، لیکن اس کا نتیجہ یہ ہوا کہ آپ قابلِ تبدیلی بن گئے۔


اصل لنک


لیو دونگ BlockBeats کے خالی پوسٹس جاننے کے لیے کلک کریں


لیکٹ میشن BlockBeats کے آفیشل سوشل گروپ میں شامل ہوں:

ٹیلیگرام سبسکرائپ گروپ:https://t.me/theblockbeats

ٹیلیگرام گروپ:https://t.me/BlockBeats_App

ٹویٹر کا باقاعدہ اکاؤنٹ:https://twitter.com/BlockBeatsAsia

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔