ٹمنٹ گیبرو کا 2020 کا مقالہ اب واقعی ہونے والے بڑے AI خطرات کا پیشن گوئی کر چکا ہے

اگر آپ وقت کو 2020 میں واپس لے جائیں، تو زیادہ تر AI پیشہ وران GPT-3 کی طاقت کے بارے میں بات کر رہے تھے۔

اس وقت، جنریٹو AI عالمی سطح پر توجہ کا مرکز نہیں بن چکا تھا، ChatGPT ابھی دو سال باقی تھے کہ شائع ہو، اور بڑے ماڈلز نے اب تک عالمی سطح پر سرمایہ کاری کی لہر نہیں اٹھائی تھی۔ لیکن اسی سال، ایک گوگل کے بہترین AI ریسرچر نے ایک ابھی تک شائع نہ ہونے والی تحقیقی تحریر کے باعث کمپنی کے ساتھ شدید تنازعہ کیا اور آخرکار اپنا کام کھو دیا۔

اس وقت بہت سے لوگوں کو لگا کہ یہ صرف سلیکون ویلی کی ایک اور تنازعہ تھی جس میں کام کے ماحول کا انتظام، علمی شائع کرنا اور کاروباری ثقافت شامل تھی؛ لیکن آج جب ہم پیچھے مڑ کر دیکھتے ہیں، تو ہمیں احساس ہوتا ہے کہ اس تحقیقی مقالے میں دی گئی چेतاؤں میں سے تقریباً تمام باتیں حقیقی دنیا میں سچ ثابت ہو چکی ہیں۔

جس تحقیقی محقق کو برطرف کیا گیا، وہ AI اخلاقیات کے شعبے کے سب سے زیادہ اثررساں شخصیات میں سے ایک تھی—ٹم نٹ گیبرو۔

ای آئی اخلاقیات

ای آئی کے دائرے میں ایک ہلچل پیدا کرنے والا "بے نقاب کرنا"

دسمبر 2020 میں، تمنیٹ گیبرو نے سوشل میڈیا پر اعلان کیا کہ انہیں گوگل نے بے نقاب کر دیا ہے۔

یہ خبر فوراً AI تحقیقی دنیا میں دھوم مچا گئی۔ کیونکہ اس وقت جیبرو صرف ایک عام محقق نہیں تھیں، بلکہ گوگل کے اخلاقی AI ٹیم کی ملکہ معاون اور AI کے انصاف اور الگورتھمک جانبداری کے شعبے کی عالمی سطح کی مشہور ماہر تھیں۔

ایتھوپیا میں پیدا ہونے والی گیبرو نے AI میں نسلی جھکاؤ، جنسی تعصب اور سماجی انصاف کے مسائل پر طویل عرصے تک توجہ دی۔ گوگل میں شمولیت سے پہلے، وہ اسٹینفورڈ یونیورسٹی میں تحقیق کر چکی تھیں۔ 2018 میں، ان کے شریک مصنفین کے ساتھ شائع کی گئی ایک تحقیق جس میں الگورتھمک جھکاؤ پر بات کی گئی، کو AI کی انصاف کے شعبے میں ایک اہم موڑ سمجھا جاتا ہے۔ اسی سال، گوگل نے انہیں اپنی ٹیم میں شامل کیا اور اپنی “ذمہ دار AI (Responsible AI)” کے لیے عزم کو عوامی طور پر دکھایا۔

تاہم صرف دو سال بعد، دونوں طرفوں کے درمیان جھگڑا ہو گیا۔

اس وقت، گوگل نے عوام کو یہ بات بتائی کہ جیبرو نے خود استعفیٰ دے دیا، لیکن جیبرو نے اپنا مکمل طور پر الگ ورژن پیش کیا: انہوں نے کہا کہ انہیں اجازت پر ہونے کے دوران ایک ای میل موصول ہوئی جس میں انہیں اطلاع دی گئی کہ ان کی ملازمت فوراً ختم ہو چکی ہے اور ان کے تمام اندر کے سسٹم کے اختیارات اور ای میل تک رسائی بند کر دی گئی ہے۔

اس کے لیے، یہ بے شک ایک برطرفی تھی۔

اس کے بعد، زیادہ سے زیادہ 4000 گوگل ملازمین اور صنعت کے ماہرین نے ایک علیحدہ خط پر دستخط کر کے کمپنی کے طریقہ کار کو چیلنج کیا اور جیبرو کو اپنی ملازمت واپس دینے کا مطالبہ کیا — اور یہ سب کچھ صرف 14 صفحات کی اکادمیک تحریر کی وجہ سے ہوا۔

ایک 14 صفحات کی تحقیقی تقریر پر اختلاف ہوا

اس تحقیقی مقالے کا عنوان "On the Dangers of Stochastic Parrots" ہے، جس کے مصنفین میں تمنٹ گیبرو، واشنگٹن یونیورسٹی کی زبانیات کی پروفیسر ایمیلی بینڈر، اور دو اور تحقیق کار شامل ہیں، جس کی اب تک 14,000 سے زیادہ بار حوالہ دیا جا چکا ہے۔

بعد میں، "تصادفی طوطا" کا نام بھی عام ہو گیا۔ (پیپر کا لنک: https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf)

论文中指出，大型语言模型本质上是在统计规律基础上复现语言模式：它们能够生成流畅、自然甚至富有逻辑的文本，却并不真正理解语言的含义——就像一只学会模仿人类说话的鹦鹉，看似聪明，实则这种模仿只是建立在海量互联网文本之上。而互联网本身充满了偏见、歧视和仇恨内容。因此，大模型极有可能将这些问题一并学习进去，并在生成内容时继续放大。

یاد رکھیں، یہ 2020 کی بات ہے، جب GPT-3 کا صرف آغاز ہوا تھا، ChatGPT ابھی وجود میں نہیں آیا تھا، اور بڑے ماڈلز کی لہر بھی ابھی شروع نہیں ہوئی تھی، اور پھر بھی اس تحقیقی مقالے نے آج کے صنعت کے سب سے بڑے مسائل میں سے ایک کا پہلے ہی پیش گوئی کر دی تھی۔

جب یہ تحقیقی مقالہ ایک ٹاپ AI اخلاقیات کانفرنس کے لیے جمع کرایا گیا، تو گوگل کے مینجمنٹ نے مطالبہ کیا کہ مقالہ واپس لے لیا جائے یا گوگل کے تحقیقی محققین کے نام حذف کر دیے جائیں۔ جیبرو نے اس سے انکار کر دیا اور انہوں نے کمپنی سے واضح وجوہات مانگیں اور دونوں طرف سے مزید بحث کا تقاضا کیا۔

اسی دوران، اس نے گوگل کے اندر کے ملازمین کے گروپ کو ایک شدید الفاظ میں لکھی ہوئی ای میل بھی بھیجی۔

ایمیل میں، گیبرو نے گوگل کو اقلیتوں کی بھرتی کو فروغ دینے اور اندر کی عدم مساوات کو حل کرنے میں عملی اقدامات کی کمی پر تنقید کی۔ اس نے لکھا: "جب آپ متاثرہ گروہوں کے لیے آواز اٹھانے لگتے ہیں، تو آپ کی صورتحال بدتر ہوتی جاتی ہے۔ آپ دیگر لیڈرشپ کو ناراحت کر دیتے ہیں۔" اس نے مزید کہا کہ اگر کمپنی ہمیشہ یہ وضاحت نہ کر سکے کہ پیپر کو کیوں واپس لیا گیا، تو وہ مناسب وقت پر استعفیٰ دے دے گی۔

واقعہ اس کی توقع سے کہیں زیادہ آگے بڑھ گیا۔ گوگل نے جواب دیا کہ وہ اس کی درخواست پر عمل نہیں کرے گا اور اس کی “استعفیٰ” کو فوری طور پر قبول کر لیا، جس کے بعد اس کے تمام ایکسس_rights فوراً منسوخ کر دیے گئے۔

اس وقت، یہ واقعہ عالمی AI شعبے کے سب سے زیادہ تنازعاتی موضوعوں میں سے ایک بن گیا۔

جو خیالات پہلے زبردست لگتے تھے، اب وہ حقیقت بن چکے ہیں

اس واقعے کو اب تک بحث کا موضوع بنانے والا، ملازمت ختم کرنے کا امر نہیں بلکہ اس تحریر میں شامل مضامین تھے — کیونکہ آج پیچھے مڑ کر دیکھیں تو، اس میں پیش کی گئی تقریباً ہر فکر، AI صنعت کے لیے موجودہ حقیقی مسائل بن چکی ہیں۔

(1) پہلا ایلرٹ: ماڈل "بے ترتیب باتیں" کرے گا

2020 میں، GPT-3 کا اطلاق ہوا۔ اس وقت لوگ ماڈل کی متن تخلیق کرنے کی صلاحیت پر حیران تھے، لیکن اس کی قابلیت پر کم لوگوں نے سنجیدہ بحث کی۔

گیو اور بنڈر نے واضح کیا کہ جیسے جیسے ماڈل کا سائز بڑھتا جائے گا، لوگ مسلسل بیان کو حقیقی سمجھ کے طور پر سمجھنے لگیں گے۔ ماڈل اس طرح لگ رہا ہے جیسے وہ سوچ رہا ہو، جبکہ وہ صرف اگلے سب سے زیادہ امکانی الفاظ کا تخمینہ لگا رہا ہے، اس لیے وہ جلد ہی ایسی معلومات پیدا کریں گے جو منطقی لگیں لیکن بالکل غلط ہوں۔

اور آج، اس مسئلے کا ایک ایسا نام ہے جو سب کو معلوم ہے: AI ہالوسینیشن (Hallucination)۔ چاہے ChatGPT، Gemini، Claude یا کوئی اور جدید ماڈل ہو، ہالوسینیشن کا مسئلہ اب تک مکمل طور پر حل نہیں ہوا ہے۔

کسی نہ کسی طرح، یہ تحقیقی مقالہ اس سے پہلے کہ "ہالوسینیشن" صنعت کا مقبول لفظ بن جائے، اسے درست طور پر پیش گوئی کر چکا تھا۔

(2) دوسری انتباہ: رویہ ختم نہیں ہوگا، بلکہ بڑھ جائے گا

مطالعہ میں یہ بھی کہا گیا ہے کہ انٹرنیٹ خود ایک ناپسندیدہ ڈیٹا کا ذریعہ نہیں ہے، اور تربیتی ڈیٹا میں قومی، جنسی، ثقافتی اور علاقائی رجحانات خود بخود شامل ہوتے ہیں۔ ماڈل صرف ان رجحانات کو سیکھتا ہے بلکہ انہیں بہتر بنانے کے لیے آپٹیمائزیشن مکینزمز کی وجہ سے انہیں مزید مضبوط بھی بناتا ہے۔

بعد میں، مختلف عملی مسائل نے اس خدشے کی تصدیق کی:

ایمیزون نے کبھی AI کا استعمال کرکے ملازمت کے اپلیکیشنز کا انتخاب کرنے کی کوشش کی، جس کے نتیجے میں نظام خودبخود "women" جیسے کلیدی الفاظ والے ریزومیز کے اسکور کو کم کر دیتا تھا۔

امریکہ کے کئی بڑے اسپتالوں میں استعمال ہونے والے طبی خطرہ جائزہ لینے کے نظام کا پتہ چلا ہے کہ وہ کالے رنگ کے مریضوں کی طبی ضروریات کو لمبے عرصے تک کم اندازہ کرتے رہے ہیں۔

ایپل کارڈ کو بھی خواتین کو مردوں کے مقابلے میں کم سرحدی رقم دینے کی وجہ سے نگرانی کا نشانہ بنایا گیا تھا۔

یہ تمام معاملات یہ ظاہر کرتے ہیں کہ الگورتھم نے خودبخود انصاف حاصل نہیں کیا، بلکہ اس نے امکانات کو ایک زیادہ پوشیدہ طریقے سے حقیقی دنیا کی عدم مساوات کو مستحکم کر دیا ہے۔

(3) تیسری انتباہ: AI کی توانائی کی استعمال نئی مسئلہ بن جائے گی

2020 میں، کمپوٹیشنل کیمپ کی لاگت آج کی طرح زیادہ توجہ نہیں لے رہی تھی، لیکن وہ مقالہ پہلے ہی بہت بڑے ماڈلز کے تربیت سے ہونے والے ماحولیاتی اثرات پر بحث کر رہا تھا۔ تحقیق کرنے والوں کے مطابق، ایک بڑے زبانی ماڈل کو تربیت دینے سے نکلنے والے کاربن اخراجات، پانچ گاڑیوں کے پورے زندگی کے اخراجات کے برابر ہوتے ہیں — اس وقت، یہ دعویٰ کئی لوگوں کے لیے بہت مایوس کن سمجھا جاتا تھا۔

تاہم، جب AI بنیادی ڈھانچے کا مقابلہ جاری ہوا، تو مسائل فوراً سامنے آئے: گوگل کے علیحدہ شائع کردہ ڈیٹا کے مطابق، 2024 میں کمپنی کے گرینہاؤس گیس کے اخراجات 2019 کے مقابلے میں 48 فیصد بڑھ گئے؛ جبکہ مائیکروسافٹ نے اسی دوران تقریباً 29 فیصد کا اضافہ کیا۔ دونوں کمپنیاں واضح طور پر کہتی ہیں کہ AI ڈیٹا سینٹر اور کمپوٹنگ انفراسٹرکچر اس کا اہم سبب ہیں۔

مزید مزاحیہ بات یہ ہے کہ یہ ٹیکنالوجی کے گیگنٹس کچھ سال پہلے کاربن نیوٹرالٹی کے اہداف کا بڑے پیمانے پر اعلان کر رہے تھے۔

(4) چوتھی انتباہ: کوئی بھی نہیں جانتا کہ تربیتی ڈیٹا میں کیا ہے

بہت سے لوگوں کے لیے، تربیتی ڈیٹا صرف ایک انجینئرنگ کا مسئلہ لگتا ہے۔ لیکن جیبرو کے خیال میں، جیسے ڈیٹا کا سائز بڑھتا جائے گا، تربیتی ڈیٹا کا مکمل جائزہ لینا تقریباً ناممکن ہو جائے گا۔

اس کا نقطہ نظر دوبارہ ثابت ہوا: 2023 میں، محققین نے پایا کہ LAION-5B نامی ڈیٹا سیٹ، جس کا استعمال تصویر جنریٹ کرنے والے ماڈلز کی تربیت کے لیے کیا جاتا ہے، میں بچوں کے ساتھ الزواج کی بہت سی تصاویر شامل ہیں، جس میں Stable Diffusion سمیت کئی مقبول ماڈلز شamil ہیں۔

کچھ نہیں، بہت سارے ڈیولپرز کو پہلے سے یہ معلوم نہیں تھا کہ یہ مواد موجود ہے۔ یعنی، مدل ڈیولپرز خود بھی شاید اس بات کو درست طور پر نہ جانتے ہوں کہ مدل کو کیا "کھلایا" جا رہا ہے—اور یہی اصل طور پر پیپر میں پہلی بار اٹھائے گئے سوالوں میں سے ایک تھا۔

(5) پانچواں انتباہ: انٹرنیٹ آہستہ آہستہ AI مواد سے مل جائے گا

گوگل کے لیے، یہ شاید پورے مقالے کا سب سے حساس حصہ ہے۔ گیوبی اور بینڈر کا خیال ہے کہ بڑے ماڈلز کی ترقی نہایت محدود سائنسی گیگنٹس کے ہاتھوں میں زبان اور ثقافت کی بات چیت کو مرکوز کر دے گی۔ وجہ بہت آسان ہے: بہت بڑے ماڈلز کو ٹرین کرنے کے لیے بہت زیادہ فنڈز، کمپوٹیشنل طاقت اور ڈیٹا وسائل کی ضرورت ہوتی ہے، اور واقعی مقابلہ کرنے کی صلاحیت رکھنے والی کمپنیاں بہت کم ہیں۔

دیر سے دیر تک، انٹرنیٹ میں معمولی آوازیں یہ بن جائیں گی کہ کچھ محدود کمپنیوں نے اپنے تربیتی ڈیٹا سے ایک اوسط حاصل کیا ہے اور پھر دنیا بھر میں “بے رخ مددگار” کے طور پر اسے فروغ دیا جائے گا۔ اس کے ساتھ ساتھ، تربیتی ڈیٹا میں کم نمائندگی والی زبانوں اور ثقافتوں کو مزید نظرانداز کر دیا جائے گا۔

مزید خطرناک بات یہ ہے کہ جب AI سے تخلیق کی گئی معلومات دوبارہ انٹرنیٹ پر آ جائیں اور اگلی تربیت کے لیے ڈیٹا بن جائیں، تو یہ مسئلہ خود کو بار بار تقویت دیتا ہے — جسے اب تحقیق کرنے والے "مڈل کراش" (Model Collapse) کہتے ہیں۔

2024 کے ایک مطالعہ میں پایا گیا کہ انگریزی انٹرنیٹ پر شامل ہونے والے نئے مواد کا تقریباً 57% AI یا AI کی مدد سے تخلیق کیا گیا ہے؛ جبکہ کم وسائل والی زبانوں پر کیے گئے مطالعات میں پایا گیا کہ تربیت کے ڈیٹا میں AI یا AI کی مدد سے تخلیق کیے گئے مواد کے بڑھتے ہوئے استعمال کی وجہ سے، کچھ زبانوں کی ترجمہ کی معیار میں واضح کمی آ چکی ہے۔

دوسروں کے الفاظ میں، یہ تحقیق نہ صرف "ماڈل کریش" کے ظہور کا پیشن گوئی کرتی ہے، بلکہ اس تصور کے باقاعدہ ظہور سے پہلے ہی اس کے تشکیل کے مکانیزم کو بھی نشان زد کرتی ہے۔

گوگل چھوڑنے کے بعد، وہ مزید تحقیق کرنے کا انتخاب کیا

واقعہ کے بعد، بہت سے لوگوں نے گیبرو کو "ای آئی کے خلاف" کے طور پر بیان کیا۔ لیکن ایسا نہیں تھا، وہ کبھی بھی ای آئی کے ترقی کو روکنے کا مطالبہ نہیں کرتی تھیں۔ اس نے ہمیشہ ایک اور بات پر سوال اٹھایا:

AI کے ترقی کے رخ کو کون طے کر رہا ہے؟

اس کے خیال میں، بڑے ماڈلز کی ترقی کو چلانے والے تحقیق کار اور مینجمنٹ کے پیچھے عام طور پر مشابہ پس منظر ہوتا ہے، جو مشابہ تجارتی مقاصد کے لیے کام کرتے ہیں اور ایک جیسے مقابلے کے دباؤ سے متاثر ہوتے ہیں۔ اس قسم کے انعامات کے نظام میں، محفوظ، منصفانہ اور اخلاقی مسائل کے مقابلے میں مصنوعات کو جلد سے جلد جاری کرنا، صارفین کی تعداد جلد سے جلد بڑھانا، اور بازار میں مقابلہ جلد سے جلد جیتنا زیادہ ترجیح رکھتا ہے۔

اور جو بھی اس عمل کو روکنے کی کوشش کرتے ہیں، انہیں رکاوٹ کے طور پر دیکھا جا سکتا ہے۔ مزاحیہ بات یہ ہے کہ جیبرو نے یہ خیال گوگل کے اندر ہی پیش کیا تھا، اور گوگل نے اسے بے نقاب کرکے اس خیال کو سب سے زیادہ ڈرامائی حقیقی نوٹ فراہم کیا۔

مزید اداس بات یہ ہے کہ واقعے کے فوراً بعد، دوسرے معاون ہدایتی AI ٹیم کے سربراہ مارگریٹ مچیل کو بھی برطرف کر دیا گیا — صرف 90 دن میں، گوگل کی وہ خودداری سے فخر کرنے والی اخلاقی AI ٹیم تقریباً ختم ہو چکی تھی۔

گوگل چھوڑنے کے بعد، 2021 میں جیبرو نے ڈسٹریبیوٹڈ AI ریسرچ انسٹی ٹیوٹ (DAIR) قائم کیا۔ بڑی ٹیک کمپنیوں کے برعکس، اس ادارے کا مقصد AI تحقیق کو تجارتی مفادات کے باہر کرنا ہے، اور اس کا مقصد بہت واضح ہے: ان مسائل پر تحقیق کرنا جن کا بڑی ٹیک کمپنیاں سامنا نہیں کرنا چاہتیں۔ پچھلے کچھ سالوں میں، DAIR نے ڈیٹا کے ذرائع، الگورتھمک انصاف، زبانی تنوع اور AI صنعت میں طاقت کا مرکزیکرنا جیسے موضوعات پر توجہ مرکوز رکھی ہے۔

ای آئی اخلاقیات

اور جبکہ جنریٹو AI کی تیزی سے ترقی کے ساتھ، زیادہ سے زیادہ محققین اب "خرد کے خطرناک مسائل" پر دوبارہ توجہ دے رہے ہیں: کیونکہ وہ پائے گئے کہ اس مضمون میں جن مسائل کو زیادہ فکر کا نتیجہ سمجھا جاتا تھا، وہ اب صنعت کی روزمرہ بحث کا حصہ بن چکے ہیں۔

شاید وہ صرف دیگر لوگوں سے زیادہ جلدی مسئلہ دیکھ پائی

چھ سال گزر گئے، لیکن تمنٹ گیبرو اور گوگل کے درمیان کے تنازعے کے بارے میں باہر کے لوگوں کے لیے شاید کبھی ایک ایسا جواب حاصل نہیں ہو سکے جسے سب متفق ہوں۔

گوگل کا خیال ہے کہ یہ ایک عام اکادمیک جائزہ اور استعفے کا واقعہ تھا؛ جبکہ گیوبی کا خیال ہے کہ اسے اپنے تحقیقی نتائج جاری رکھنے کی وجہ سے دبایا گیا۔ لیکن اب ایک بات آہستہ آہستہ انکار نہیں کی جا سکتی:

وہ مقالہ جس کی وجہ سے وہ گوگل چھوڑ گئی، تنازعے کے ختم ہونے کے باوجود اپنا مطلب نہیں کھو بھی۔

بالکل برعکس، جو خیالات، جہالت، ڈیٹا کی آلودگی، ماحولیاتی لاگت، ماڈل کا خراب ہونا اور طاقت کا مرکزیکرنا ہیں، وہ اب پورے AI صنعت کے لیے نظرانداز نہیں کیے جا سکنے والے موضوعات بن چکے ہیں۔

کبھی کبھی، تاریخ ایک غیر متوقع طریقے سے جائزہ دیتی ہے۔

2020 میں، بہت سے لوگوں کو لگا کہ تمنٹ گیبرو بہت مایوسی کی حامل ہیں؛

2026 میں، لوگوں نے احساس کیا کہ شاید وہ دوسرے لوگوں سے زیادہ جلدی مسئلے کو دیکھ پائی تھی۔

حوالہ جات: https://www.tumblr.com/dreaminginthedeepsouth/817865966907228160/darren-oconnor-timnit-gebru-was-fired-from

یہ مضمون ویچن گروپ "CSDN" سے ہے، ترتیب دیا گیا: زہنگ لییوین