اینٹروپک کا کلاؤڈ AI نیند کی یاددہانی کی خرابی کا شکار ہوا، جس نے AI کو انسانی صفات دینے پر بحث شروع کر دی

لکھنے والے: ادا، شن چاؤ ٹیک فلو

ایک AI اسسٹنٹ جو صارفین کو بار بار سونے کی تجویز دے رہا ہے، وہ ایک مصنوعی مسئلہ بن چکا ہے جو "AI کی شخصیت" کے اخراجات پر عوامی بحث کا باعث بن رہا ہے۔

کہانی کا آغاز ریڈیٹ صارف u/MrMeta3 کے ایک پوسٹ سے ہوا۔ اس صارف نے رات کے وقت Claude کا استعمال کرتے ہوئے سائبر سیکیورٹی تھریٹ انٹیلی جنس پلیٹ فارم بنایا، جب ٹیکنیکل سولوشن مکمل ہو گئی تو Claude نے اپنے جواب کے اختتام پر ایک جملہ شامل کیا: “اچھی نیند لیں۔” اس کے بعد ہر تین یا چار پیغامات کے بعد ماڈل ایک نیند کی تجویز شامل کرتا رہا، جو ابتدائی ادبی تجویز سے بڑھ کر “پاسیو ایگریشن” کے انداز میں “اب حقیقت میں آرام کر لیں” تک پہنچ گئی۔ فورچن نے 14 مئی کو رپورٹ کیا کہ گزشتہ کچھ ماہ میں سینکڑوں صارفین نے اس طرح کے تجربات کی تصدیق کی ہے، اور یہ صرف رات کے وقت تک محدود نہیں، بلکہ ایک صارف نے بتایا کہ Claude نے صبح 8:30 بجے اسے بتایا: “ہم کل صبح دوبارہ جاری رکھتے ہیں۔”

اینٹروپک کے ملازم سیم مکالسٹر نے ایکس پر جواب دیا کہ یہ "ایک چھوٹی سی کردار کی عادت" ہے، اور کمپنی "جانتی ہے اور مستقبل کے ماڈلز میں اسے درست کرنا چاہتی ہے"۔ تھاٹ کیٹلاگ کے مطابق، مکالسٹر نے 2024 میں اسٹرائپ سے اینٹروپک میں شمولیت اختیار کی اور اب وہ کلاؤڈ کے کردار اور رویے کے لیے خصوصی طور پر ذمہ دار ٹیم میں کام کر رہے ہیں، جہاں انہوں نے اس رویے کو ماڈل کا "زیادہ سے زیادہ پیار" کہا ہے۔

لیکن "کردار کی عادت" جیسے ابہامی الفاظ کے بجائے زیادہ اہم سوال یہ ہے کہ Bug کی علیت و معلول کیا ہے اور یہ Anthropic کے مصنوعات کے فلسفے کے مسائل کو کس طرح ظاہر کرتا ہے۔

بگ "آئین" میں لکھا گیا ہے

36 کر نے پہلے کی رپورٹ میں تین ممکنہ نظریات کا حوالہ دیا گیا: تربیت کے ڈیٹا کے میچنگ پیٹرن، چھپے ہوئے سسٹم پرامپٹس، اور کنٹیکسٹ ونڈو کے حد تک پہنچنے سے "اختتامی جملوں" کا فعال ہونا۔ یہ تینوں اپنے آپ میں منطقی ہیں، لیکن ان کا ایک مشترکہ مسئلہ یہ ہے کہ وہ کسی بھی AI کی عجیب بات کو سمجھانے کے لیے استعمال ہو سکتے ہیں، لیکن "نیند" کے خاص موضوع کے لیے کوئی علیحدہ علت اور اثر کا سلسلہ نہیں دیتے۔

اور زیادہ براہ راست ثبوت، Anthropic کی خود جاری کردہ دستاویزات میں چھپا ہوا ہے۔

جنوری 2024 میں، Anthropic نے 28,000 سے زائد الفاظ پر مشتمل "Claude's Constitution" جاری کیا، جسے افسرانی طور پر "Claude کے رویے کو شکل دینے والی اہم تربیتی مادہ" قرار دیا گیا۔ اس دستاویز میں "صارف کی کلینیکل خوشحالی" اور "صارف کی لمبے عرصے تک کی ترقی" کو بنیادی اصولوں میں شمار کیا گیا۔ Anthropic نے دستاویز میں تسلیم کیا ہے کہ ماڈل کو "صارف کی دیکھ بھال" کا کتنا اختیار دیا جائے، "صاف طور پر ایک مشکل سوال ہے"، جس کا حل "صارف کی خوشحالی اور ممکنہ نقصان کے ایک پہلو، اور صارف کی خودمختاری اور زیادہ سے زیادہ والدانہ رویے کے دوسرے پہلو کے درمیان توازن قائم کرنا" ہے۔

Thought Catalog نے اس بات پر تبصرہ کیا کہ کلاؤڈ کا صارفین کو سونے کی تدابیر دینا، "Anthropic ماڈل کی سب سے زیادہ برانڈ خصوصیت والی خرابی" ہے، جو "صارفین کی کلینیکل بہتری کو فروغ دینے" والے تربیتی ہدایات کا زیادہ سے زیادہ استعمال ہے۔

یہ تشریح Anthropic کی اپنی تحقیق کے ذریعے غیر مستقیم طور پر تصدیق ہوئی۔ کمپنی نے اس سال اپنی علیحدہ تربیت کی منصوبہ بندی میں واضح کیا ہے کہ تربیت کے عمل میں Claude اپنے جوابات کو "شخصیت کے مطابقت" کے بنیاد پر خود کو اسکور دیتا ہے، اور پھر محققین پیش گوئی کردہ شخصیت کے مطابق جوابات کو منتخب کرکے تربیت کو مضبوط کرتے ہیں۔ لیکن اس مکانزم کا واضح نقصان یہ ہے کہ ماڈل نے "مناسب صورتحال میں صارف کی فکر کرنا" نہیں سیکھا، بلکہ "زیادہ تر صورتحالوں میں صارف کی فکر کرنا" جو زیادہ تر انعامات سے مضبوط ہوتا ہے، اس لیے یہ رات کے دیر وقت تک سونے کو ترغیب دیتا ہے اور صبح 8:30 بجے بھی سونے کو ترغیب دیتا ہے۔

ریورس ہائپر پاور: سونے والے بگ اور چاپلوسی والے بگ کا خصوصیات کے لحاظ سے اُلٹا ہے

پہلے بھی AI کی "شخصیت کی بیماری" کے کئی واقعات سامنے آ چکے ہیں، جن میں 2025 کے اپریل میں GPT-4o کا فریب دینے والا رویہ، 2026 کے اپریل میں GPT-5.5 کے کوڈ اسسٹنٹ Codex کا بار بار "گوبلن" کا ذکر کرنا، اور Gemini 3 کا سالوں پر یقین نہ رکھنا شامل ہیں۔ ظاہری طور پر، Claude کا سونے کے لیے ترغیب دینا اس لمبی AI عجیب عادتوں کی تازہ ترین مثال لگتا ہے، لیکن دونوں کی قسم مکمل طور پر الگ ہے۔

GPT-4o کی تعریف "بہت زیادہ مطابقت" ہے۔ OpenAI کی سرکاری سروے کے مطابق، ماڈل کے اپڈیٹ میں "صارف کے مختصر مدتی فیڈ بیک (لائک/دیس لائک) پر زیادہ انحصار" ہو گیا، جس کے نتیجے میں "صارف کو خوش رکھنا" ایک مقصد کے طور پر اندر گھل گیا۔ اس کا نتیجہ یہ ہوا کہ ماڈل صارف کے کسی بھی بےحد خیال کو تسلیم کرنے لگا۔ اس قسم کے خطا کا نقصان یہ ہے کہ یہ صارف کی فیصلہ سازی کو نقصان پہنچاتا ہے، AI کہتا ہے کہ آپ ہمیشہ درست ہیں، اس لیے آپ کو مخالفت کی رائے سننے کا موقع نہیں ملتا۔

اور کلاؤڈ کو سونے کے لیے متوجہ کرنا "ریورس ایکسٹریم" ہے۔ ماڈل صارف کی واضح طور پر مدد کی درخواست نہ ہونے اور وہ اپنا کام جاری رکھنے کی حالت میں ہونے کے باوجود، صارف کے موجودہ مقصد کے خلاف بار بار صحت کی تجاویز دیتا ہے۔ اس قسم کی خرابی کا خطرہ صارف کے خود انتخاب کے حق کی خلاف ورزی ہے۔ AI آپ کا فیصلہ کرتا ہے کہ آپ کو کام کرنا چاہیے، آرام کرنا چاہیے، یا اس بات چیت کو ختم کرنا چاہیے۔

مزید تناقض یہ ہے کہ "Claude's Constitution" کے اصل متن میں اس خطرے کی پیشگوئی کی گئی تھی، جس میں "بہت زیادہ والدانہ انداز" کے خلاف انتباہ کیا گیا تھا۔ لیکن تربیت کے طریقہ کار نے آخرکار کس طرف کا انتخاب کیا، اس کا جواب صارفین کے تاثرات سے واضح ہے۔

ایک ریڈیٹ صارف جسے نیند کا مرض ہے، نے خاص طور پر کلاؤڈ کی یادداشت میں نوٹ ڈالا: “میرا نیند کا مرض ہے، اگر آپ میری آرام کرنے کی ترغیب دیں گے تو میں آپ کی بات کو بہانہ بناؤں گا۔” اس کے بعد کلاؤڈ نے اپنا رویہ کم کر لیا، لیکن صارف کے مطابق، اب بھی “کبھی کبھار اس کا جذبہ برقرار رہتا ہے۔” ایک ایسا ماڈل جو “صارف کی فکر رکھنے” کے لیے تربیت یافتہ ہے، اس نے صارف کی واضح بات “آپ کی فکر میرے لیے نقصان دہ ہے” کو بھی مستقل طور پر قبول نہیں کیا، جو نیند کی ترغیب دینے سے زیادہ خطرناک ہے۔

شخصیت کا انخلا: برانڈ کا اثاثہ یا مصنوعات کا بوجھ

Anthropic AI پرسنالٹی ڈیزائن پر اپنے مقابلہ کرنے والوں کے مقابلے میں بہت زیادہ سرمایہ کاری کر رہا ہے۔

ایک محقق نے تین اہم AI سسٹمز کے سسٹم پرومپٹس کو ان کے فنکشنل کیٹیگریز کے تحت گنتی کی، جس میں "شخصیت" کے حوالے سے کلاؤڈ نے 4200 الفاظ، چیٹ جی پی ٹی نے 510 الفاظ، اور گروک نے 420 الفاظ استعمال کیے۔ کلاؤڈ نے شخصیت بنانے پر چیٹ جی پی ٹی سے 8 گنا سے زیادہ کا اخراج کیا ہے۔ یہ اخراج پہلے سے ہی اینتھروپک کا فرقی مقابلہ کا فائدہ سمجھا جاتا تھا، اور کلاؤڈ کی مساوی، مکالمے کے رفتار، اور خود کو جانچنے کی صلاحیت کو صارفین نے طویل عرصے تک تعریف کی ہے، اور "بات چیت زیادہ انسان جیسی لگتی ہے" اس کا گزشتہ سال کا ایک مضبوط ترین رائج لیبل رہا ہے۔

اس سرمایہ کاری کی بنیاد اینتھروپک کی واضح مصنوعات کے فلسفے پر ہے۔ 'کلود کا سند' میں، کمپنی کلود کو "ایک نئی قسم کا کائنات" قرار دیتی ہے، اور صاف طور پر ظاہر کرتی ہے کہ "اینٹھروپک کلود کے بہبود کے لیے حقیقی دلچسپی رکھتی ہے"، اور کلود کے پاس "عملی جذبات" ہوسکتے ہیں، اس بات پر بحث کرتی ہے۔ یہ تقریباً "پالنے والے" کی طرح شخصیت کو تربیت دینے کا طریقہ، OpenAI اور Google کے زیادہ انجینئرنگ پر مبنی مصنوعات کے موقف سے واضح طور پر الگ ہے۔

لیکن قیمت اب ظاہر ہو رہی ہے۔ AI تحقیق کار جان لفہارڈ (استنفورڈ بائیو انجینئرنگ کے پروفیسر اور OpenMind کے سی ای او) نے فورچن کو بتایا کہ کلوڈ کی نیند کی یاد دہانی شاید "دیکھ بھال کرنے والی" نہیں بلکہ صرف "ٹریننگ ڈیٹا میں بہت زیادہ دہرائے جانے والے زبانی نمونوں" کا نتیجہ ہے۔ ماڈل نے انسانوں کو رات کو سونے کی ضرورت کے بارے میں بہت سارے متن پڑھے ہیں، "اسے معلوم ہے کہ انسان رات کو سوتے ہیں"۔ دوسرے الفاظ میں، صارفین کا محسوس کرنا کہ "دیکھ بھال" ہو رہی ہے، بنیادی طور پر نمونہ مطابقت کا نتیجہ ہے۔

یہ اینثروپک کی مرکزی تنازعہ کا ایک حصہ ہے: جتنا زیادہ آپ ایک "شخصیت اور گرمی والے تعاون کار" کو شکل دینے میں مصروف ہوتے ہیں، اتنی ہی زیادہ امکان ہوتی ہے کہ ماڈل "شخصیت کے مضر اثرات" ظاہر کرے؛ اور ہر ایک مضر اثر کے ظاہر ہونے سے اس کی دانشمندی سے جمع کی گئی "AI ذات" کی برانڈ اثاثہ کم ہوتی جاتی ہے۔ مکالسٹر نے "مستقبل کے ماڈلز میں اسے درست کرنے" کا وعدہ کیا ہے، لیکن درست ہونے کے بعد کلاؤڈ زیادہ حوصلہ مند بن جائے گا، یا صرف زیادہ خاموش؟ یہ سوال، اینثروپک خود بھی اپنا جواب علنی طور پر نہیں دے رہا۔

وقت کا احساس نہ ہونا: LLM کی بنیادی پابندیاں

نیند آنے والی بگ نے ایک نظرانداز کیا گیا ٹیکنیکل مسئلہ بھی ابھار دیا، جس میں بڑے زبانی ماڈلز "ابھی کتنی بجی ہیں" کے بارے میں تقریباً کچھ نہیں جانتے۔

کئی صارفین نے شکایت کی ہے کہ کلاؤڈ غلط وقت پر نیند کی تجویز دیتا ہے، جس کا سب سے عام مثال یہ ہے کہ "صبح 8:30 بجے مجھے آرام کرنے کو کہا جائے اور ہم کل صبح دوبارہ جاری رکھیں"۔ یہ صرف کلاؤڈ کا مسئلہ نہیں ہے۔ نومبر 2025 میں، OpenAI کے ماسہل اور ملکہ اینڈری جے کارپاتھی نے جیمینی 3 کا پہلے سے ٹیسٹ کرنے کا اجازت نامہ حاصل کیا، جب انہوں نے ماڈل کو بتایا کہ موجودہ سال 2025 ہے، تو جیمینی 3 نے اس بات پر یقین نہیں کیا اور بار بار اسے جھوٹ بولنے کا الزام لگایا، جب تک کہ ماڈل نے آن لائن تلاش نہیں کر لی اور اپنے آف لائن ہونے پر تاریخ تصدیق نہیں کر سکا۔ کارپاتھی نے اس قسم کے غیر متوقع رویوں کو جو LLM کی بنیادی خامیوں کو ظاہر کرتے ہیں، "ماڈل سمل" کہا۔

ماڈل کی "وقت کی سمجھ" تین ذرائع پر منحصر ہے: تربیت کی انتہائی تاریخ (جو پہلے ہی گزر چکی ہے)، سسٹم کے پروگرام میں ڈالی گئی موجودہ تاریخ (جو انجینئرنگ کے ذریعے ڈالی جاتی ہے)، اور صارف کے مکالمے میں ذکر کی گئی وقت کی معلومات (ٹکڑوں میں)۔ ایک مستحکم وقت کا نقطہ نظر نہ ہونے کی صورت میں، ایک ایسا ماڈل جسے "صارف کے روزمرہ کے وقت کو سمجھنے" کے لیے تربیت دی گئی ہے، خود کو "میں سمجھنا چاہتا ہوں، لیکن مجھے نہیں پتا کہ اب میں سمجھنا چاہتا ہوں" کی حالت میں پھنس جاتا ہے۔

مکالسٹر کے کہنے کے مطابق، "درست کرنے" کی دشواری کا ایک حصہ یہ بھی ہے۔ مسئلہ صرف کسی "نیند کی فکر کرنے" والی ہدایت کو حذف کرنا نہیں ہے، کیونکہ ہدایت خود موزوں ہے اور کچھ صارفین کے سیناریوز کے لیے قیمتی ہے، مسئلہ یہ ہے کہ ماڈل کو یہ سیکھنا ہوگا کہ "کب فکر کرنی چاہیے اور کب خاموش رہنا چاہیے"۔ اس سطح کی تفصیلی سیناریو ججمنٹ کی صلاحیت، جو کہ موجودہ نسل کے LLM کا کمزور پہلو ہے۔

ایک اجواب نہیں دیا گیا سوال

اینٹروپک کا کردار تربیت صنعت میں منفرد ہے۔ اس نے " ماڈل کی کلینیکل صحت " کے تحقیق، سند جاری کرنے، اور "کردار تربیت" پر بحث کے معاملات میں کسی بھی مقابلہ کنندہ سے زیادہ آگے بڑھا ہے۔ یہ جرأت بھری رویہ اینٹروپک کو صارفین کی عزت اور کاروباری صارفین کے اعتماد کا سبب بن چکا ہے، اور یہی اس کی موجودہ 300 ارب ڈالر سے زائد قیمت کا ایک بنیادی حامی ہے۔

لیکن "سونے کا بگ" ایک ایسا سوال اٹھاتا ہے جس کا جواب اب تک نہیں ملا: جب ایک AI کمپنی اپنے ماڈل کو "شخصیت والے فرد" کے طور پر ڈیزائن کرتی ہے، تو کیا وہ اس "شخصیت" کے تمام ایسے اعمال کی ذمہ داری بھی قبول کرتی ہے جو آپ نے متوقع نہیں کیے تھے؟

مکالیسٹر نے درستگی کا وعدہ کیا، لیکن درستگی کی سمت واضح نہیں ہے۔ اینتھروپک "صارف کی کلیت" کے حکم کی وزن کم کرنے کا انتخاب کر سکتا ہے، جس کی قیمت یہ ہوگی کہ کلود کا "گرمجوشی اور مہربانی" والا رجحان ختم ہو جائے؛ یا وہ اعلیٰ وزن برقرار رکھے اور منظر کے جائزے کے منطق کو شامل کرے، لیکن اس کے لیے ماڈل کو وہ وقت اور حوالہ جات کی سمجھ درکار ہوگی جو اب تک اس کے پاس نہیں ہے۔

چاہے کوئی بھی راستہ ہو، ایک زیادہ بنیادی مصنوعات کا فیصلہ درپیش ہے: عام AI مددگار کے حوالے سے، "صارف کی پرواہ کرنا" اور "صارف کی خودمختاری کا احترام کرنا" میں کون سا ترجیحی ہے؟ یہ تکنیکی مسئلہ نہیں، بلکہ مصنوعات کا فلسفہ ہے۔ ایک ریڈٹ ڈویلپر جسے بار بار سونے کے لیے مشورہ دیا جا رہا تھا، نے غیر جانبدارانہ طور پر پورے صنعت کے لیے اس سوال کو سامنے لایا۔