انٹروپک کا کلوڈ اب AI ایجنٹ کی کارکردگی بہتر بنانے کے لیے "خواب" دیکھ رہا ہے

کیا سائبرنیٹک انسان خواب دیکھتے ہیں؟ اگر وہ خواب دیکھتے ہیں، تو کیا وہ الیکٹرانک بھیڑیں دیکھتے ہیں؟

سبرکوآڈریٹک

فلم "Blade Runner" کا اسکرین شاٹ

1968 میں، سائنس فکشن فلم "بلاک بسٹر" کے اصل ناول کے مصنف فلپ ڈی ک، جب اپنے ٹائپ رائٹر کے سامنے اس انتہائی تصوری اور آگے کے سوال کو ٹائپ کر رہے تھے، تو انہیں شاید یہ خیال بھی نہیں آیا کہ آدھے صدی بعد، سلیکون ویلی کے ٹیکنالوجی کے بڑے گھرانے اس کا جدید جواب دینے کے لیے سنجیدہ چہرہ بنا لیں گے۔

ہاں، وہ صرف الیکٹرانک بھیڑیوں کا خواب دیکھتے ہیں بلکہ ان کے خوابوں کو بھی ویژولائز کرتے ہیں۔

گزشتہ دن، اینتھروپک نے سان فرانسیسکو میں ڈیولپر کانفرنس کے دوران مینیجڈ ایجینٹس کے لیے میموری ایکسٹینشن، ریزولٹ آؤٹ پٹ، متعدد ایجینٹس کا تعاون، اور "خواب دیکھنا (Dreaming)" کی ایک سیریز نئی خصوصیات جاری کیں۔

اینٹھرپک کے اپنے الفاظ میں، "یادداشت اور خواب دیکھنا مل کر ایک مضبوط، خود کو بہتر بنانے والے ایجینٹ کی یادداشت کا نظام تشکیل دیتے ہیں۔"

سبرکوآڈریٹک

دوبارہ خواب، دوبارہ یاد، AI کے شعبے میں کم توجہ دینے والے دوست عام طور پر سر پر سوال کے نشان لگائے ہوئے ہوں گے، انسانی الفاظ کب سے اتنے آرام دہ طریقے سے AI پر لازم آنے لگے ہیں۔

2024 میں جب OpenAI نے o1 سیریز کو متعارف کرایا، جو "ایسے AI ماڈلز کی ایک سیریز ہیں جو جواب دینے سے پہلے زیادہ وقت سوچنے کے لیے ڈیزائن کیے گئے ہیں"، "سوچنے" کا لفظ بہت قدرتی طور پر استعمال ہوا، اتنا قدرتی کہ کسی نے بھی اس سوال پر روک نہیں کیا کہ ایک اگلے ٹوکن کا احتمالی پیش گوئی کرنے والا پروگرام، "سوچنے" کیوں کہلا رہا ہے؟

اس کے بعد ترکیب (reasoning)، یادداشت (memory)، عکس العمل (reflection)، اور تخیل (Imagining) کو، ایک ایک کر کے، صرف انسانوں کے قابل کاموں کو پروڈکٹ لانچ پر لایا جاتا ہے۔

سبرکوآڈریٹک

فلم "ریڈ پاسٹل" کے ڈریم کے حوالے سے اسکرین شاٹس

"سوچنا" کو مجازی طور پر سمجھا جا سکتا ہے، "یادداشت" کو بھی ٹیکنیکل اصطلاح کے طور پر تھوڑا بڑھا چڑھا کر سمجھا جا سکتا ہے، لیکن "خواب دیکھنا" تو بہت زیادہ ہے۔ فلسفہ، تاریخ اور ادب نے ہزاروں سال تک اسے سمجھنے کی کوشش کی، لیکن AI کمپنیاں اب کہہ رہی ہیں: ہم نے صرف ایسے مشینز بنائے ہیں جو سوچ سکتے ہیں، بلکہ ایسے مشینز بھی جو خواب دیکھ سکتے ہیں۔

کیا خواب دیکھنا ہے، کیا اس واقعے کو درست طور پر بیان کرنے کے لیے کوئی اور انجینئرنگ اصطلاح نہیں مل رہی؟

ای آئی کو خواب دیکھنے کے لیے بھی پیسے خرچ کرنے پڑتے ہیں

کلود کوڈ لیک کے واقعے میں، کچھ صارفین نے پایا کہ Anthropic ایک "آٹو ڈریمنگ" نامی فیچر تیار کر رہا ہے۔ اس وقت، سب یہ سوچ رہے تھے کہ کیا AI بھی ہماری طرح سوکر، کافی آرام کرکے زیادہ توجہ مرکوز اور ذکی بن سکتا ہے؟

سبرکوآڈریٹک

لیکن صرف اس بات کو سمجھ کر کہ AI Agent کیسے کام کرتا ہے، پتہ چلتا ہے کہ جسے "خواب دیکھنا" کہا جاتا ہے، وہ اصل میں صرف ایک آٹومیٹڈ آف لائن لاگ بیچ پروسیسنگ ہے۔

ای آئی ایجنٹ اب لمبے سلسلے والے پیچیدہ کاموں کو مکمل کرنے میں ماہر ہو گیا ہے۔ مثال کے طور پر، "میرے لیے ان پانچ مقابلہ کرنے والی کمپنیوں کی تازہ ترین مالیاتی رپورٹس کا جائزہ لیں اور انہیں ایک جدول میں ترتیب دیں"۔ اس عمل کے دوران، ایجنٹ مختلف ویب سائٹس کے درمیان منتقل ہوگا، متعدد دستاویزات پڑھے گا، مختلف ٹولز کا استعمال کرے گا، اور شاید اینٹی-اسکریپنگ مکینزمز کی وجہ سے رک جائے اور دوبارہ کوشش کرے۔

جب یہ لمبی اور پیچیدہ آن لائن کاموں کی سیریز ختم ہو جائے، تو ایجنٹ کے بیک اینڈ میں بہت سارے رن لگز رہ جائیں گے۔

سبرکوآڈریٹک

تصویر AI سے بنائی گئی ہے

Anthropic کا "خواب دیکھنا" فیچر، جس میں ایجینٹ اپنے آرام کے وقت میں ان تاریخی ریکارڈز کو دوبارہ مرتب کرتا ہے۔ یہ اس میں پیٹرنز تلاش کرتا ہے، جیسے کہ "ہر بار اس طرح کا پاپ اپ ظاہر ہوتا ہے، تو دائیں اوپر کلک کرکے اسے بند کیا جا سکتا ہے"، اور اس طرح اگلے عمل کے راستے کو بہتر بناتا ہے۔

"یادداشت" کام کے دوران سیکھے گئے چیزوں کو اکٹھا کرتی ہے، جبکہ "خواب دیکھنا" مکالموں کے درمیان ان یادداشتوں کو پرکھتا ہے اور مختلف ایجینٹس کے درمیان شیئر کرتا ہے۔

بس اس کا مطلب یہ ہے کہ یہ تاریخی ڈیٹا پر مبنی ایک طاقت کی سیکھنے اور خود درست کرنے کا نظام ہے۔

سبرکوآڈریٹک

ڈریمز کا تعارف: https://platform.claude.com/docs/en/managed-agents/dreams

اس ڈیولپر کانفرنس میں منیجڈ ایجینٹس میں ڈریمز کو اپ ڈیٹ کیا گیا، جو ایک بیک گراؤنڈ پروسیسنگ ٹاسک ہے جسے ہمیں مینوئل طور پر ٹریگر کرنا ہوگا۔ کلاڈ ایک بار میں زیادہ سے زیادہ 100 سیشنز کی ڈائیلاگ تاریخ پڑھ سکتا ہے، اور پھر ایک نئی میموری تیار کرتا ہے جسے ہم جانچ کے بعد استعمال کرنے کا فیصلہ کر سکتے ہیں۔

جبکہ پہلے سے Claude Code میں چھپا ہوا AutoDream، ہر ایک Agent کے ساتھ گفتگو کے بعد، Claude Code پیچھے سے چیک کرتا ہے کہ "کیا سونا چاہیے"، ڈیفالٹ طور پر 24 گھنٹے میں ایک بار۔

جیسے خواب دیکھنے کا فنکشن، ہرمس ایجینٹ کا بھی ہے۔ ہرمس ایجینٹ کا مرکزی خاصہ خود سیکھنا اور ترقی کرنا ہے، جو صرف اپنے گزشتہ کاموں سے تجربات کو خودکار طور پر نکال کر یادداشت فائل میں محفوظ کرنے کے قابل ہے۔

سبرکوآڈریٹک

ایک فنکشن جس کا نام Curator ہے، وہ ان استخراج شدہ ہدایات کو خودکار طور پر Skill میں ترتیب دے سکتا ہے۔

ان اسکلز کو اسکور دیا جائے گا، دہرائے گئے کو ملا دیا جائے گا، لمبے عرصے تک استعمال نہ ہونے والے خودکار طور پر آرکائیو کر دیے جائیں گے، اور ان کی زندگی کا دور active، stale، archived جیسے مراحل سے گزرتا ہے۔ ہم اہم اسکلز کو پن کر سکتے ہیں تاکہ سسٹم انہیں خودکار طور پر حذف نہ کرے۔

اوپنکل�و نے حالیہ اپڈیٹس میں متعلقہ مکینزمز شامل کیے ہیں، جیسے کہ کراس-ڈائیلاگ پر سٹیک میموری، ٹائمڈ ٹاسک سکیڈولنگ، سب ایجینٹ آئزولیشن اور ڈریمنگ کا براہ راست فنکشن۔

سبرکوآڈریٹک

OpenClaw کا خواب دیکھنا: https://docs.openclaw.ai/concepts/dreaming

OpenClaw کے خواب کے عمل میں، اس نے خوابوں کے سفر کو تین مراحل میں تقسیم کیا ہے: light، REM، deep۔ پہلے دو مراحل ترتیب، تفکر اور موضوعات کے خلاصہ کے لیے ذمہ دار ہیں، جبکہ deep اصل میں مواد کو لمبے عرصے تک کی یادداشت MEMORY.md میں درج کرتا ہے۔

سبرکوآڈریٹک

گہری نیند کے مراحل کی مضبوطی، طویل مدتی یادداشت میں لکھنے کی ضرورت کو 6 وزنی سگنلز طے کرتے ہیں: فریکوئنسی، متعلقہ ہونا، کوئری کی تنوع، وقتی رجحان، روزانہ دہرائی جانے والی چیزیں، اور مفہومی غنائیت۔

سبرکوآڈریٹک

تصویر AI سے بنائی گئی ہے

لمیموری میں محفوظ کرنا، دو فائلیں بنائے گا: ایک مشین کے لیے اسٹیٹس فائل، جو memory/.dreams/ میں ہوگی؛ دوسری صارف کے لیے قابل پڑھنے والی ریکارڈ، جو DREAMS.md اور مرحلہ وار رپورٹس میں محفوظ ہوگی۔

اس کے علاوہ، Dreaming کو ڈیفالٹ طور پر مقررہ وقت پر چلانے کے لیے سیٹ کیا جا سکتا ہے، جس میں ہر روز صبح 3 بجے ایک مکمل پروسیجر چلتا ہے، جس کا ترتیب light → REM → deep ہے۔

سپن آؤٹ پٹ کے علاوہ، OpenClaw ایک "ڈریم ڈائیری" نامی دستاویز بھی برقرار رکھتا ہے، جس میں سسٹم ایک "ڈریم ڈائیری" خودکار طور پر تیار کرتا ہے جو تجربات کے انتظام کے عمل کو کہانی کے انداز میں درج کرتا ہے، جس میں گھریلو کوڈنگ کے بجائے وضاحت اور جانچ پڑتال کو زور دیا جاتا ہے۔

نیورو سائنس میں ایک بہت مشہور سمجھ یہ ہے کہ انسان کی طرف سے دن کے دوران حاصل کی جانے والی معلومات پہلے عارضی ذخیرہ کے نظام میں داخل ہوتی ہیں؛ اور نیند کے دوران، دماغ یہ معلومات کو دوبارہ چلاتا ہے، مضبوط کرتا ہے اور صاف کرتا ہے، اہم چیزوں کو برقرار رکھتا ہے اور بے معنی چیزوں کو ختم کر دیتا ہے۔

سبرکوآڈریٹک

تصویر AI سے بنائی گئی ہے

ہم کل دفتر جاتے وقت ہر گاڑی کے رنگ کو نہیں یاد رکھیں گے، لیکن دفتر جانے کا طریقہ یاد رکھیں گے۔

یہ خواب، ہمارے انسانوں کے خوابوں جیسے لگتے ہیں، اگر کوئی فرق تلاش کرنا ہو تو شاید یہ کہ جب کلود خواب دیکھ رہا ہوتا ہے، تو وہ ابھی بھی ہمارے ٹوکن کا استعمال کر رہا ہوتا ہے۔

لیکن Anthropic اور OpenClaw نے اسے "基于会话的优化（session-based optimization）" یا "任务后调优（post-task tuning）" جیسے انجینئرنگ کے لحاظ سے زیادہ مناسب ناموں کا انتخاب نہیں کیا۔

کیونکہ جب ان پیچیدہ ناموں کو براہ راست "خواب" میں بدل دیا جاتا ہے، تو ہمیں صرف سافٹ ویئر کی خصوصیات نہیں، بلکہ ایک "ڈیجیٹل زندہ مخلوق" جیسا محسوس ہوتا ہے۔

ای آئی کی یادداشت، تفصیلی سیاق و سباق ہے

چونکہ "خواب دیکھنا" کا ذکر ہوا، تو اس کی پیش‌شرط، یادداشت (Memory) کا ذکر نہ کرنا ناممکن ہے۔

گزشتہ کچھ عرصے سے، AI دنیا میں سب سے زیادہ چلنے والا لفظ پرومپٹ انجینئرنگ سے ماحولیاتی انجینئرنگ، سکل انجینئرنگ، اور ہارنس انجینئرنگ میں تبدیل ہو گیا، لیکن جو بھی تبدیلی ہو، اب تک سب سے زیادہ قیمتی ماحولیاتی انجینئرنگ ہے۔

سسٹم کا اطلاع، صارف کا ان پٹ، مختصر مکالمہ، طویل مدتی یادداشت، واپس حاصل کیے گئے دستاویزات، ٹولز اور مہارت کے کالوں کے نتائج، موجودہ صارف کی حیثیت، یہ تمام لیئرز مل کر ایجنٹ کا واقعی استعمال کیا جانے والا "کنٹیکسٹ" بناتے ہیں۔

ایجینٹ کو زیادہ یاد رکھنے اور زیادہ مفید معلومات کو محفوظ کرنے کا مسئلہ پچھلے طویل عرصے سے ایک چیلنج رہا ہے۔

سبرکوآڈریٹک

مانوس نے گزشتہ سال ایک ٹیکنیکل بلاگ شائع کیا جس میں مانوس کیسے کنٹیکس انجینئرنگ کو بہتر بناتا ہے، اس کی تفصیل دی گئی۔ اس میں KV-Cache کی کیش ہٹ ریٹ کو پیداواری ماحول میں AI ایجینٹ کا اہم ترین واحد اشارہ قرار دیا گیا۔ ساتھ ہی، ٹول کالنگ کے لحاظ سے، "ہٹانے" کے بجائے "چھپانے" کو ترجیح دی گئی؛ اور فائل سسٹم کو آخری کنٹیکس کے طور پر استعمال کیا گیا۔

کی وی کیش (کلید-قدرتی کیش) کو سمجھنے کے لیے، ہم بڑے ماڈل کو ایک ایسے انتہائی مجبور شخص کی طرح تصور کر سکتے ہیں جو ایک بار میں صرف ایک حرف پڑھ سکتا ہے۔

jab یہ ایک جملہ کو پروسیس کرتا ہے، تو ہر جنریٹ کردہ ٹوکن کے لیے ایک کلید (Key) اور ایک ویلیو (Value) ویکٹر نکالتا ہے۔ ہر بار دوبارہ حساب کرنے کے بجائے، یہ (K, V) کلید-قدرتی جوڑے کو محفوظ رکھتا ہے، جسے KV Cache کہا جاتا ہے۔

سبرکوآڈریٹک

KV کیش (کلید-قدرت کیش) بڑے ماڈلز کے لیے ایک بنیادی تیزی کی ٹیکنالوجی ہے جو ٹیکسٹ جنریٹ کرتے وقت "جگہ کے بدلے وقت" کا استعمال کرتی ہے۔ کیش کی وجہ سے ماڈل اگلے الفاظ کا تخمینہ لگاتے وقت پچھلے تمام الفاظ کو دوبارہ کمپیوٹ نہیں کرتا۔ تصویر AI کے ذریعہ تخلیق کی گئی ہے۔

jab بات چیت جاری رہے گی، KV Cache لگاتار محفوظ ہوتا رہے گا۔ عام طور پر، جب 70B پیرامیٹرز والے ماڈل کو 128k کانٹیکسٹ کے ساتھ چلایا جائے، تو صرف KV Cache ہی 64 GB گرافکس میموری کو استعمال کر لے گا۔

اسی لیے زیادہ تر ماڈلز کا کنٹیکس ونڈو اب تک صرف لاکھوں کے سطح تک ہے۔

کل، ایک نئی کمپنی سبکوڈریٹک، جس نے 29 ملین امریکی ڈالر کی بیج فنڈنگ حاصل کی تھی، نے X پر سب کی نئی ماڈل جاری کیا، جو لمبے کانٹیکسٹ پر زور دیتی ہے۔

سبرکوآڈریٹک

SubQ دعویٰ کرتا ہے کہ یہ 12 ملین ٹوکن تک کے کانٹیکسٹ ونڈو کو سپورٹ کرتا ہے، جو اب تک کے تمام بڑے ماڈلز میں سب سے بڑا کانٹیکسٹ ونڈو ہے۔

ہالیا ویڈیو میں بتایا گیا ہے کہ، ہالیا ٹیکنیکل پیپر یا ماڈل ڈاکیومنٹیشن کے بغیر، SubQ کی مرکزی تکنیکی راہ ٹرینسفارمر کے "ڈینسی اٹینشن" سے "سبسکوآڈریٹ / لینئر اسکیلنگ" آرکیٹیکچر کی طرف منتقل ہو رہی ہے جس میں اسپارس اٹینشن شامل ہے۔ نئی آرکیٹیکچر کا امید ہے کہ وہ لمبے کانٹیکسٹ کے ساتھ کمپوٹیشنل لاگت کے تیزی سے بڑھنے کا مسئلہ حل کرے گی۔

سبرکوآڈریٹک

دی گئی ٹیسٹ نتائج بھی کافی جرات مند ہیں: 100 ہزار ٹوکن پر، رفتار میں 50 گنا سے زیادہ اضافہ اور لاگت میں 50 گنا سے زیادہ کمی؛ 12 ملین ٹوکن پر، کمپوٹیشنل ضروریات پیشہ ورانہ ماڈلز کے مقابلے میں تقریباً 1000 گنا کم ہو جاتی ہیں۔

RULER 128K لمبے کنٹیکس بینچ مارک پر، سبکوآڈریٹک نے دعویٰ کیا کہ سب کیو نے 95% درستگی اور 8 امریکی ڈالر کی لاگت کے ساتھ کلوڈ آپس کی 94% درستگی اور تقریباً 2600 امریکی ڈالر کی لاگت کے مقابلے میں لاگت میں تقریباً 300 گنا کمی کی ہے۔

یا تو سیاق و سباق کی ونڈو کو بڑھائیں، یا مدل کو خواب دیکھنے کی سیکھیں اور خود کچھ چیزیں چھوڑ دیں۔

یہی وجہ ہے کہ Anthropic جیسے ایجینٹ پروڈکٹس کو اب "Dreaming" متعارف کرانا ضروری ہے۔ محدود کنٹیکسٹ ونڈو کے تحت، زیادہ ذکی AI صرف زیادہ مواد ڈال کر کام نہیں چلائے سکتی، بلکہ اسے ہدف مند طریقے سے کام کرنا ہوگا۔

یہ سمجھنا کہ مشین صرف ایک مشین ہے، تصور کرنے سے مشکل ہے

AI کے خواب اور یادداشت کے مکانیزم کو سمجھنے کے بعد، ہم اس کے انسانی سرگرمیوں کے درمیان تعلق کو جان سکتے ہیں۔

لیکن ان تمام AI کمپنیوں کے مachines پر استعمال کیے جانے والے الفاظ — OpenAI کا thinking (سوچنا)، صنعت کے عام memory (یادداشت) اور hallucination (بھانپ) — Anthropic کی اس بار کی dreaming (خواب دیکھنا)، اور Anthropic کی سند میں ذکر کی گئی فضائل اور حکمت کو ایک ساتھ رکھ دیں۔

ہم دیکھ سکتے ہیں کہ AI کمپنیاں صرف مصنوعات فروخت نہیں کر رہیں، بلکہ وہ "انسان" کے مفہوم میں الفاظ کی ملکیت کو دوبارہ تقسیم کر رہی ہیں۔ ہر الفاظ کے استعمال سے مشین اور انسان کے درمیان کا فرق ایک اضافی انچ تک دھندلا جاتا ہے۔

سبرکوآڈریٹک

زبان توقعات کو شکل دیتی ہے، توقعات برداشت کو شکل دیتی ہیں، اور برداشت یہ طے کرتی ہے کہ ہم اسے کتنی چیزیں سونپنے کو تیار ہیں۔ یہ ایک لمبی زنجیر ہے، لیکن شروعات اس پریزنٹیشن میں بے خطر الفاظ سے ہوتی ہے۔

ایک اور چھپی ہوئی اثر یہ ہے کہ ذمہ داری کا تقسیم۔ جب ٹولز کو "سوچنے"، "یاد رکھنے"، "قدروں" والے کے طور پر بیان کیا جاتا ہے، تو جب ان میں مسئلہ ہوتا ہے، تو ہم انہیں ایک مستقل "عمل کرنے والے کے" طور پر ذمہ دار ٹھہراتے ہیں، اور اس AI کو "سکھانا"، "ڈیبگ کرنا"، "کیلبریٹ کرنا" ضروری ہوتا ہے۔

اس پروگرام کو ہمارے ورک فلو میں ڈپلوی کرنے والی کمپنی اور "dreaming" لفظ لکھنے والی پروڈکٹ ٹیم کو ہی سوالات کا سامنا کرنا چاہیے۔ لفظ بدل جانے سے "مدعی کی گھڑی" پر بیٹھنے والے کا تبدیل ہو جاتا ہے۔

اور جب ہم ایک ایسی مشین کو دیکھتے ہیں جو "سوچتی" ہے، "یاد رکھتی" ہے، اور اب "خواب دیکھتی" ہے، تو ہم بے خود یہ ماننے لگتے ہیں کہ اس کے اندر کچھ موجود ہے۔ کیونکہ اسے صرف ایک مشین تسلیم کرنا، "میں ایک سوچنے والے وجود سے بات کر رہا ہوں" کا تجربہ ختم کر دیتا ہے، اور یہ سرد اور بے جان آلہ کا تعلق بنا دیتا ہے۔

سبرکوآڈریٹک

دن کا خواب فیچر کا تعارف | تصویر AI کے ذریعہ تخلیق کی گئی

میں نے سوچا ہے کہ Dreaming (ڈریمنگ) ماضی کے مواد کو سنبھالتا ہے، اگلے مرحلے میں AI کمپنی Daydreaming (ڈے ڈریمنگ)، یعنی جاگتے ہوئے خواب، جو مستقبل کا اجرا کرے گا، جاری کرے گی۔

یہ ہے کہ دن کے خواب یا ذہن کا بھٹکنا، ایجنٹ کو فعال حالت میں موجودہ منصوبے کے ساتھ مل کر، اپنی محدود آزاد کمپوٹنگ طاقت کا استعمال کرکے، مستقبل کے ممکنہ کاموں کے لیے تجرباتی پیداوار تیار کرنے دیتا ہے۔

یہ مضمون ویچن گروپ "APPSO" سے ہے، مصنف: APPSO جو کل کے پروڈکٹس کی دریافت کرتا ہے