کلید کے ڈائنانک ورک فلوز کا استعمال گہری تحقیق کے لیے کیسے کریں

اس تین سالوں کے دوران، میں نے صنعتی تحقیق کے لیے AI کی مدد لینا بہت ضروری پایا ہے، اس لیے میں نے معلومات کے فلٹر، خلاصہ، جوڑ، تصدیق اور ذخیرہ کرنے کے لیے ایک سیریز اسکل اور مددگار نظام تیار کیے ہیں۔

جب تک میں نے اس ہفتے کلید کوڈ کے ڈائنانک ورک فلو کا گہرا تجربہ نہیں کیا، میں نے "انسان کو بڑے دور کے خلاف نہیں لڑنا چاہیے" کا اصل مطلب نہیں سمجھا تھا۔

دوبارہ سوچیں: AI کے دور میں انسان کو کیا گہرا تحقیق کرنا چاہیے، اور میں اور AI کے درمیان تعاون اور مکمل کرنے کا تعلق کیسے قائم کروں۔

ایک، تحقیق کے جال کے ساتھ شروع کرتے ہیں

ٹیکنیکل ریسرچ کرنا اصل میں کافی جال ہے (چاہے انسان کے لیے ہو یا AI کے لیے)، کیونکہ ریسرچ کے آغاز سے ہی آپ کو بہت ساری معلومات ملتی ہیں، جس سے نظریات کا تعداد بڑھتا جاتا ہے اور نتائج ادھر ادھر ہوتے جاتے ہیں۔ اس لیے ہمیشہ اپنے مقصد پر واپس آنا سیکھیں۔

یہی وجہ ہے کہ AI اب تک کافی اچھا نہیں ہوا، کیونکہ توجہ اور ربط کے لحاظ سے، یہ انسانوں کے مقابلے میں موجودہ معلومات کی مقدار میں زیادہ پھنس جاتا ہے اور حقیقی طور پر قیمتی عبوری ربطوں کے لیے کمزور ہوتا ہے۔

بے شک AI کی بہترین خصوصیت اس کی اجرائی صلاحیت ہے، جو ایجنٹ کے فارمیٹ میں ایک ایک کرکے تلاش، تدوین اور خلاصہ کرتی ہے، جس سے تفصیلات کا نقصان بالکل نہیں ہوتا۔

ہالے چھ ماہ تک میں نے اپنے وی چین گائیڈ کو کم ہی اپ لوڈ کیا ہے، لیکن میں نے صنعت کے تقریباً تمام مرکزی میدانوں پر مکمل طور پر نظر رکھی اور تحقیق کی ہے، اور اس ان پٹ اور آؤٹ پٹ کی بنیاد ایک اپنی ڈیپ ریسرچ سسٹم ہے۔

جبکہ گزشتہ هفتوں کلیڈ کوڈ نے ڈائنانک ورکفلوز کا فیچر لانچ کیا، میں چاہتا ہوں کہ میں اس کی ڈیفالٹ صلاحیتوں کا مقابلہ کروں اور دیکھوں کہ کیا وہ میری خود کو مکمل طور پر عبور کر سکتا ہے۔

دوسری، ڈائنامک ورک فلو کیا ہے

ڈائنانک ورکفلوز (Dynamic Workflows) کا مرکزی خیال یہ ہے کہ کسی کام کو انجام دینے سے پہلے، AI خود بخود یہ طے کرے کہ اس کام کو کس ورکفلو کے ذریعے مکمل کیا جائے، اور پھر اسے شروع کر دیا جائے۔

یہ ہمارے پہلے استعمال کیے جانے والے "منصوبہ بندی ماڈل" اور "سکل" سے بنیادی طور پر مختلف ہے۔ منصوبہ بندی ماڈل میں کام کو مزید تفصیل سے تقسیم کیا جاتا ہے، لیکن یہ ضروری نہیں کہ کسی منطقی کام کے عمل کے مطابق ہو، جب تک آپ کے پرومپٹس کو منظم نہیں کر لیتے، تب تک ا验收 معایار شامل نہیں ہو سکتے (جو Research کے لیے بہت اہم ہیں)، اسی طرح آپ کو صرف اس صورت میں ہی پرومپٹس کی ضرورت ہوگی جب آپ چاہیں کہ وہ کچھ ہارنس قواعد کو پہلے سے ڈال دے۔

لیکن ڈائنانک ورک فلو خودکار طور پر قبولیت منطق، نتائج کا احاطہ، اور مقابلہ کن تصدیق جیسی چیزیں شامل کر دیتا ہے۔

ٹرگر کرنا بہت آسان ہے، صرف cc میں /deep-research استعمال کریں اور کچھ ریسرچ ٹیمپلیٹس اور شروعاتی مواد فراہم کریں، اگر آپ الگ طور پر ڈائنامک ورک فلو کی صلاحیت استعمال کرنا چاہتے ہیں تو پرومپٹ یا براہ راست ultracode کہیں، استعمال سے پہلے توجہ دیں کہ ٹوکن کی استعمال کی مقدار عام طور پر دہ گنا ہو جاتی ہے۔

تین: اندر موجود ستھا ورک فلو ماڈلز

ڈائنامک ورک فلو کی بنیاد پر، افسران کی طرف سے تعریف کی گئی چھ بنیادی شیڈولنگ ماڈلز ہیں، جو اسے عام بات چیت/ایجینٹ/اسکل سے زیادہ طاقتور بناتی ہیں۔

درحقیقت، ان چھ ماڈلز کے پیچھے صرف دو مرکزی سوالات ہیں: کام کو کیسے تقسیم کیا جائے؟ اور نتائج کو کیسے ملایا جائے؟ ان چھوں کو الگ کرنا ان دونوں کے ترتیب و ترکیب کے لیے ہے۔

3.1 راؤٹنگ موڈ (کلاسیفائی اینڈ ایکٹ)

ایک ایجنٹ سب سے پہلے کام کی قسم کا تعین کرتا ہے، پھر اسے سب سے مناسب مخصوص ایجنٹ کو منتقل کرتا ہے۔ مرکزی منطق راؤٹنگ کا انتخاب ہے، نہ کہ متوازی یا دہرائی جانے والی عمل۔ ایک کام صرف ایک راستہ اختیار کرتا ہے، باقی تمام راستے مکمل طور پر نہیں چلتے۔

مثلاً، میں تین پیش گئے سب ایجینٹ کردار رکھ سکتا ہوں: ایک ڈیٹا کی سختی سے تصدیق کرنے والا تجزیہ ایجینٹ، ایک لکھنے میں ماہر آؤٹ پٹ ایجینٹ، اور ایک خاص طور پر خامیاں تلاش کرنے والا چیلنج ایجینٹ۔ راؤٹنگ لیئر فیصلہ کرے گا کہ موجودہ ذیر کام کس کو سونپنا ہے، نہ کہ ایک ایجینٹ سب کچھ اپنے ذمے لے۔

اس ماڈل کی قیمت یہ ہے: درستگی اور محتاط استعمال، جس میں ہر ایجینٹ کا پرامپٹ دوسرے مقاصد سے مکمل طور پر الگ ہوتا ہے اور عمودی گہرائی کے ساتھ تلاش کرتا ہے۔ ٹوکن کا استعمال کم سے کم، اور جواب کی رفتار سب سے تیز ہوتی ہے۔ ذمہ داریوں کا تقسیم بہت واضح ہے۔

نقص بھی واضح ہیں، جیسے کہ "ٹیکنیکل اور اکاؤنٹ دونوں مسائل کا مجموعہ" جیسے سرحدی ادراک والے کاموں کو سنبھالنے کی کمزور صلاحیت۔

3.2 تقسیم اور ضم کرنا (Fan-out & Merge)

یہ میرا سب سے زیادہ استعمال کیا جانے والا ماڈل ہے، جس کا مرکزی منطق متوازی + ادغام ہے۔ کام کو N مستقل ذیلی کاموں میں تقسیم کیا جاتا ہے جو ایک ساتھ چلتے ہیں، اور سب مکمل ہونے کے بعد ایک ساتھ ادغام کر دیے جاتے ہیں۔

فائدہ تیزی اور علیحدگی میں ہے۔ کل وقت تقریباً سب سے سستے ذیلی کام کے برابر ہوتا ہے، نہ کہ تمام ذیلی کاموں کا مجموعہ۔ ہر ذیلی کام کا الگ کنٹیکس ہوتا ہے، جو دوسرے ذیلی کاموں سے متاثر نہیں ہوتا اور کسی بھی ذیلی کام کے شور کی وجہ سے دوسرے ذیلی کام متاثر نہیں ہوتے۔

کمزوری یہ ہے کہ ٹوکن لاگت N گنا سیریل ہوتی ہے، اور مجموعی طبقہ (سینٹھیسائز) خود بھی مشکل ہے — N راستوں کے غیر مطابقت پذیر نتائج کو کیسے ادغام کیا جائے ایک ڈیزائن چیلنج ہے۔ اگر ذیر ایسائنمنٹ اچھی طرح سے تقسیم نہ ہو تو کچھ چیزیں نظرانداز ہو سکتی ہیں یا دوبارہ کور کی جا سکتی ہیں۔

3.3 مقابلہ جانچ (Adversarial Verification)

مرکزی منطق یہ ہے کہ ایک ہی نتیجہ کے لیے متعدد ایجینٹس کو "الٹا دلیل" کے زاویے سے چیلنج کرنے دیا جائے، اور صرف اکثریتی ووٹس کے ساتھ ہی اسے منظور کیا جائے۔

فائدہ یہ ہے کہ چونکہ ویریفائر ورکر کے خیالات نہیں جانتا، صرف نتائج دیکھتا ہے، اس لیے "ماڈل کو اپنے لکھے گئے کوڈ کی جانچ کرنے کے" دوران خود جائزہ لینے کا جانبدارانہ رجحان ساختی طور پر ختم ہو جاتا ہے۔

یہ ماڈل ایک طویل عرصے سے میرے لیے ایک بڑی پریشانی کا حل ہے: ہم اکثر AI کے ساتھ بولچال کے انداز میں بات کرتے ہیں، لیکن AI اپنے توقعات کے مطابق جواب دینے کا رجحان رکھتا ہے، جس سے "تصدیقی پیشگوئی" پیدا ہوتی ہے۔ مقابلہ جانچ کے ذریعے AI کو مخالف مثالوں کو تلاش کرنے اور اپنے خیالات کے مطابق نہ بلکہ ڈیٹا اور تجربات کی بنیاد پر تصدیق کرنے کے لیے مجبور کیا جاتا ہے۔

لیکن، اس بات کی تصدیق کرتے وقت، اگر وہ غلط فیصلہ کرتا ہے، تو وہ ورکر کو بھٹکا دے گا اور اسے ویریفائر کے ساتھ مطابقت رکھنے کے لیے مجبور کر دے گا۔ اس لیے، رائے کی بجائے قابل دوہرائی حقائق پر مبنی ہونا بہتر ہے۔

میں صرف ایک مزاح کے طور پر کہ رہا ہوں، اگر آپ AI کو مسائل تلاش کرنے کے لیے کہیں تو وہ لامحدود طور پر مسائل تلاش کر سکتا ہے، اس لیے آپ کو اس کے مسائل تلاش کرنے کے دائرہ کار کو محدود کرنا ہوگا۔

3.4 تخلیق اور فلٹر کرنا (Generate & Filter)

مرکزی منطق تقسیم اور پھر احاطہ کرنا ہے۔ پہلے جان بوجھ کر زیادہ سے زیادہ ممکنہ حل تیار کیے جاتے ہیں، پھر روبرک کے ذریعے ان میں سے صرف بہترین اور اعلیٰ اعتماد والے نتائج کو برقرار رکھا جاتا ہے۔

ایک ایجنٹ کو ایک "اچھا" جواب دینے کے بجائے، اسے دس جوابات تیار کرنے دیں اور پھر تصدیق کی لایر کے ذریعہ ان میں سے بہترین کو منتخب کریں۔ اس لیے فائدہ تنوع میں ہے۔ متعدد جنریٹرز مختلف حکمت عملیوں اور مختلف پرامپٹس کے ساتھ کام کر سکتے ہیں، جس سے انسانی طور پر تصور نہیں کیا جا سکنے والا حل نکل سکتا ہے، اور فلٹرنگ کا مرحلہ آخری آؤٹ پٹ کی معیار کو بہت زیادہ مرکوز کرتا ہے۔

کمزوری یہ ہے کہ فلٹر کے روبرک کی کوالٹی فائنل ایفیکٹ کو براہ راست متاثر کرتی ہے، روبرک کا غلط ڈیزائن پورے پروسیس کو برباد کر دیتا ہے

اس کا استعمال تب ہوتا ہے جب صحیح جواب پہلے سے معلوم نہ ہو، کئی ممکنہ اختیارات میں سے بہترین کا انتخاب کرنا ہو، اور تنوع کی واضح ضرورت ہو۔

فان آؤٹ-انڈ-سنتھیسائز کے ساتھ صرف سطحی شبہہ ہے: دونوں "متعدد متوازی → ایک یکتا آؤٹ پٹ" ہیں، جو سب سے زیادہ الگ کرنے میں مشکل ہیں۔

اصل فرق مقصد میں ہے: فین آؤٹ کی ہر شاخ ایک کام کے مختلف حصوں کو سنبھالتی ہے، اور نتائج مکمل کرنے والے ہوتے ہیں، جب انہیں ملا جاتا ہے تو تمام شاخیں حصہ ڈالتی ہیں؛ جنریٹ اینڈ فلٹر کی ہر شاخ ایک ہی کام کو سنبھالتی ہے، اور نتائج مقابلہ کرنے والے ہوتے ہیں، جب انہیں ملا جاتا ہے تو زیادہ تر کو چھوڑ دیا جاتا ہے۔ پہلا "پازل" ہے، دوسرا "مین آف دی ائیر"۔

3.5 ٹورنامنٹ ماڈ (Tournament)

مرکزی منطق مقابلہ اور نکال دینا ہے۔ N ایجنٹس الگ الگ ایک ہی کام کرتے ہیں، جو جوڑے کے مقابلے کے ذریعے روزانہ نکال دیے جاتے ہیں اور آخرکار بہترین حل منتخب کیا جاتا ہے۔

میں نے پہلے اسے دستی طور پر کیا تھا — ایک ہی کوڈ میں تبدیلی کو دو یا تین ورژنز پر چلایا، پھر AI کو بتایا کہ کون سا بہتر ہے۔ اب اسے براہ راست ورک فلو میں شمولیت دی جا سکتی ہے۔

فائدہ اس کی استحکام کے جائزہ لینے میں ہے۔ دو سے دو کا موازنہ ("A اور B میں سے کون بہتر ہے؟") مطلق اسکورنگ ("A کو اسکور دیں") کے مقابلے میں کہیں زیادہ مستحکم ہے، کیونکہ اسکورنگ کے معیار کے تبدیل ہونے کا مسئلہ ختم ہو جاتا ہے۔ نتائج کئی دور کے مقابلے کے بعد نکلتے ہیں، جس سے فاتح کی قابلِ اعتمادیت زیادہ ہوتی ہے۔

Generate-And-Filter کے ساتھ بھی سطحی طور پر ملتا جلتا ہے: دونوں کئی امیدواروں میں سے بہترین کا انتخاب کرتے ہیں۔ اہم فرق انتخاب کے طریقہ کار میں ہے: ٹورنامنٹ pairwise judge کا استعمال کرتا ہے، جو دو سے دو کا مقابلہ کرتا ہے، یعنی "امیدواروں کو آپس میں مقابلہ کرنے دیا جائے"۔ جب روبرک قابلِ تقدیر نہ ہو اور جائزہ لینا بنیادی طور پر نسبتی ہو، تو یہ زیادہ قابلِ اعتماد ہوتا ہے۔

3.6 لوپ موڈ

مرکزی منطق تطبیقی تکرار ہے، لگاتار کوشش کرتے رہیں، رکاوٹ کا سامنا ہو تو غلطیوں کی معلومات جمع کریں، سیاق و سباق شامل کریں، اور قبولیت کے معیار تک پہنچنے تک دوبارہ کوشش کرتے رہیں۔

اس کا بنیادی طور پر AI کی تصادفیت کے خلاف لڑنا ہے: کئی بار کوشش کریں، ضرور بہتر نتائج مل جائیں گے۔ لیکن زیادہ بالغ طریقہ یہ ہے کہ مخالف تصدیق کو ملا کر ہر دور کو زیادہ معلومات کے ساتھ انجام دیا جائے، صرف تصادفی طریقے پر انحصار نہ کیا جائے۔

مزیت یہ ہے کہ وہ کام کی مقدار ناپیدہ والے کاموں کو سنبھال سکتی ہے۔ دوسرے پانچ مودس سب یہ فرض کرتے ہیں کہ کام کے حدود معلوم ہیں، جبکہ "Loop Until Done" ایک منفرد مود ہے جو "یہ نہیں جانتے کہ کتنے راؤنڈ کرنے ہیں" کو سنبھالتا ہے۔

کمزوریاں ممکنہ بیرون کنٹرول کے خطرے ہیں — اگر روکنے کی شرائط اچھی طرح سے ڈیزائن نہیں کی گئیں تو انفرادی حلقوں میں لامحدود دوہرائی ہو سکتی ہے۔ ہر راؤنڈ کا ایجنٹ ایک نیا کنٹیکس ہوتا ہے، جو راؤنڈز کے درمیان حالت کو جمع نہیں کر سکتا (سوائے اس کے کہ فائل میں واضح طور پر لکھا جائے)۔

چوتھا، میرا اپنا مہارت اور سرکاری عمل کے درمیان مقابلہ

جس تک دائنامک ورک فلو نہیں آیا، میں نے اپنی خود کی deep-research کا ڈیزائن کیا تھا۔ میری اس سکل کا منطق اس طرح تھا:

کوئی صرف ایک سادہ معلومات دیں (مثلاً کوئی پروجیکٹ نے کوئی نیا فیچر لانچ کیا ہے)
AI کو تمام متعلقہ معلومات کے لیے تلاش کریں: آفیشل دستاویزات، سورس کوڈ، مارکیٹ رائے
معلومات کو مفید خلاصہ میں دبائیں
کئی ایجینٹ کرداروں کے ذریعے مقابلہ انالیسس کریں اور رپورٹ تیار کریں
آٹو ڈپلیکیٹ ہٹائیں، کیونکہ متعدد ایجنٹس کا مواد بہت زیادہ دہرایا جاتا ہے

میں نے کچھ عرصہ استعمال کیا ہے، اور مجھے یہ بہت اچھا لگا۔ لیکن اس میں ایک بنیادی کمی ہے: مقصد کی طرف مائل ہونے کی کمی۔

اور اکثر اوقات، یہاں تک کہ پانچویں مرحلے کی ڈپلیکیٹ حذف کے باوجود، وہ اکثر قیمتی معلومات کو حذف کر دیتا ہے، اگر آپ ڈپلیکیٹ حذف نہیں کرتے تو، اسکل آپ کو ایک دس ہزار الفاظ کا مضمون دے دے گا جس میں تمام معلومات ہیں، لیکن یہ آپ کو براہ راست نہیں بتائے گا کہ "اس بات کا آپ کے ساتھ کیا تعلق ہے، آپ کو کیا کرنا چاہیے"۔

تاہم، تحقیق "فیصلہ سازی" کے لیے کی جاتی ہے، جس کی وجہ سے بہت سے مہارت صرف تحقیق تک محدود رہ جاتی ہیں، جنہیں 80 نمبر ملتے ہیں لیکن سب سے اہم 20 نمبر کم ہوتے ہیں۔

اس لیے کہ AI کو ابتدائی تحقیق مکمل کرنے کے بعد، مطمئن اور جامع نتیجہ حاصل کرنے کے لیے دس بار مزید سوچنے اور بات چیت کرنی پڑتی ہے۔

آفسٹل ڈائیمنیک ورک فلو نے کیا اور کیا کیا؟

اس ہفتے کے کچھ پیچیدہ تحقیقی کاموں کے تجربات کے ذریعے، میں نے پایا کہ Claude Code میں داخلہ ڈیپ ریسرچ ورک فلو (نوٹ کریں کہ صرف مہارت نہیں، بلکہ cc میں اندرونی طور پر ڈالے گئے ماڈیول) کے مقابلے میں، میری اپنی مہارت کے بنیاد پر کچھ اہم مراحل زیادہ ہیں:

مسئلہ کے تجزیہ کے لیے: یہ فوراً تلاش شروع نہیں کرتا، بلکہ پہلے سوالات پوچھتا ہے، میرے سوال کو متعدد ذیلی سوالات میں تقسیم کرتا ہے: آپ کو حقیقت میں کیا سمجھنا ہے؟ اس بات کا آپ کے ساتھ کیا تعلق ہے؟ کون سے پہلوؤں پر گہرائی سے غور کیا جانا چاہیے؟ میں نے ابھی تک اس مرحلے کو نظرانداز کر دیا تھا۔
credibility assessment: evaluate each piece of information for falsifiability, similar to authority scoring in traditional SEO— is the source reliable? how many citations does it have? this is a step I hadn’t thought to include before.
کراس ڈیلیٹ کے بجائے اوسط میں ضم کریں: میں نے پہلے تمام نتائج کو اوسط سے منتخب کیا، جس کی وجہ سے دستاویز بہت بڑی ہو گئی۔ ڈائنامک ورک فلو ہر نتیجہ کے لیے متعدد ایجنٹ ووٹنگ کرے گا، اور جن نتائج کے ووٹ کم ہوں گے، انہیں حذف کر دیا جائے گا، صرف ضم نہیں کیا جائے گا۔
ہدف کی طرف مائل آؤٹ پٹ: آخری رپورٹ معلومات کا اکٹھا کرنا نہیں، بلکہ آپ کے اصل ہدف کے حوالے سے ججمنٹ اور تجاویز فراہم کرنا ہے۔ اس کا کلیدی نقطہ اس کی پیش گوئی شدہ متعدد ایجنٹس کی ڈیپلویمنٹ صلاحیت ہے۔ میں نے پہلے کیوں اسکلز میں آخری ہدف کی طرف مائلی نہیں دیکھی، کیونکہ بہت ساری معلومات کے بعد ہدایات کا وزن کم ہو جاتا تھا۔

یہ مکینزم کن مسائل کو حل کرتے ہیں؟

AI کے لمبے کاموں کے کچھ مخصوص مسائل کو ہدف بنایا گیا ہے:

ہدف کا تبدیل ہونا: کام شروع ہونے پر حالت اچھی ہوتی ہے، لیکن درمیان میں آپ کو نہیں معلوم ہوتا کہ آپ کیا کر رہے ہیں، اور اختتام پر آپ دوبارہ رفتار حاصل کر لیتے ہیں — جیسے انسان کلاس میں دھیان بھٹک جائے۔ جتنا لمبا کام ہوگا، اتنا ہی زیادہ واضح ہوگا۔

بہت جلد روکنا: دوڑتے وقت مشکل کا سامنا ہوتا ہے، AI سمجھتا ہے کہ اس نے "ختم" کر دیا ہے اور رک جاتا ہے، جبکہ قبولیت کی معیارات پورے نہیں ہوئے۔

کنٹیکس پOLLUTION: ایک منفرد ایجنٹ کو پیچیدہ کام کے لیے استعمال کرنا، جس میں پہلے بہت سارے پرامپٹس ہوتے ہیں، بعد کے اجراء کے لیے جگہ کو کم کر دیتا ہے۔ بہتر طریقہ یہ ہے کہ پہلے والے پرامپٹس کو کچھ کے اندر محدود رکھا جائے اور کنٹیکس کو متعدد ایجنٹس پر تقسیم کیا جائے۔

آؤٹ پٹ بائس: AI آپ کی توقعات کے مطابق جواب دینے کا رجحان رکھتا ہے، بولچال کی زبان میں پوچھے گئے سوالات اس مسئلے کو زیادہ فعال کرتے ہیں۔

جبکہ ڈائنامک ورک فلو اس چاروں مسائل کو ساختی طریقے سے حل کرتا ہے: جلدی ختم ہونے سے روکنے کے لیے خودکار ایکسٹینشن میٹرکس شامل کرنا؛ متوازی طور پر حوالہ جات کو الگ کرنا؛ تصدیق کے مقابلے سے آؤٹ پٹ کے جھکاؤ کو روکنا؛ اور مسئلہ کو ٹکڑوں میں تقسیم کرکے AI کو مرحلہ وار پابندیاں عائد کرنا تاکہ وہ پہلے مقصد کو سمجھے اور پھر کام شروع کرے۔

پانچویں، خلاصہ

آخر میں، مصنف جو ایک طویل عرصے سے تحقیقی محقق ہے، اس نئے CC مکینزم کو بہت متاثر کیا ہے، جس میں روتنگ کا انتخاب، تقسیم اور اجتماع، مقابلہ کی تصدیق، پیداواری فلٹر، ٹورنامنٹ انتخاب، اور لوپ سائکل سمیت چھ قسمیں شامل ہیں جو زیادہ تر پیچیدہ تحقیقی کاموں کی شیڈولنگ کی ضروریات کو پورا کرتی ہیں۔

مجھے ایجنٹ شیڈولنگ کے لیے ہاتھ سے ڈیزائن کرنے کی ضرورت نہیں، اور نہ ہی مجھے خود ڈپلیکیٹس کو ہٹانے اور کراس ویریفیکیشن کرنے کی ضرورت ہے، یہ سب ورک فلو میں ہی شامل ہو چکا ہے۔

اور وہ خاص طور پر ایسے مسائل پر سوچنے کے لیے موزوں ہے جہاں معلومات کی کمی ہو اور تحقیقی سوالات ہوں، کیونکہ اس کا فطری متعدد ایجینٹ شیڈولنگ اور ٹاسک کے مقاصد کا تقسیم کرنا اس کی عام صلاحیت کو مزید بڑھاتا ہے۔ دراصل، تین سال پہلے کے AI نے پہلے ہی ایسے مسائل کو حل کرنے میں بہترین کام کیا تھا جن میں متعدد پابندیاں تھیں اور صرف بہت واضح چھوٹے مسائل کو حل کرنے کے لیے محدود تھے، لیکن AI کا اصل کوالٹیٹو تبدیلی عام صلاحیت میں تھی، جس نے اسے اپنے مقابلہ کرنے والوں سے الگ کیا — جو صرف کوڈ سے شروع ہو کر اصل ایجینٹ بن گئے، اور ایک مخصوص مسئلہ کو حل کرنے والے سٹیٹک سسٹم سے بدل کر کسی بھی مسئلے کے لیے موزوں بن گئے۔

تو ڈائنامک ورک فلوز صرف "زیادہ ذکی ایک بار کی بات چیت" نہیں ہیں، بلکہ تحقیق کے عمل کو خود ساختی بناتے ہیں۔

میں اب اس تحقیق کے لیے صرف 3-4 بار گفتگو شروع کرنے کی ضرورت ہے، جبکہ متعلقہ ٹوکن کی استعمال کی مقدار دہ گنا بڑھ گئی ہے۔

تو اس لیے 3-4 بار اور ضروری ہے؟ میرے خیال میں اس کی بنیادی وجہ ان ضروریات کے فرق ہے۔

سب سے پہلا معیار تصدیق کا سخت ہونا ہے، میں بنیادی طور پر بلاکچین پر نئی ٹیکنالوجیوں پر تحقیق کرتا ہوں، بہت سی باتیں، آفیشل دستاویزات پیچھے رہ جاتی ہیں، اور زیادہ قابلِ حوالہ اوپن سورس کوڈ، بلاکچین ٹرانزیکشنز اور دیگر ڈیٹا موجود ہوتے ہیں، لیکن اب تک AI ڈیفالٹ طور پر آفیشل دستاویزات پر ہی مبنی ہے، حقیقی تصدیق پر نہیں۔

دوسرا مکمل طور پر عبور کرنے والی گہری سوچ ہے، جس کا حل ورک فلو پیش گئیں کے ذریعے کچھ حد تک نکالا جا سکتا ہے ( مختلف ابعاد کے سب ایجنٹس کو پیش گئیں طور پر تعریف کر کے) ایک ہی مسئلے پر سوچنے کے لیے۔ لیکن AI کو زیادہ تر مقبول سوچ کے ماڈلز میں مہارت ہے، انتہائی نئے، بہت گہرے، اور ڈیٹا کے بنیاد پر کم ہونے والے مسائل کے لیے تھوڑا کم مؤثر ہے۔

تیسری بات حل کے ڈیزائن اور تصدیق کی ہے، حل کا مقصد صرف پیش کرنا نہیں بلکہ اس کی تصدیق اور سپورٹ کرنا ہے، یہ موجودہ مکینزم، سرمایہ کاری اور لاگت کے اندازہ کے ساتھ متعلق ہے، اگر AI کو اچھی طرح تربیت دی جائے تو بہتر نتائج حاصل کیے جا سکتے ہیں، لیکن اس سے عامیانہ صلاحیتوں کے خلاف ہوتا ہے۔

آخر میں معلومات کا انتہائی تنقیح ہے، جس کے لیے آپ کو اپنی معلومات کے مستقبل کی سمجھ کو سمجھنا ہوگا—کچھ لوگوں کے پاس کوئی بنیادی تجربہ نہیں ہے، اس لیے آپ کو ان کے لیے انسانی شکل میں بیان کرنا ہوگا، جبکہ دوسرے سننے والوں کو صرف ایک جملہ ان کو متاثر کر دے۔