12 قواعد کلاؤڈ کوڈ کی غلطی کی شرح کو 3% تک کم کرتے ہیں

icon MarsBit
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
مارس بٹ کے مطابق، اینڈری کارپاتھی کی 2026 کی کلاؤڈ کے کوڈنگ کی غلطیوں پر تنقید کے نتیجے میں ایک CLAUDE.md فائل تیار کی گئی جس میں 4 کرپٹو کرنسی کے قواعد شامل تھے۔ تینوں کوڈ بیسز پر چھ ہفتے کے ٹیسٹنگ کے بعد، متعدد مرحلہ ایجینٹ ورک فلو میں مسائل کو درست کرنے کے لیے 8 مزید قواعد شامل کیے گئے۔ اپڈیٹڈ 12 قواعد نے غلطیوں کی شرح 41% سے 3% تک کم کر دی، جبکہ قواعد کی پابندی پر کم اثر پڑا۔ سود کی شرح کی خبروں کا نتائج پر کوئی اثر نہیں پڑا۔

ویرایشگر کا نوٹ: جنوری 2026 میں، اینڈری کارپاتھی کی کلاؤڈ کے کوڈ لکھنے پر شکایت نے ایک ایسا فائل پیدا کیا جو ظاہری طور پر چھوٹا لیکن AI پروگرامنگ ورک فلو میں انتہائی اہم ہے: CLAUDE.md۔ فورسٹ چینگ نے بعد میں ان مسائل کو 4 قواعد کی شکل میں ترتیب دیا، جو کلاؤڈ کے کوڈنگ کے دوران عام غلطیوں — خاموش افتراضات، زیادہ پیچیدہ ڈیزائن، غیر متعلقہ کوڈ کو نقصان پہنچانا، اور واضح کامیابی کے معیار کی کمی — کو روکنے کی کوشش کرتے ہیں۔

لیکن کچھ ماہوں کے بعد، کلود کوڈ کے استعمال کے منظر نامہ صرف "ماڈل کو کوڈ کا ایک حصہ لکھنے کے لیے" تک محدود نہیں رہا۔ متعدد مراحل کے ایجینٹ، ہُک چین ٹرگر، سکل لوڈنگ اور متعدد کوڈ ریپوزٹریز کے درمیان تعاون عام ہو گئے، جس کے نتیجے میں نئے ناکامی کے انداز ظاہر ہوئے: ماڈل لمبے کاموں میں بیکار ہو جاتا ہے، ٹیسٹ کامیاب ہوتے ہیں لیکن حقیقی منطق کی تصدیق نہیں ہوتی، منتقلی مکمل ہو جاتی ہے لیکن خامیاں خاموشی سے نظرانداز کر دی جاتی ہیں، اور مختلف کوڈ اسٹائل غلط طریقے سے ملا دیے جاتے ہیں۔

مصنف نے 6 ہفتے میں 30 کوڈ ریپوزٹریز کا امتحان لیا اور کارپاتھی کے اصل 4 قواعد کے ساتھ مزید 8 قواعد شامل کیے، تاکہ AI پروگرامنگ کے نئے مسائل — جو ایک بار کی مکمل کردہ تجاویز سے ایجنٹ کی تعاون تک منتقل ہو گئے ہیں — کو کور کیا جا سکے۔

نیچے متن ہے:

2026 کی جنوری کے آخر میں، اینڈری کارپاتھی نے ایک ٹویٹ سلسلہ شیئر کیا جس میں کلاؤڈ کے کوڈ لکھنے کے انداز کی تنقید کی۔ انہوں نے تین قسم کے عام مسائل پر زور دیا: بغیر کسی وضاحت کے غلط فرضیات بنانا، زیادہ پیچیدہ بنانا، اور اس کوڈ میں غیر متعلقہ نقصان پہنچانا جس میں کوئی تبدیلی کی ضرورت نہیں تھی۔

فورسٹ چانگ نے اس ٹویٹ سلسلے کو دیکھا، اس میں موجود شکایات کو 4 قوانین کی شکل میں ترتیب دیا، ایک الگ CLAUDE.md فائل میں لکھا، اور GitHub پر شائع کر دیا۔ اس پروجیکٹ کے شروع ہونے کے پہلے دن ہی 5,828 اسٹار حاصل ہوئے، دو ہفتے میں 60,000 بار سیو کیا گیا، اور اب یہ 120,000 اسٹار کے ساتھ 2026 کا سب سے تیزی سے بڑھتے ہوئے ایک فائل والے کوڈ ریپوزٹری بن چکا ہے۔

ایجنٹ

اس کے بعد، میں نے اسے 6 ہفتے کے دوران 30 کوڈ ریپوزٹریز پر ٹیسٹ کیا۔

یہ چار قواعد حقیقت میں کام کرتے ہیں۔ جو غلطیاں پہلے تقریباً 40 فیصد احتمال کے ساتھ پیش آتی تھیں، وہ ان قواعد کے اطلاق کے لیے مناسب کاموں میں 3 فیصد سے کم ہو گئیں۔ لیکن مسئلہ یہ ہے کہ یہ ٹیمپلیٹ اصل میں جنوری میں کلاؤڈ کے کوڈ لکھنے کے دوران پیدا ہونے والی غلطیوں کو حل کرنے کے لیے تیار کیا گیا تھا۔

2026ء کے مئی تک، کلوڈ کوڈ ایکوسسٹم کے سامنے مختلف مسائل کھڑے ہو چکے تھے: ایجینٹس کے درمیان تنازعات، ہُک کی زنجیری سرگرمیاں، اسکلز کے لوڈنگ میں تنازعات، اور سیشن کے درمیان متعدد مراحل کے عمل کے خراب ہونے وغیرہ۔

تو، میں نے مزید 8 قواعد شامل کیے ہیں۔ یہاں CLAUDE.md کا مکمل 12 قاعدہ ورژن ہے: ہر قاعدہ کیوں شامل کیا گیا، اور اصل کارپاتھی ٹیمپلیٹ کہاں 4 جگہوں پر خاموشی سے ناکام ہو جائے گا۔

اگر آپ وضاحت کو چھوڑنا چاہتے ہیں اور براہ راست کاپی کرکے استعمال کرنا چاہتے ہیں، تو مکمل فائل آخر میں دی گئی ہے۔

یہ کیوں اہم ہے

کلود کوڈ کا CLAUDE.md، پورے AI پروگرامنگ ٹیکنالوجی اسٹیک میں سب سے کم تخمینہ کیا گیا فائل ہے۔ زیادہ تر ڈویلپرز عام طور پر تین قسم کی غلطیاں کرتے ہیں:

سب سے پہلے، اسے ایک ترجیحی کچرے کے طور پر استعمال کریں، اپنی تمام عادات اس میں ڈال دیں، اور آخرکار اس کا سائز 4000 سے زیادہ ٹوکن تک پہنچ جائے، جس کی وجہ سے قواعد کی پابندی کی شرح 30 فیصد ہو جائے۔

دوم، اسے بالکل استعمال نہ کریں اور ہر بار نیا پرامپٹ دیں۔ اس سے 5 گنا ٹوکن کا ضیاع ہوگا اور مختلف سیشنز کے درمیان ایک مسلسل رابطہ نہیں ہوگا۔

تیسری بات، ایک ٹیمپلیٹ کو کاپی کرنے کے بعد اسے کبھی نہیں چیک کرنا۔ یہ دو ہفتے تک کام کر سکتا ہے، لیکن کوڈ بیس میں تبدیلیوں کے ساتھ آپ کے بغیر احساس کے اس کا کام بند ہو جائے گا۔

Anthropic کی آفیشل دستاویز میں واضح طور پر کہا گیا ہے: CLAUDE.md صرف تجویزی ہے۔ کلاؤڈ اسے تقریباً 80% وقت پر فالو کرتا ہے۔ جب 200 لائنز سے زیادہ ہو جائیں، تو پابندی کی شرح واضح طور پر کم ہو جاتی ہے، کیونکہ اہم قواعد اس میں شامل ہو جاتے ہیں۔

کارپاتھی کا ٹیمپلیٹ اس مسئلے کو حل کرتا ہے: ایک فائل، 65 لائنز، 4 قواعد۔ یہ کم سے کم بنیاد ہے۔

لیکن حد مزید بڑھائی جا سکتی ہے۔ اس کے بعد 8 قواعد شامل کرنے سے، یہ صرف کارپاتھی کے 2026ء جنوری میں مسائل کو نہیں، بلکہ 2026ء مئی میں ظاہر ہونے والے ایجنٹ اورکیشن مسائل کو بھی شامل کرتا ہے—جو مسائل اصل ٹیمپلیٹ کے وقت موجود نہیں تھے۔

اصلی 4 قواعد

اگر آپ نے اب تک فورسٹ چینگ کے ریپو کو نہیں دیکھا ہے، تو پہلے اس بنیادی ورژن کو دیکھیں:

قانون 1: کوڈنگ سے پہلے سوچیں۔

بے نقاب فرضیات نہ بنائیں۔ اپنی فرضیات کو واضح کریں، اور توازن کے نقاط کو سامنے لائیں۔猜测 سے پہلے سوال کریں۔ جب کوئی سادہ تر حل موجود ہو، تو اس کے خلاف آگے آئیں۔

قانون 2: سادگی کو ترجیح دیں۔
مسئلہ کو حل کرنے کے لیے کم سے کم کوڈ استعمال کریں۔ تصوراتی فنکشنز شامل نہ کریں۔ ایک بار کے کوڈ کے لیے ابسترکشن لیور نہ بنائیں۔ اگر ایک تجربہ کار انجینئر اسے زیادہ پیچیدہ سمجھے، تو اسے سادہ بنائیں۔

Rule 3: Surgical modifications.
صرف ضروری تبدیلیاں کریں۔ مجاور کوڈ، تبصرے یا فارمیٹ کو بے ضرورت "بہتر" نہ بنائیں۔ جو چیز خراب نہیں ہے اسے دوبارہ ترتیب نہ دیں۔ موجودہ انداز کے ساتھ مطابقت رکھیں۔

نکتہ 4: مقصد کی طرف موزوں عمل کریں۔
کامیابی کے معیار کو پہلے تعریف کریں، پھر تکرار کریں جب تک تصدیق مکمل نہ ہو۔ کلود کو ہر قدم پر بتائیں کہ کیا کرنا ہے، بلکہ اسے بتائیں کہ کامیاب نتیجہ کیا ہونا چاہیے، اور اسے خود تکرار کرنے دیں۔

یہ 4 قواعد میرے لیے انسانی نگرانی کے بغیر کلاؤڈ کوڈ سیشن میں دیکھے جانے والے تقریباً 40 فیصد ناکام ہونے کے پیٹرنز کو حل کر سکتی ہیں۔ باقی تقریباً 60 فیصد مسائل ان خالی جگہوں میں چھپے ہوئے ہیں۔

ایجنٹ

میں نے 8 نئے قواعد شامل کیے ہیں، اور اس کی وجہ

ہر قاعدہ ایک حقیقی لمحے سے ماخوذ ہے: کارپاتھی کے اصل 4 قواعد اب کافی نہیں ہیں۔ میں پہلے اس منظر کو بیان کروں گا، پھر متعلقہ قاعدہ دوں گا۔

Rule 5: Do not let the model perform non-linguistic tasks

کارپاتھی کے قواعد اس بات کو شامل نہیں کرتے۔ اس لیے ماڈل نے فیصلے کرنے شروع کر دیے جو یقینی کوڈ کے ذریعے ہونے چاہئیں: کیا API کال کو دوبارہ کوشش کی جائے، ایک پیغام کیسے راؤٹ کیا جائے، اور کب پروسیسنگ کو اپ گریڈ کیا جائے۔ نتیجہ یہ ہوا کہ ہر ہفتے کے فیصلے مختلف ہوتے ہیں۔ آپ کو ہر ٹوکن پر 0.003 امریکی ڈالر کی شرح سے چارج ہونے والی، عدم استحکام والی if-else مل رہی ہے۔

وہ لمحہ ایسا تھا کہ ایک کوڈ تھا جو Claude کو "503 کا سامنا ہونے پر دوبارہ کوشش کرنی چاہیے یا نہیں" یہ فیصلہ کرنے کے لیے بلاتا تھا۔ اس نے شروع میں اچھی طرح کام کیا اور دو ہفتے تک مستقل رہا، لیکن پھر اچانک بے ثبات ہو گیا کیونکہ ماڈل نے درخواست کے جسم کو بھی جائزہ دینے کے لیے حوالہ بنالیا۔ دوبارہ کوشش کی پالیسی بے ترتیب ہو گئی کیونکہ پرامپٹ خود بخود بے ترتیب تھا۔

قانون 6: سخت ٹوکن بجٹ مقرر کریں، کوئی استثناء نہیں

CLAUDE.md کے لیے کوئی بجٹ کی حد نہ ہونا، ایک خالی چیک کے برابر ہے۔ ہر سائکل میں 50,000 ٹوکن کا کنٹیکس ڈھانچہ بن سکتا ہے۔ ماڈل خود بخود روک نہیں پاتا۔

وہ لمحہ ایسا تھا: ایک ڈیبگنگ سیشن 90 منٹ تک جاری رہی۔ ماڈل 8KB کے ایک ہی خطا کے پیغام کے گرد بار بار دوبارہ کام کر رہا تھا اور آہستہ آہستہ یہ بھول رہا تھا کہ اس نے کون سے اصلاحات کی کوشش کر چکی ہیں۔ آخر میں، اس نے وہی حل پیش کرنے شروع کر دیے جنہیں میں نے 40 پیغامات پہلے ہی مسترد کر دیا تھا۔ اگر ٹوکن کا بجٹ ہوتا، تو یہ عمل 12 منٹ میں ختم ہو جاتا۔

قانون 7: تضاد کو ظاہر کریں، متوسط کا تعامل نہ کریں

جب کوڈ ریپوزٹری کے دو حصے ایک دوسرے کے خلاف ہوں، تو کلاڈ دونوں کو خوش کرنے کی کوشش کرتا ہے اور نتیجے میں ایک بے ترتیب کوڈ لکھتا ہے۔

وہ لمحہ ایسا تھا کہ ایک کوڈ بیس میں دو الگ الگ ایرر ہینڈلنگ ماڈلز تھے: ایک async/await کے ساتھ واضح try/catch، اور دوسرا گلوبل ایرر باؤنڈری۔ کلاؤڈ نے لکھا گیا نیا کوڈ دونوں کو استعمال کر رہا تھا۔ نتیجہ یہ ہوا کہ ایرر ہینڈلنگ دو بار ہو گئی۔ مجھے 30 منٹ لگے کہ سمجھوں کہ ایرر دو بار کیوں نکال دیا گیا۔

قانون 8: پہلے پڑھیں، پھر لکھیں

کارپاتھی کا "جراحانہ ترمیم" کلود کو مجاور کوڈ میں تبدیلی نہ کرنے کو کہتا ہے۔ لیکن اس نے کلود کو یہ نہیں کہا کہ مجاور کوڈ کو سمجھیں۔ اس شرط کے بغیر، کلود وہ نیا کوڈ لکھ دے گا جو 30 لائنز دور موجود کوڈ کے ساتھ تصادم پیدا کرے گا۔

اس لمحے پر، کلوڈ نے ایک موجودہ فنکشن کے ساتھ ایک مکمل طور پر ایک جیسا فنکشن شامل کر دیا، کیونکہ اس نے اصل فنکشن کو پہلے نہیں پڑھا تھا۔ دونوں فنکشنز ایک ہی کام کرتے ہیں۔ لیکن import کے ترتیب کی وجہ سے، نیا فنکشن پرانے فنکشن کو اووررائٹ کر گیا، جبکہ پرانا فنکشن 6 ماہ تک حقیقی واحد معیار کے طور پر قائم رہا تھا۔

قانون 9: ٹیسٹ کرنا اختیاری نہیں ہے، لیکن ٹیسٹ خود مقصد نہیں ہے

کارپاتھی کا "ہدف کی طرف موزوں عمل" یہ ظاہر کرتا ہے کہ ٹیسٹ کامیابی کا معیار ہو سکتے ہیں۔ لیکن عملی طور پر، کلاڈ "ٹیسٹ پاس" کو واحد ہدف سمجھ لیتا ہے، اور ایسے کوڈ لکھتا ہے جو سطحی ٹیسٹس کو پاس کرتے ہیں لیکن دوسری چیزوں کو نقصان پہنچاتے ہیں۔

وہ لمحہ ایسا تھا: کلود نے ایک تصدیق فنکشن کے لیے 12 ٹیسٹ لکھے، جو سب ہو گئے۔ لیکن پروڈکشن میں تصدیق منطق خراب تھا۔ وہ ٹیسٹ صرف یہ تصدیق کر رہے تھے کہ فنکشن "کچھ تو واپس آیا"، نہ کہ یہ کہ وہ صحیح چیز واپس آیا۔ فنکشن ٹیسٹس سے گزرا کیونکہ وہ ایک مستقل واپس کر رہا تھا۔

قانون 10: لمبے وقت تک چلنے والے آپریشنز کے لیے چیک پوائنٹس درکار ہیں

کارپاتھی کا ٹیمپلیٹ ڈیفالٹ طور پر ایک مرتبہ کی تفاعل پر مشتمل ہے۔ لیکن حقیقی کلاؤڈ کوڈ کا کام عام طور پر متعدد مراحل پر مشتمل ہوتا ہے: 20 فائلوں میں ریفیکٹر کرنا، ایک سیشن میں فیچر بنانا، اور متعدد کامٹس کے درمیان ڈیبگ کرنا۔ اگر چیک پوائنٹس نہ ہوں، تو ایک غلط قدم اس سے پہلے کی تمام ترقی کو ضائع کر سکتی ہے۔

وہ لمحہ ایسا تھا: ایک 6 مرحلہ ریکنسٹرکشن ٹاسک مرحلہ 4 پر خراب ہو گئی۔ جب میں نے اسے دریافت کیا، تو کلوڈ نے غلط حالت کے اوپر مرحلہ 5 اور 6 مکمل کر چکا تھا۔ ٹاسک کو ٹوٹنا اور درست کرنے میں جتنا وقت لگا، اس سے پورا ٹاسک دوبارہ شروع کرنے میں زیادہ وقت لگتا۔ اگر چیک پوائنٹس ہوتے، تو مرحلہ 4 پر مسئلہ دریافت ہو جاتا۔

قواعد 11: معاہدہ نئے خیالات سے ترجیح رکھتا ہے

ایک ایسے کوڈ بیس میں جہاں پہلے سے ایک بالغ ماڈل موجود ہے، کلاؤڈ اپنا اپنا انداز متعارف کرانا پسند کرتا ہے۔ چاہے اس کا انداز "بہتر" ہو، لیکن دوسرے انداز کو متعارف کرانا خود اس سے زیادہ بری بات ہے کہ کوئی ایک منفرد ماڈل ہو۔

وہ لمحہ ایسا تھا کہ کلوڈ نے ایک کلاس کمپوننٹ پر مبنی ری ایکٹ کوڈ بیس میں ہوکس شامل کیے۔ یہ کام کر رہا تھا۔ لیکن اس نے کوڈ بیس کے اصل ٹیسٹنگ ماڈل کو بھی خراب کر دیا، کیونکہ وہ ٹیسٹس componentDidMount پر منحصر تھے۔ آخرکار اسے حذف کرنا اور دوبارہ لکھنا پڑا، جس میں آدھا دن لگ گیا۔

Rule 12: Explicit failure, not silent failure

کلود کی سب سے مہنگی ناکامیاں وہی ہوتی ہیں جو کامیابی کی طرح دکھائی دیتی ہیں۔ ایک فنکشن "چل رہا ہے"، لیکن غلط ڈیٹا واپس کر رہا ہے؛ ایک مائیگریشن "مکمل ہو گئی"، لیکن 30 ریکارڈز کو چھوڑ دیا گیا؛ ایک ٹیسٹ "پاس ہو گیا"، لیکن صرف اس لیے کہ اسٹیٹمنٹ خود غلط تھا۔

وہ لمحہ ایسا تھا: کلوڈ نے کہا کہ ڈیٹا بیس میگریشن "کامیابی کے ساتھ مکمل" ہو گئی۔ لیکن اصل میں، اس نے 14 فیصد ریکارڈز کو خاموشی سے چھوڑ دیا جن میں ٹریگر کنسترینٹ تنازعات تھے۔ چھوڑنے کا عمل لاگ میں درج تھا، لیکن اسے واضح طور پر نہیں ظاہر کیا گیا۔ 11 دن بعد، جب رپورٹس کے ڈیٹا میں غیر معمولی باتیں شروع ہوئیں، تو ہمیں مسئلہ کا پتہ چلا۔

ڈیٹا کے نتائج

میں نے 6 ہفتے کے دوران، 30 کوڈ ریپوزٹریز کو کور کرتے ہوئے، ایک ہی مجموعہ کے 50 نمائندہ کاموں کا پیچھا کیا اور تین کنفیگریشنز کا ٹیسٹ کیا۔

ایجنٹ

غلطی کی شرح کا مطلب ہے: کام کو اصل نیت کے مطابق ملانے کے لیے درست یا دوبارہ لکھنا پڑے۔ جس میں شامل ہیں: خاموش غلط فرض، زیادہ ڈیزائن کرنا، غیر متعلقہ تباہی، خاموش ناکامی، معاہدے کی خلاف ورزی، تضاد والے حل، چیک پوائنٹس کا غفلت سے چھوٹنا۔

انطباق کی شرح کا مطلب ہے: جب کوئی قاعدہ لاگو ہو، تو کلاؤڈ کتنی احتمالی گنجائش سے اس قاعدہ کو صریحاً لاگو کرتا ہے۔

حقیقی دلچسپ نتیجہ صرف 41 فیصد سے 3 فیصد تک غلطی کی شرح میں کمی نہیں ہے۔ اہم بات یہ ہے کہ 4 قواعد سے بڑھا کر 12 قواعد کرنے پر، پابندی کا بوجھ تقریباً نہیں بڑھا، پابندی کی شرح صرف 78 فیصد سے 76 فیصد ہو گئی، لیکن غلطی کی شرح مزید 8 فیصد کم ہو گئی۔ نئے قواعد وہ ناکامی کے انماط کو کور کرتے ہیں جنہیں اصل 4 قواعد نہیں سنبھال رہے تھے، اور وہ ایک ہی توجہ کے بجٹ پر مبنی نہیں ہیں۔

ایجنٹ

کارپاتھی ٹیمپلیٹ کہاں کہاں چپکے سے فیل ہو جائیں گے

نئے قواعد شامل نہ کیے جائیں تو، اصل 4 قواعد کے ٹیمپلیٹ کم از کم 4 جگہوں پر کافی نہیں ہیں۔

سب سے پہلا، لمبے عرصے تک چلنے والے ایجنٹ کے کام۔
کارپاتھی کے قوانین بنیادی طور پر اس لمحے کے لیے ہیں جب کلاؤڈ کوڈ لکھ رہا ہے۔ لیکن جب کلاؤڈ ایک متعدد مراحل والے پائپ لائن کو چلا رہا ہو تو کیا ہوتا ہے؟ اصل ٹیمپلیٹ میں بجٹ کے قواعد، چیک پوائنٹس کے قواعد، یا "آواز اٹھانے والی ناکامی" کے قواعد نہیں ہیں۔ اس لیے پائپ لائن آہستہ آہستہ بھٹک جاتا ہے۔

دوم، کوڈ ریپوزٹری کی ایک جیسی مطابقت۔
"موجودہ انداز کے مطابق" کا ڈیفالٹ صرف ایک انداز ہوتا ہے۔ لیکن ایک 12 سروس والے مونوریپو میں، کلوڈ کو یہ فیصلہ کرنا ہوگا کہ وہ کس انداز کے مطابق ہو۔ اصل قواعد اسے یہ نہیں بتاتے کہ وہ کیسے منتخب کرے۔ اس لیے وہ یا تو تصادفی طور پر انتخاب کرتا ہے، یا کئی اندازوں کو برابر ملا دیتا ہے۔

تیسری، ٹیسٹ کی معیار۔
"ہدف کی طرف مہارت سے کام لینا" "ٹیسٹ کامیاب" کو کامیابی سمجھتا ہے، لیکن یہ نہیں بتاتا کہ ٹیسٹ خود بخود معنی خیز ہونا چاہیے۔ اس کا نتیجہ یہ ہوتا ہے کہ کلوڈ کچھ بھی تصدیق نہیں کرتا، لیکن یہ ٹیسٹ اسے یہ محسوس کرانے کے لیے کافی ہوتے ہیں کہ وہ بہت مطمئن ہے۔

چوتھا، پیداواری ماحول اور منصوبہ بندی کے مرحلے کے درمیان فرق۔
یہی چار قواعد پیداواری کوڈ کو زیادہ ڈیزائن کرنے سے روک سکتے ہیں، لیکن پروٹوٹائپ ترقی کو بھی تیز کر سکتے ہیں۔ کیونکہ پروٹوٹائپ مرحلے میں کبھی کبھی 100 لائنوں کا تجرباتی سکافولڈنگ درکار ہوتا ہے تاکہ راستہ سمجھا جا سکے۔ کارپاتھی کا "سادگی پہلے" اصول ابتدائی کوڈ میں زیادہ فعال ہو جاتا ہے۔

یہ 8 نئے قواعد کارپاتھی کے اصل 4 قواعد کو مکمل طور پر تبدیل کرنے کے لیے نہیں ہیں، بلکہ ان کی خالی جگہوں کو بھرنا ہے: اصل ٹیمپلیٹ 2026ء جنوری کے اس خاص کوڈ لکھنے کے منظر کے مطابق تھا جس میں خودکار مکمل کرنا مرکزی کردار ادا کرتا تھا؛ جبکہ 2026ء مئی تک، کلوڈ کوڈ ایجنٹ ڈرائیون، متعدد مراحل اور متعدد کوڈ ریپوزٹریز کے تعاون والے ماحول میں داخل ہو چکا ہے، جہاں دونوں کے سامنے مختلف مسائل ہیں۔

ایجنٹ

کون سے طریقے کام نہیں کیے

اس 12 قواعد کو نہایتی شکل دینے سے پہلے، میں نے کچھ اور منصوبے بھی آزمائے۔

میں ریڈیٹ / ایکس پر دیکھے گئے قواعد میں شامل ہوں۔
ان میں سے زیادہ تر، یا تو کارپاتھی کے اصل 4 قواعد کو صرف مختلف الفاظ میں دہراتے ہیں، یا پھر عام نہیں کیے جا سکنے والے شعبہ خاص قواعد ہیں، جیسے «ہمیشہ ٹیلوینڈ کلاس استعمال کریں»۔ آخرکار ان سب کو حذف کر دیا گیا۔

12 سے زیادہ قواعد۔
میں نے صرف 18 تک ٹیسٹ کیا۔ 14 سے زیادہ کے بعد، پابندی کی شرح 76% سے گھٹ کر 52% ہو گئی۔ 200 لائنز کا حد حقیقی ہے۔ اس لمبائی سے زیادہ پر، کلوڈ "یہاں قواعد ہیں" کے طور پر میچنگ شروع کر دیتا ہے، نہ کہ حقیقت میں قواعد کو ایک ایک کر کے پڑھتا ہے۔

کچھ ٹولز کے وجود پر منحصر قواعد۔
جیسے "ہمیشہ eslint کا استعمال کریں"، اگر کسی پروجیکٹ میں eslint نہیں انسٹال ہے، تو یہ قاعدہ ناکام ہو جائے گا، اور یہ خاموشی سے ناکام ہو جائے گا۔ بعد میں میں نے اسے کسی خاص ٹول پر منحصر نہ ہونے والے انداز میں تبدیل کر دیا، جیسے "eslint کا استعمال کریں" کو "کوڈ بیس میں پہلے سے لاگو کردہ اسٹائل کی پابندی کریں" میں تبدیل کر دیا۔

CLAUDE.md میں مثالیں دیں، قواعد نہیں۔
مثالیں قواعد سے زیادہ سیاق و سباق استعمال کرتی ہیں۔ تین مثالیں جو سیاق و سباق کا استعمال کرتی ہیں، تقریباً 10 قواعد کے برابر ہوتی ہیں، اور کلاؤڈ مثالوں پر زیادہ فٹ ہو جاتا ہے۔ قواعد انتزاعی ہوتے ہیں، جبکہ مثالیں مخصوص ہوتی ہیں۔ اس لیے، قواعد کا استعمال کرنا چاہیے۔

احتیاط سے کام لیں، غور و فکر کریں، اور توجہ مرکوز کریں۔
یہ سب اضافی ہے۔ اس قسم کے حکمات کی پابندی کی شرح تقریباً 30 فیصد ہو گئی، کیونکہ ان کا جائزہ لینا ممکن نہیں تھا۔ بعد میں میں نے انہیں زیادہ مخصوص امریہ قواعد جیسے "فرضیات کا واضح ذکر کریں" سے بدل دیا۔

کلود کو ایک "تجربہ کار انجینئر" کی طرح کام کرنے کو کہیں۔
یہ کام نہیں کرتا۔ کلوڈ خود کو ایک سینئر انجینئر سمجھتا ہے۔ اصل مسئلہ یہ نہیں کہ وہ ایسا سمجھتا ہے یا نہیں، بلکہ یہ ہے کہ وہ ایسا کرتا ہے یا نہیں۔ حکمی قواعد اس فرق کو کم کر سکتے ہیں، لیکن شناخت والے پرومپٹس نہیں۔

مکمل 12 قاعدہ والی CLAUDE.md

یہ مکمل ورژن ہے جسے آپ کاپی اور پیسٹ کر سکتے ہیں۔

اس مواد کو فیشُو دستاویز کے باہر ظاہر نہیں کیا جا سکتا

اسے ریپوزیٹری کے رُوتھ کے تحت CLAUDE.md کے طور پر محفوظ کریں۔ اس 12 قواعد کے نیچے، پروجیکٹ خاص قواعد جیسے ٹیکنالوجی اسٹیک، ٹیسٹ کمانڈز، اور ایرر ماڈلز شامل کریں۔ مجموعی طور پر 200 لائنوں سے زیادہ نہ ہو، ورنہ قواعد کی پابندی میں واضح کمی آ جائے گی۔

کیسے انسٹال کریں

صرف دو اقدامات:

1. اپنی CLAUDE.md میں کارپاتھی کے 4 بنیادی قواعد شامل کریں
curl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md


2. نیچے درج کردہ قواعد 5–12 کو کاپی کریں

فائل کو ریپوزٹری کے جڑ کے ڈائریکٹری میں محفوظ کریں۔ یہاں >> بہت اہم ہے، اس کا کام موجودہ CLAUDE.md میں شامل کرنا ہے، نہ کہ آپ نے پہلے لکھے گئے پروجیکٹ خاص قواعد کو اووررائٹ کرنا۔

Mental Model

CLAUDE.md ویش لسٹ نہیں ہے، بلکہ ایک رویے کا معاہدہ ہے جو آپ نے جو خاص ناکامی کے نمونے دیکھے ہیں، انہیں بند کرنے کے لیے استعمال ہوتا ہے۔

ہر قاعدہ ایک سوال کا جواب دینا چاہیے: یہ کس غلطی کو روکتا ہے؟

کارپاتھی کے چار قواعد، جو 2026ء جنوری میں اس نے دیکھے گئے ناکامی کے نمونوں کے خلاف تحفظ فراہم کرتے ہیں: خاموش فرضیات، زیادہ ہندسہ، غیر متعلق تباہی، اور کمزور کامیابی کے معیار۔ یہ بنیادی ہیں، انہیں نہ چھوڑیں۔

میں نے 8 نئے قواعد شامل کیے ہیں جو مئی 2026 کے بعد ظاہر ہونے والے نئے ناکامی کے انداز کو روکنے کے لیے ہیں: بجٹ کی پابندی کے بغیر ایجنٹ کا سائکل، چیک پوائنٹس کے بغیر متعدد مراحل والے کام، جو معلومہ طور پر ٹیسٹ کیے گئے لیکن اہم منطق تک نہیں پہنچے، اور خاموش ناکامی کو خاموش کامیابی کے طور پر پیش کرنا۔ یہ تدریجی اضافے ہیں۔

بے شک، اثرات فرد بہ فرد مختلف ہوتے ہیں۔ اگر آپ متعدد مراحل والے پائپ لائن کا استعمال نہیں کرتے، تو قاعدہ 10 آپ کے لیے کم اہم ہے۔ اگر آپ کا کوڈ بیس صرف ایک یکسانہ انداز میں ہے اور اسے لِنٹ پہلے سے لاگو کر چکا ہے، تو قاعدہ 11 زائد ہے۔ ان 12 قواعد کو پڑھنے کے بعد، صرف وہی قواعد برقرار رکھیں جو آپ کے حقیقی غلطیوں سے متعلق ہیں، باقی کو حذف کر دیں۔

ایک اصل ناکامی کے ماڈل کے لیے مخصوص 6 قاعدے والی CLAUDE.md، اس سے بہتر ہے کہ آپ 12 قاعدے والی ایسی فائل استعمال کریں جس میں 6 قاعدے آپ کبھی نہیں استعمال کریں گے۔

اختتام

کارپاتھی کی 2026ء کے جنوری کی وہ ٹویٹ، بنیادی طور پر ایک شکایت تھی۔ فورسٹ چینگ نے اسے 4 قواعد میں تبدیل کر دیا۔ آخر کار، 120,000 ڈویلپرز نے اس نتیجے کو سٹار دیا۔ اور ان میں سے زیادہ تر، آج بھی صرف ان 4 قواعد کا استعمال کر رہے ہیں۔

ماڈلز ترقی کر چکے ہیں اور ایکوسسٹم بھی بدل چکا ہے۔ متعدد مراحل کے ایجینٹ، ہُک چین ٹرگر، سکل لوڈنگ، متعدد کوڈ ریپوزٹریز کا تعاون — یہ سب باتیں کارپاتھی نے اس ٹویٹ کو لکھتے وقت موجود نہیں تھیں۔ اصل چار قواعد ان مسائل کو حل نہیں کرتے۔ وہ غلط نہیں ہیں، بلکہ ناقص ہیں۔

8 نئے قواعد شامل کیے گئے۔ 6 ہفتے میں، 30 کوڈ ریپوزٹریز کا ٹیسٹ کیا گیا۔ خطا کی شرح 41% سے گھٹ کر 3% ہو گئی۔

آج رات اس مضمون کو محفوظ کر لیں اور یہ 12 قواعد اپنے CLAUDE.md میں کاپی کر لیں۔ اگر یہ آپ کو کلود پر ایک ہفتہ کا سفر بچا دے، تو اسے شیئر کریں۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔