كيفية استخدام سير عمل كلاود الديناميكية للبحث المتعمق

على مدار هذه السنوات الثلاث، أصبحت غير قادر على الاستغناء عن استخدام الذكاء الاصطناعي لدعم أبحاث الصناعة، وقمت ببناء مجموعة من المهارات والأنظمة المساعدة لحل مشكلات فلترة المعلومات، واستخلاصها، وربطها، والتحقق منها، وتخزينها.

حتى بعد تجربة عميقة لسير العمل الديناميكي لـ Claude Code هذا الأسبوع، أدركت المعنى الحقيقي لعبارة "لا تُقاوم العصر الكبير".

فكّر مجددًا: ما هي الأبحاث العميقة التي يجب على الإنسان إجراؤها في عصر الذكاء الاصطناعي، وكيفية بناء علاقة تعاونية وتكملية بيني وبين الذكاء الاصطناعي.

أولاً، نبدأ بفخوص البحث

إن إجراء بحث تقني هو في الواقع أمر مليء بالفخاخ (سواء بالنسبة للإنسان أو الذكاء الاصطناعي)، نظرًا لأن بداية البحث تؤدي إلى استقبال كمية كبيرة من المعلومات، وكلما زادت الآراء والمعلومات، أصبحت الاستنتاجات أكثر غموضًا. لذا، يجب دائمًا أن تعرف كيف تعود إلى الهدف الأساسي.

هذا أيضًا كان دائمًا نقطة ضعف في الذكاء الاصطناعي، لأنه من منظور الانتباه والارتباط، فإنه يعاني أكثر من البشر من كمية المعلومات الحالية، كما أن قدرته على إجراء روابط متشعبة ذات قيمة حقيقية ضعيفة.

المكان الذي يكون فيه الذكاء الاصطناعي ممتازًا هو تنفيذه، حيث يبحث وينظم ويستنتج طبقة تلو الأخرى، مما يتجنب تمامًا فقدان التفاصيل.

على الرغم من أنني لم أنشر مقالات على واتشات بيد للنصف العام الماضي، إلا أنني أتابع وأدرس بعناية جميع الساحات الرئيسية في الصناعة، ويدعم هذا الإدخال والإخراج نظام بحث متعمق خاص بي.

وفي مواجهة إطلاق Claude Code لميزة Dynamic Workflows الأسبوع الماضي، أريد أن أتنافس معه لرؤية ما إذا كانت قدراته الافتراضية يمكنها تجاوز قدراتي بالكامل.

ما هو Dynamic Workflows؟

المسارات الديناميكية (Dynamic Workflows) تعتمد على فكرة أساسية: قبل تنفيذ المهمة، يقوم الذكاء الاصطناعي تلقائيًا بتصميم مسار العمل المناسب لإكمال هذه المهمة، ثم يبدأ التنفيذ.

هذا يختلف جوهريًا عن "نمط التخطيط" و"المهارة" الذين استخدمناهما سابقًا. نمط التخطيط يقسم المهام إلى تفاصيل أدق، لكنه لا يتوافق بالضرورة مع سير عمل منطقي؛ فحسب ترتيبك للتعليمات البرمجية، قد تُضاف مؤشرات القبول (وهذا أمر بالغ الأهمية للبحث)، وبالمثل، فقط عندما تكون هناك تعليمات برمجية، سيتمكن من توقع بعض قواعد التثبيت بشكل أفضل.

لكن سير العمل الديناميكي سيقوم تلقائيًا بدمج منطق القبول، وتجميع النتائج، والتحقق المضاد这些东西.

طريقة التفعيل بسيطة: استخدم مباشرة /deep-research في cc، ثم قدم بعض قوالب البحث والمصادر الأولية. إذا كنت ترغب في استخدام قدرات سير العمل الديناميكي بشكل منفصل، فاستخدم عبارة التوجيه أو قل ببساطة ultracode. لاحظ قبل الاستخدام أن استهلاك الرموز سيكون تقريبًا عشرات المرات أكثر من المعتاد.

ثلاثة: ستة أنماط سير عمل مدمجة

في قلب سير العمل الديناميكي، توجد ستة أنماط جدولة أساسية تم تلخيصها من قبل الفريق الرسمي، وهذا هو السبب في أنه أقوى من المحادثات/الوكلاء/المهارات العادية.

في الواقع، وراء هذه الأنماط الستة هناك مشكلتان أساسيتان فقط: كيف يتم تقسيم المهمة؟ وكيف يتم دمج النتائج؟ إن فصلها إلى ستة أنماط هو في جوهره توليفات لهذه المشكلتين.

3.1 نمط التوجيه (التصنيف والتنفيذ)

يقوم عامل أول بتحديد نوع المهمة، ثم يُوزع المهمة على عامل متخصص الأنسب لتنفيذها. المنطق الأساسي هو منطق اختيار المسار، وليس التوازي أو التكرار. تسلك المهمة مسارًا واحدًا فقط، ولا يتم تنفيذ المسارات الأخرى إطلاقًا.

على سبيل المثال، يمكنني البدء بثلاثة أدوار مسبقة للـ subagent: عامل تحليل صارم يتحقق من البيانات، وعامل إخراج متمرس في الكتابة، وعامل تحدي متخصص في اكتشاف الثغرات. يحدد طبقة التوجيه أي فرد مناسب لتنفيذ المهمة الفرعية الحالية، بدلاً من تحميل مهمة واحدة على عاتق عامل واحد فقط.

تتمثل قيمة هذا النموذج في الدقة والاقتصاد: يمكن أن تكون تعليمات كل عامل مستقلة تمامًا، دون تأثير من أهداف أخرى، مما يُشكل استكشافًا عميقًا ومتخصصًا. إن استهلاك الرموز أدنى ما يمكن، وسرعة الاستجابة الأسرع. الحدود الوظيفية واضحة جدًا.

العيوب أيضًا واضحة، حيث تمتلك قدرة ضعيفة على التعامل مع المهام ذات الحدود الغامضة (مثل "مشكلة تقنية ومشكلة حساب في نفس الوقت").

3.2 تقسيم ودمج (Fan-out & Merge)

أيضًا النمط الذي أستخدمه بشكل متكرر، والمنطق الأساسي هو التوازي + الدمج. يتم تقسيم المهمة إلى N مهام فرعية مستقلة تعمل في وقت واحد، ثم تُدمج جميعها بشكل موحد بعد الانتهاء منها.

الميزة تكمن في السرعة والعزل. إجمالي الوقت المستغرق يعادل تقريبًا أطول مهمة فرعية، وليس مجموع جميع المهام الفرعية. لكل مهمة فرعية سياق مستقل، ولا تتأثر ببعضها البعض، ولا تتلوث المهام الأخرى بضوضاء أي مهمة فرعية.

الضعف هو أن تكلفة الرمز تكون مضاعفة بمقدار N بشكل تسلسلي، كما أن طبقة الدمج (Synthesize) نفسها تواجه صعوبة — فدمج مخرجات ذات هيكل غير متسق من N مسارات يُعد تحديًا تصميميًا. التجزئة غير الجيدة للمهام الفرعية قد تؤدي إلى إغفال أو تغطية متكررة.

3.3 التحقق العدائي (Adversarial Verification)

المنطق الأساسي هو التحقق، حيث يتم طلب عدة وكلاء التحدي من زاوية "الاعتراض" على نفس الاستنتاج، ويُعتبر مقبولاً فقط إذا حصل على أغلبية الأصوات.

الميزة تكمن في أن المُحقق لا يعرف تفكير العامل، بل ينظر فقط إلى النتيجة، مما يزيل من الهيكل التحيز الذاتي المرتبط بـ"سماح النموذج بفحص الكود الذي كتبه".

هذا النمط حل مشكلة كانت تؤرقني لفترة طويلة: نحن غالبًا نتحدث مع الذكاء الاصطناعي بلغة يومية، لكن الذكاء الاصطناعي يميل إلى التوافق مع توقعاتك، مما يؤدي بسهولة إلى "تحيز التأكيد". من خلال التحقق المضاد، نجبر الذكاء الاصطناعي على البحث عن أمثلة معاكسة، والاعتماد على البيانات والتجارب للتحقق، وليس فقط تلبية أفكارك.

لكن، للتحقق من هذا الأمر، إذا قدم حكمًا خاطئًا، فسيؤدي إلى توجيه العامل نحو التوافق مع المدقق. لذا، من الأفضل الاعتماد على حقائق قابلة للتكرار، وليس على الآراء.

أنا أقول ذلك كمزحة، إذا طلبت من الذكاء الاصطناعي إيجاد مشكلات، فسيتمكن من اكتشاف مشكلات لا نهائية، لذا يجب أن تحدّد حدود البحث عن المشكلات.

3.4 توليد وتصفية (Generate & Filter)

المنطق الأساسي هو التفرع ثم التقارب. أولاً، تُنتِج عمدًا عددًا زائدًا من المرشحين، ثم تُزيل باستخدام معيار تقييم لتبقى فقط الجوهر، مع الاحتفاظ فقط بالنتائج ذات الثقة العالية للإخراج.

من الأفضل أن يُنتج عامل عشرة إجابات، ثم يُفلترها طبقة تحقق، بدلاً من أن يُنتج عامل إجابة واحدة "مقبولة". لذا، فإن الميزة تكمن في التنوع. يمكن لعوامل متعددة استخدام استراتيجيات وتعليمات مختلفة لإنتاج حلول يصعب على الإنسان توقعها، بينما تجعل خطوة التصفية الإخراج النهائي عالي التركيز من حيث الجودة.

الضعف هو أن جودة معايير Filter تحدد النتيجة النهائية مباشرة، وخطأ تصميم المعايير يعادل إفساد العملية بأكملها

السيناريو المناسب هو عندما لا تكون الإجابة الصحيحة معروفة مسبقًا، ويتطلب اختيار الأفضل من بين عدة احتمالات، ووجود متطلبات واضحة للتنوع.

تشبه فقط Fanout-And-Synthesize من الخارج: كلاهما "متوازي متعدد المسارات → مخرج واحد"، وهو الأكثر إرباكًا.

الفرق الأساسي يكمن في النية: كل مسار في Fanout يعالج جزءًا مختلفًا من المهمة، والنتائج مكملة، وعند الدمج، تسهم جميع المسارات؛ بينما كل مسار في Generate-And-Filter يعالج نفس المهمة، والنتائج تنافسية، وعند الدمج، يتم التخلص من معظمها. الأول هو "لعبة الأحجية"، والثاني هو "مسابقة الجمال".

3.5 وضع البطولة (Tournament)

المنطق الأساسي هو التنافس والتصفية. يقوم N من الوكلاء بتنفيذ نفس المهمة بشكل مستقل، ويتم التصفية تدريجيًا عبر المقارنات الزوجية حتى يتم اختيار الحل الأمثل.

لقد قمت بهذا يدويًا من قبل — تشغيل نفس التغييرات في الكود لنسخة أو اثنتين أو ثلاث، ثم جعل الذكاء الاصطناعي يقارن أيها أفضل. الآن يمكن تضمين ذلك مباشرة في سير العمل.

الميزة تكمن في تقييم الاستقرار. إن المقارنة الزوجية ("أيّهما أفضل، A أم B؟") أكثر استقرارًا بكثير من التقييم المطلق ("أعطِ درجة لـ A")، لأنها تستبعد مشكلة تغيّر معايير التقييم. النتائج تخضع لعدة جولات من المنافسة، مما يضمن مصداقية الفائز النهائي.

يبدو أيضًا مشابهًا سطحيًا لـ Generate-And-Filter: كلاهما يختار الأفضل من بين عدة مرشحين. الاختلاف الأساسي يكمن في آلية الاختيار: يستخدم Tournament مقارنة ثنائية لمقارنة المرشحين اثنين اثنين، وهو "السماح للمرشحين بالتنافس مع بعضهم البعض". عندما يكون من الصعب كميّة المعايير، وعندما يكون الحكم جوهريًا نسبيًا، يكون أكثر موثوقية.

3.6 نمط التكرار (Loop)

المنطق الأساسي هو التكرار التكيفي، والتجربة المستمرة، وجمع معلومات الأخطاء عند مواجهة عوائق، وتكملة السياق، ثم إعادة المحاولة حتى استيفاء شروط القبول.

في الجوهر، إنها مواجهة عشوائية الذكاء الاصطناعي: جرّب عدة مرات، وستصطدم حتمًا بنتيجة أفضل. لكن النهج الأكثر نضجًا هو دمج التحقق المضاد، بحيث يُنفّذ كل دورة بمعلومات أكثر دقة، وليس اعتمادًا كليًا على العشوائية.

الميزة تكمن في القدرة على معالجة المهام ذات العمل غير المعروف. جميع الأنماط الخمسة الأخرى تفترض أن حدود المهمة محددة، بينما يُعد "Loop Until Done" النمط الوحيد القادر على معالجة "عدم معرفة عدد الدورات المطلوبة".

الضعف هو خطر التحكم الخارجي المحتمل — إذا لم يتم تصميم شروط الإيقاف بشكل جيد، فقد تحدث حلقات لا نهائية. كل عامل في كل جولة هو سياق جديد، ولا يمكنه تجميع الحالة عبر الجولات (ما لم يُكتب صراحةً في ملف).

رابعًا، مواجهة مهاراتي الخاصة مع سير العمل الرسمي

قبل ظهور سير العمل الديناميكي، قمت بتصميم مجموعة خاصة بي من deep-research. منطق مهاراتي كان كالتالي:

Midnight (NIGHT) متاحة الآن على KuCoin!
دع الذكاء الاصطناعي يبحث في جميع المواد ذات الصلة: الوثائق الرسمية، وشفرة المصدر، وآراء السوق
قم بضغط المعلومات إلى ملخص ذي معنى
تحليل تعاوني بعدة أدوار عوامل، مع إعداد تقرير
إزالة التكرار التلقائي، نظرًا لارتفاع معدل التكرار بين محتوى الوكلاء المتعددين

استخدمته لفترة، وأعتقد أنه جيد جدًا في الاستخدام. لكنه يعاني من عيب جوهري: نقص التقارب القائم على الهدف.

وفي كثير من الأحيان، حتى مع وجود خطوة الخمسة للإزالة التكرارية، فإنه غالبًا ما يحذف معلومات ذات قيمة، وإذا لم تُجرِ عملية الإزالة التكرارية، فسيقدم لك Skill مقالًا طويلاً يبلغ عشرة آلاف كلمة، مليئًا بالمعلومات، لكنه لا يخبرك مباشرةً: "ما علاقة هذا الأمر بك؟ وماذا يجب أن تفعل؟"

ومع ذلك، فإن البحث يُجرى لخدمة "اتخاذ القرار"، وهذا هو السبب في أن العديد من المهارات تبقى محصورة في البحث نفسه، حيث تحصل على 80 نقطة، لكنها تفتقر إلى الـ20 نقطة الأكثر أهمية.

لدرجة أن الذكاء الاصطناعي، بعد إكمال البحث الأولي، يحتاج إلى مواصلة عشرة تأملات وحوارات إضافية للوصول إلى استنتاج شامل ورضا.

ما الذي فعله تدفق العمل الرسمي الإضافي؟

من خلال تجارب مهام بحث معقدة عدة هذا الأسبوع، اكتشفت أن سير العمل البحثي العميق المدمج في Claude Code (لاحظ أنه ليس مجرد مهارة، بل وحدة مُضمنة ومُركبة داخل cc)، يضيف عدة مراحل أساسية مقارنةً بأساس مهاراتي الخاصة:

طبقة تفكيك السؤال: لا تبدأ البحث مباشرة، بل تبدأ بطرح أسئلة لتفكيك سؤالي إلى عدة أسئلة فرعية: ما الذي تريد فهمه حقًا؟ كيف يتعلق هذا بك؟ ما هي الجوانب التي تستحق التعمق؟ هذه الخطوة كنت أتجاوزها سابقًا.
تقييم المصداقية: تقييم قابلية التكذيب لكل معلومة، مشابهًا لتقييم الحظوة في SEO التقليدي — هل المصدر موثوق؟ كم عدد الإشارات إليه؟ هذه خطوة لم أفكر في إضافتها من قبل.
حذف متقاطع بدلاً من الدمج المتوسط: كانت طريقي السابقة هي أخذ متوسط جميع الاستنتاجات، لذا كانت الوثيقة كبيرة جدًا. سيعمل سير العمل الديناميكي على إجراء تصويت متعدد الوكلاء لكل استنتاج، وحذف تلك التي لا تحصل على أصوات كافية، وليس الدمج البسيط.
الإخراج الموجه بالهدف: التقرير النهائي ليس تراكمًا للمعلومات، بل يقدّم أحكامًا وحلولًا مقترحة مبنية على هدفك الأصلي. والمفتاح لتحقيق ذلك هو استغلال القدرات المُبرمجة مسبقًا لعدة عوامل فرعية. السبب في أن المهارات السابقة كانت تفتقر غالبًا إلى التوجيه نحو الهدف النهائي هو تراجع وزن الأوامر بعد كمية هائلة من المعلومات.

What problems do these mechanisms solve?

تستهدف بالضبط المشكلات النموذجية التي تواجهها الذكاء الاصطناعي في المهام الطويلة:

انحراف الهدف: عندما يبدأ المهمة، تكون الحالة جيدة، لكن في المنتصف، لا تعرف ما الذي تفعله، ثم تستعيد الإيقاع مرة أخرى في النهاية — مشابه لانشغال الإنسان أثناء الحصة الدراسية. كلما طالت المهمة، أصبح هذا أكثر وضوحًا.

إيقاف مبكر: أثناء التشغيل، عند مواجهة صعوبة، يعتقد الذكاء الاصطناعي أنه "أكمل" المهمة ويتوقف، في حين أن معايير القبول لم تُحقق أصلاً.

تلوث السياق: عند قيام وكيل واحد بمهام معقدة، فإن كمية كبيرة من الأوامر المقدمة مسبقًا تقلل من المساحة المتاحة للتنفيذ اللاحق. الطريقة الأفضل هي الحد من الأوامر المقدمة مسبقًا إلى بضعة كيلوبايت، واستخدام وكلاء متعددين لتوزيع السياق.

الانحياز في الإخراج: يميل الذكاء الاصطناعي إلى التوافق مع توقعاتك، وتسهّل الأسئلة اليومية إثارة هذه المشكلة.

بينما تحل ديناميكية التدفق العمل هذه المشكلات الأربع بطريقة منظمة: أتمتة مؤشرات القبول لمنع الإيقاف المبكر؛ وعزل السياقات بالتوازي؛ ومكافحة التحيز الناتج عن التحقق المتقابل؛ وتفكيك المشكلة بقيود متدرجة بحيث يفهم الذكاء الاصطناعي الهدف أولاً ثم يتصرف.

خامساً، الملخص

في النهاية، كباحث دائم، أشعر بالإعجاب الشديد تجاه آلية CC الجديدة، حيث تغطي الستة أنماط المدمجة — اختيار المسار، التقسيم والدمج، التحقق المضاد، التوليد والتصفية، المنافسة التصعيدية، الحلقة التكرارية — احتياجات الجدولة لمعظم المهام البحثية المعقدة.

لم أعد بحاجة إلى تصميم جدولة الوكلاء يدويًا أو إجراء الحذف التكراري والتحقق المتقاطع بنفسي؛ فقد تم تضمين كل ذلك في سير العمل نفسه.

وهو مناسب بشكل خاص للتفكير في استكشاف الأسئلة المفتوحة ونقص المعلومات، لأن الجدولة متعددة الوكلاء الطبيعية وتقسيم أهداف المهام يرفع من قدرته العامة مرة أخرى. في الواقع، منذ ثلاث سنوات، كانت الذكاء الاصطناعي تؤدي بشكل جيد في حل مشكلات صغيرة جدًا وواضحة ضمن قيود متعددة، لكن التحول الجوهري الحقيقي للذكاء الاصطناعي كان في قابليته العامة، وهي النقطة التي تميزه عن منافسيه، حيث انتقل من بسيط كرمز برمجي إلى أن يصبح وكيلًا حقيقيًا، ومن حل ثابت لمشكلة واحدة إلى التكيف مع أي مشكلة.

لذلك، فإن Dynamic Workflows ليست "محادثة فردية أكثر ذكاءً"، بل هي تهيكلة لعملية البحث نفسها.

كنت أحتاج في الأصل إجراء عشرات المحادثات المستقلة للبحث، والآن تم تقليلها إلى 3-4 مرات. على الرغم من أن استهلاك الرموز المميزة المقابلة زاد بعشرات المرات.

لماذا يحتاج الأمر إلى 3-4 مرات أخرى؟ أعتقد أن السبب الجذري يكمن في اختلاف هذه المتطلبات.

أولاً، صرامة آلية التحقق، أنا أركز بشكل رئيسي على أبحاث التقنيات الجديدة على البلوكشين، وفي العديد من الأمور، تكون الوثائق الرسمية متأخرة، وهناك كود مفتوح المصدر وأدوات أخرى مثل معاملات السلسلة التي تعتبر أكثر قيمة للمرجع، لكن في الوقت الحالي، يظل الذكاء الاصطناعي يعتمد افتراضياً على الوثائق الرسمية بدلاً من التحقق القائم على الحقائق.

ثانيًا هو التفكير العميق عبر الحدود تمامًا، وهذه النقطة يمكن حل بعض جوانبها من خلال تهيئة سير العمل مسبقًا (تحديد مسبق لعوامل فرعية متعددة الأبعاد) للتفكير في نفس المشكلة. لكن ما يمتاز به الذكاء الاصطناعي هو نماذج التفكير السائدة، أما بالنسبة للأفكار الجديدة جدًا والعميقة جدًا والتي تفتقر إلى بيانات داعمة، فهو يظهر قصورًا نسبيًا.

الثالث هو تصميم الحل والتحقق منه، إن قيمة الحل لا تكمن في اقتراحه بل في التحقق منه ودعمه، وهو يعتمد على قياس الآليات الحالية والاستثمارات والتكاليف، وإذا تم تدريب الذكاء الاصطناعي جيدًا، يمكنه تحقيق نتائج أفضل، لكن هذا يتعارض مع المرونة العامة.

أخيرًا، يتم تكثيف المعلومات بشكل قصوى، وهذا يتطلب العودة إلى فهم مستوى الجمهور المستهدف؛ فبعض الأشخاص لا يملكون أي خلفية أساسية ويتطلبون وصفًا بشريًا، بينما يحتاج بعض المستمعين إلى جملة واحدة تؤثر فيهم~.