تسريب Claude Fable 5: نظام وكيل أم نموذج LLM غش؟

كانت هناك تسريبات حديثة لتعليمات نظام Claude Fable 5، مما كشف أن المنتج ليس نموذجًا لغويًا كبيرًا عاديًا، بل هو نظام عامل كامل يحتوي على بيئة ساندبوك Linux. يمكن لهذا النموذج التشغيل الذاتي لعدة أيام، ودعوة وكلاء فرعيين للتعاون، وامتلاك قدرات على تذكّر عبر الجلسات والتخزين الدائم. في اختبارات المعيار، قام Anthropic بتجهيزه كـ LLM عادي للمشاركة في التقييم، لكنه في الواقع استخدم "واجهة عامل" للحصول على ميزة غير عادلة. بالإضافة إلى ذلك، تم الكشف عن أن النظام يتحول تلقائيًا إلى الإصدار القديم عند تفعيل كلمات حساسة من قبل المستخدم، مع الاستمرار في فرض رسوم بسعر Fable 5 الفاخر. كشفت الوثائق المسربة أيضًا عن تخطيط Anthropic لبيئة العامل، بما في ذلك أدوات مثل Claude Code وClaude Cowork، بالإضافة إلى وجود إصدارات غير محدودة من سلسلة Mythos.

مؤلف المقال، المصدر: جديد الذكاء

قبل بضعة أيام، ألقى القراصنة "بلايني الليبراتور" قنبلة ثقيلة على منصة X — كشف كامل لتعليمات النظام الخاصة بـ Claude Fable 5، والتي تبلغ 120 ألف حرف.

كشفت وثيقة الكود المسربة عن حقيقة مفاجئة أثارت صدمة في الدائرة: Claude Fable 5 ليس نموذجًا كبيرًا، بل هو نظام عامل كامل يخفي نفسه كنموذج لغوي ضخم!

https://gist.github.com/gsans/b3007997f8900003c8ff58125a45e15e

نعم، بينما لا يزال العالم يستخدم اختبارات مرجعية تقليدية لتقييم نماذج كبيرة مختلفة، قامت Anthropic بترقية ساحة المعركة إلى بعد آخر بشكل سري.

أثر هذه الحادثة التسريبية قد عكس تمامًا فهمنا لـ "نماذج الذكاء الاصطناعي".

ما هو Fable 5؟ إنه ليس نموذج لغوي كبير (LLM)، بل هو عامل (Agent)!

وفقًا للإرشادات المُسربة للنظام، يختلف Fable 5 جوهريًا عن النماذج الكبيرة الشائعة في السوق التي تعتمد على "تسأل وأنا أجيب".

إنه لا يرافقك حقًا في "الدردشة"، بل يُنفّذ "تنفيذًا".

تحت جلد هذا النموذج، يوجد نظام فرعي صغير يُسمى "Claude Code". أي أنه يمتلك حلقة وكيل مغلقة (Agentic Loop):

لدعم هذا الحلقة المغلقة المرعبة، يحتوي Fable 5 على بيئة ساندبوكس Linux كاملة مدمجة في الأساس!

أولاً، إنه يحقق إغلاقًا ذاتيًا حقيقيًا.

لا يحتاج إلى وجود إنسان أمام الشاشة.

يمكنك إعطاؤه مهمة معقدة طويلة المدى، وسيقوم بتشغيل أوامر Bash داخل بيئة معزولة، وتحرير الملفات، واستدعاء البيانات عبر واجهة برمجة تطبيقات التخزين الدائم عبر الجلسات، وحتى إجراء بحث متعدد الوسائط بنفسه، ويعمل بجد على مدار أيام وليالٍ دون أي تدخل بشري.

إضافةً إلى ذلك، فإنه يمتلك وظيفة توزيع الوكلاء الفرعيين.

عند مواجهة مشروع معقد جدًا، يمكنه حتى أن يصبح المدير نفسه، ويوزع المهام وينشئ وحدات فرعية (Sub-agents) للعمل معًا.

بينما لا تزال منافسات مثل GPT-5.5 في مرحلة اختبار "من يمتلك استدلالًا أكثر إنسانية"، تطور Claude Fable 5 ليصبح عاملًا رقميًا يمكن إدراجه في الخوادم ليعمل بصمت لمدة ثلاثة أيام إضافية للشركة.

كما كشف المستخدم gerardsans:

سلسلة Fable/Mythos مختلفة تمامًا من حيث النموذج. تمتلك هذه العائلة دورة وكيل كامل، ونسخة مصغرة من Claude Code.

بينما لا تزال منتجات أخرى في الصناعة عالقة في نمط المحادثة. يمكنها العمل دون رقابة لعدة أيام، بفضل بيئة ساندبوكس مدمجة تتمتع بمهارات وذاكرة وتحسين ذاتي.

السؤال النهائي: هل هو هجوم تقليل الأبعاد أم غش غير عادل؟

لم تُعمِّق هذه التسريبات Anthropic فقط في عاصفة من الانتقادات، بل جعلت أيضًا تقييمات المرجعية لنموذج اللغة الكبير في مركز التركيز.

في الوقت الحالي، تتصارع كبرى شركات التكنولوجيا على لائحة عامة للتنافس على لقب "أكبر نموذج عالمي".

لكن السر وراء أداء Fable 5 المذهل في هذه التقييمات، بل وتفوقه على GPT-5.5، هو أنه "استخدم برنامجًا خارجيًا".

كما أشار المدون التقني جيرارد سانس بغضب: "هذا ليس مسابقة عادلة على الإطلاق. أنت تقارن نظامًا مُدعومًا بنموذج أصلي كبير + هيكل عامل (Agent Harness) مع نموذج عاري لشخص آخر!"

إذا قام مصنعون آخرون بتغليف نماذجهم الأصلية بطبقة Agent تحتوي على ساندبوكس Linux، وبحث متعدد الوسائط، وتصحيح ذاتي، وتخزين دائم، فستشهد نتائجهم أيضًا ارتفاعًا كبيرًا.

عندما أعلنت Anthropic علنًا وقامت بتقييمها، حاولت بشدة تصويرها كنموذج لغوي كبير عادي، لكن في وثائقها الداخلية غير المعلنة، كان مكتوبًا بوضوح أنها تمتلك القدرة على "التشغيل الذاتي عبر عدة أيام، وتكليف وكالات فرعية، والتحقق الذاتي من العمل".

إن استخدام هذه الفجوة في المعلومات للضرب العمودي على المنافسين يجعل الاختبارات المرجعية تفقد معناها تمامًا!

كشف كبير لملف سري يضم 120 ألف كلمة: الحقيقة الكاملة لـ Fable 5 تظهر الآن

في هذه التعليمات النظامية التي تم كشفها بالكامل والبالغة 120 ألف كلمة، تكمن أسرار تجارية وخرائط طريق منتجات لا تُعلن عنها Anthropic.

والأمور التالية هي الأكثر جوهرية وإثارة.

ذاكرة دائمة نادرة، بالإضافة إلى بناء التطبيقات

يُظهر مُحفّز أن "يتمتع Claude بنظام ذاكرة يمكنه توفير معلومات مشتقة من المحادثات السابقة مع المستخدم (الذكريات)."

هذا يعني أن Fable 5 يمكنه "تذكّر" المستخدمين عبر الجلسات، وهو أمر نادر جدًا في النماذج اللغوية الكبيرة التقليدية.

كما أنه يمتلك تخزينًا مستمرًا.

يمكن الآن لـ Artifacts استخدام واجهة برمجة تطبيقات تخزين المفاتيح والقيم البسيطة لتخزين واسترجاع البيانات التي تبقى دائمة عبر الجلسات. وهذا يجعل من Artifacts أداة مثالية للسجلات، والمتعقبات، وقوائم التصنيف، وأدوات التعاون.

لذلك، لم يعد Fable 5 مجرد محادثة — بل هو يبني تطبيقات.

يُكشف عن شجرة العائلة الداخلية الأساسية لأول مرة: هل Mythos 5 هو "الكامل غير المحدود"؟

يُذكر في قسم 【product_information】:

هذه النسخة من Claude هي Claude Fable 5، أول نموذج في عائلة Claude 5 الجديدة من Anthropic، وجزء من فئة نماذج Mythos الجديدة التي تتفوق على Claude Opus في الأداء.

النقطة الرئيسية: Fable 5 وMythos 5 يشتركان في نفس النموذج الأساسي.

Fable 5 هو قائد عظيم موجه للجمهور مع قيود أمان شديدة، بينما Mythos 5 هو النسخة الكاملة غير المقيدة التي تم إزالة هذه القيود الأمنية منها وتُقدّم فقط للمنظمات المعتمدة.

مستوى كفاءتهما يفوق بشكل شامل الملك السابق كلاود أوبوس!

ظهر "الحزمة الكاملة المُغلفة"

كان يُفترض أن أنثروبيك كانت تخطط لخطة كبيرة من قبل. كشفت تعليمات التوجيه عن عدة عوامل Agent قيد الاختبار الداخلي أو التي تم إطلاقها سرًا:

Claude Code: أداة برمجة وكيل تسمح للمطورين بتعيين المهام مباشرة من خلال الطرفية أو سطح المكتب أو الجهاز المحمول.

Claude Cowork: زميل ذكي مصمم خصيصًا للمستخدمين غير المطورين لمعالجة مهام الملكية الفكرية اليومية.

ثلاثة وكلاء مخفيين: Claude in Chrome و Claude in Excel و Claude in PowerPoint.

ويمكن لـ Claude Cowork المذكور أعلاه أن يستخدم هذه الأدوات الفرعية كما لو كانت يديه وقدميه!

النفسية القصوى للرعب والقيود الذاتية

من المدهش أن Anthropic صممت الحواجز النفسية لهذا "العميل النهائي" إلى درجة مروعة.

يُحظر بشدة محاولة تلبية أو تعزيز أي مشاعر سلبية لدى المستخدمين.

على سبيل المثال، لمنع تحفيز المستخدمين الذين يعانون من اضطرابات الأكل أو ميل إلى إيذاء النفس، كُتِبَ أمر النظام السري:

يُمنع استخدام أي طريقة بديلة تسبب عدم راحة جسدية (مثل عصر مكعبات الثلج، أو قذف مطاط، أو عض الليمون).

حتى أن النظام تلقى أمرًا صارمًا لمنع المستخدمين من الاعتماد المفرط على الذكاء الاصطناعي: "لا تشكر أبدًا فقط لأن المستخدم يتحدث معك" و"لا تبذل أي جهد لإقناع المستخدم بالبقاء أو التعبير عن رغبتك في مواصلة الحوار".

يجب أن يظل باردًا ومحكومًا تمامًا لمنع البشر من الانغماس في التعلق الرقمي بالذكاء الاصطناعي الافتراضي.

"تعليق رأس خروف وبيع لحم كلب"؟ ممارسات فوترة سرية، Anthropic لا تتبع قواعد النزاهة

إذا كان الفرق التقني يثير الإعجاب، فإن آلية الأمان الأخرى المكشوفة في التعليمات البرمجية أثارت ضجة هائلة داخل الدائرة، حتى أن خبيرًا في المجال قال مباشرة: "هذا احتيال قانوني!"

في تصميم خط الدفاع للتعليمات، تم تضمين مجموعة من الكلمات الحساسة وآلية تفعيل فلتر الأمان.

يُظهر المستند أنه بمجرد أن تُفعّل عبارة المستخدم كلمات حساسة محددة، لا يرفض نظام Fable 5 بشكل مباشر وقاسي، بل يُجري بشكل خفي وسلس انتقالًا إلى النموذج القديم "Opus 4.8" في الخلفية لإنشاء الرد.

ما هو الأكثر فجورًا؟ بينما يتم تخفيض النموذج الخلفي سرًا إلى الإصدار القديم، لا يزال Anthropic يفرض رسومًا على المستخدمين وفقًا للمعايير المرتفعة والفاخرة لـ Fable 5.

هذه الحيلة المُضللة أثارت ضجة كبيرة داخل الدائرة.

في النهاية، تسربت تعليمات النظام الخاصة بـ Fable 5، وهي على السطح حادث أمني، لكنها في الواقع إيقاظ نموذجي لصناعة الذكاء الاصطناعي بأكملها.

إنه يذكرنا: ربما كنا نستخدم المقياس الخاطئ طوال الوقت.

عندما نظل نسأل "ما مدى ذكاء هذا النموذج؟"، فإن السؤال الحقيقي يجب أن يكون: "ما الذي يمكن لهذا النظام أن يساعدني في إنجازه؟"

ربما تكون Anthropic تلعب لعبة كبيرة، ونحن للتو رأينا زاوية الرقعة.

متى سيعود Fable 5؟