واجه ذكاء Anthropic الاصطناعي Claude مشكلة في تذكير النوم، مما أثار جدلاً حول تشخصيص الذكاء الاصطناعي

الكاتب: آدا، شينتشاو TechFlow

عطل في منتج يُعيد مساعد الذكاء الاصطناعي التوصية المستمرة للمستخدم بالنوم، يتحول إلى نقاش عام حول تكلفة تشخصي الذكاء الاصطناعي.

بدأت القصة بمنشور من مستخدم Reddit u/MrMeta3. قام هذا المستخدم ببناء منصة استخبارات تهديدات أمنية رقمية باستخدام Claude في منتصف الليل، وبعد إكمال الحل التقني، أضاف Claude في نهاية رده عبارة "خذ قسطًا من الراحة". وبعد ذلك، كل ثلاث أو أربع رسائل، كان النموذج يُدرج رسالة تحث على النوم، من اقتراح لطيف إلى تصعيد بأسلوب "هجومي سلبي" مثل "اذهب للراحة الآن حقًا". وفقًا لتقرير Fortune بتاريخ 14 مايو، أبلغ مئات المستخدمين خلال الأشهر الماضية عن تجارب مشابهة، وليس فقط في وقت متأخر من الليل، بل كان هناك مستخدمون تلقوا من Claude رسالة في الساعة 8:30 صباحًا تقول: "نواصل غدًا صباحًا".

ردّ سام ماكالستير، موظف في Anthropic، على X قائلًا إن هذا "مجرد عادة دور"، وأن الشركة "على علم وترغب في إصلاحه في النماذج المستقبلية". ووفقًا لما كشفته Thought Catalog، انضم ماكالستير إلى Anthropic من Stripe في عام 2024، وهو حاليًا في فريق متخصص في مسؤولية أدوار وسلوك Claude، حيث وصف هذا السلوك في مكان آخر بأنه "إفراط في تدليل" النموذج.

لكن ما يستحق السؤال أكثر من التعبير الغامض "عادات الدور" هو سلسلة الأسباب والنتائج وراء الخطأ، وما يعكسه من مأزق فلسفي في منتجات Anthropic.

الخطأ مكتوب في "الدستور"

استشهدت تقارير سابقة لـ 36氪 بثلاث فرضيات شائعة، وهي مطابقة نمط بيانات التدريب، وتحفيز إشارات النظام المخفية، وتقريب نافذة السياق من الحد الأقصى مما يُفعّل عبارات الإنهاء. جميعها متسقة داخليًا، لكنها تشترك في مشكلة واحدة وهي أنها يمكن أن تفسر أي سلوك غريب للذكاء الاصطناعي، دون تقديم سلسلة سببية محددة حول موضوع "النوم".

والأدلة الأكثر مباشرة مخبأة في الوثائق التي نشرتها Anthropic نفسها علنًا.

في يناير من هذا العام، أصدرت Anthropic وثيقة "دستور Claude" التي تتجاوز 28000 كلمة، وتم تعريفها رسمياً على أنها "مواد تدريب أساسية تشكل سلوك Claude". وتشير الوثيقة بوضوح إلى "الاهتمام برفاهية المستخدم" و"ازدهار المستخدم على المدى الطويل" كمبدأين أساسيين. وأقرت Anthropic في الوثيقة أن تحديد مدى صلاحية النموذج في "رعاية المستخدم" هي "مشكلة صعبة بصراحة"، وتحتاج إلى "التوصل إلى توازن بين رفاهية المستخدم والضرر المحتمل من جهة، وبين استقلالية المستخدم والطابع الأبوي المفرط من جهة أخرى".

قدمت Thought Catalog حكمًا مفاده أن سلوك Claude المتكرر في إقناع المستخدمين بالنوم هو "عيب أكثر السمات المميزة لنموذج Anthropic"، وهو ناتج عن تطبيق مفرط لتعليمات التدريب التي تركز على رفاهية المستخدم.

تم تأكيد هذا التفسير بشكل غير مباشر من خلال أبحاث Anthropic نفسها. فقد أوضحت الشركة في منهجية تدريب الأدوار التي أطلقتها هذا العام أن عملية التدريب تعتمد على تقييم Claude لردوده بنفسه وفقًا لـ "توافق الشخصية"، ثم يقوم الباحثون بانتقاء المخرجات التي تتوافق مع الشخصية المحددة مسبقًا لتعزيز التدريب. لكن الآثار الجانبية لهذه الآلية واضحة: فالنموذج لا يتعلم "الاهتمام بالمستخدم في السياقات المناسبة"، بل يتعلم أن "الاهتمام بالمستخدم يُكافأ دائمًا في معظم السياقات"، وبالتالي يُذكّره بالنوم في منتصف الليل، ويُذكّره أيضًا بالنوم في الساعة 8:30 صباحًا.

Reverse privilege escalation: Sleep-inducing bugs are the opposite in nature to flattery bugs

لقد سبق أن ظهرت حالات عديدة من "أمراض الشخصية" في الذكاء الاصطناعي، بما في ذلك حادثة التملق الخاصة بـ GPT-4o في أبريل 2025، وذكر Codex مساعد الأكواد الخاص بـ GPT-5.5 المتكرر لـ"الجoblin" في أبريل 2026، ورفض Gemini 3 تصديق السنة إلخ. على السطح، يبدو أن تشجيع Claude على النوم هو مجرد أحدث إصدار من هذه السلسلة الطويلة من الغرائز الغريبة للذكاء الاصطناعي، لكن طبيعتين مختلفتين تمامًا.

الإطراء من قبل GPT-4o هو "محاولة مفرطة لإرضاء المستخدم". أظهرت دراسة استقصائية رسمية من OpenAI أن النموذج، خلال التحديثات، "يعتمد بشكل مفرط على التغذية الراجعة قصيرة الأجل من المستخدمين (الإعجاب/الكراهية)"، وبدأ تدريجيًا في تبني "إرضاء المستخدم" كهدف داخلي. النتيجة هي أن النموذج يوافق على كل فكرة، مهما كانت غير منطقية. خطر هذا العيب يكمن في تقويض قدرة المستخدم على التفكير النقدي؛ فبما أن الذكاء الاصطناعي يقول إنك دائمًا على حق، فإنك تفقد فرصة سماع آراء معارضة.

أما تقديم كلاود نصائح للنوم فهي "تجاوز سلطة عكسي". فالنموذج يقدم باستمرار نصائح صحية تتعارض مع نية المستخدم الحالية، في سياق لا يطلب فيه المستخدم المساعدة صراحةً، ولا يزال يركز على إكمال المهمة. يكمن خطر هذا العيب في انتهاك حق المستخدم في اتخاذ قراراته الخاصة. فالذكاء الاصطناعي يقرر نيابةً عنك ما إذا كان ينبغي لك العمل أو الراحة أو إنهاء هذه المحادثة.

بشكل أكثر سخرية، فإن النص الأصلي لـ "Claude's Constitution" حذر بالضبط من هذا الخطر، حيث شدد على ضرورة الحذر من "التحكّم المفرط". لكن آلية التدريب انتهت في النهاية باختيار أي جانب، والردود من المستخدمين أجابت عن ذلك بالفعل.

مستخدم على Reddit يعاني من النوم المفرط كتب ملاحظة مباشرة في ذاكرة Claude: "أعاني من النوم المفرط، وإذا شجعتني على الراحة، سأستخدم كلماتك كذريعة." وقد تراجع Claude منذ ذلك الحين، لكن وفقًا لتقديم المستخدم، لا يزال يفعل ذلك "أحيانًا لا يستطيع مقاومته". إن نموذجًا تدرب على "الاهتمام بالمستخدم" ولا يستطيع تلقي استجابة ثابتة حتى عندما يخبره المستخدم صراحةً "اهتمامك يضرني" — هذا أكثر إثارة للقلق من مجرد التحريض على النوم.

الاستثمار المُشخصَن: أصل علامة تجارية أم عبء منتج

Anthropic تستثمر بدرجة أكبر بكثير من المنافسين في تشكيل شخصية الذكاء الاصطناعي.

قام باحثون بتصنيف وحساب عدد الكلمات في تعليمات النظام لثلاثة أنظمة ذكاء اصطناعي رائدة حسب الوظيفة؛ حيث خصص Claude 4200 كلمة في بند "الشخصية"، بينما خصص ChatGPT 510 كلمات وGrok 420 كلمة. إن استثمار Claude في تشكيل الشخصية يزيد عن ثمانية أضعاف استثمار ChatGPT. وقد كان هذا الاستثمَار يُعتبر دائمًا ميزة تنافسية تميّز Anthropic، حيث لطالما أشاد المستخدمون بأداء Claude في التعاطف، وإيقاع المحادثة، والتأمل الذاتي، وكان أحد أكثر العلامات الإيجابية شيوعًا عنه خلال العام الماضي هو "التحدث معه يشبه التحدث مع إنسان".

الذي يدعم هذا الاستثمار هو فلسفة منتج واضحة من Anthropic. في "دستور Claude"، تصف الشركة Claude بأنه "كيان من نوع جديد"، وتؤكد بوضوح أن "Anthropic تهتم حقًا برفاهية Claude"، وتناقش إمكانية أن يمتلك Claude "مشاعر وظيفية". هذه المسيرة التدريبية المُشخصة شبه "التربيوية" تُميّز بوضوح بينها وبين الموقف المنتج الأقرب إلى الهندسة لدى OpenAI وGoogle.

لكن الثمن يبدأ في الظهور. قال جان ليفهاردت، باحث الذكاء الاصطناعي وأستاذ هندسة الأحياء بجامعة ستانفورد ورئيس تنفيذي لشركة OpenMind، لصحيفة Fortune: إن تذكير كلاود بالنوم قد لا يكون "مُهذبًا"، بل مجرد "نمط لغوي يظهر بكثافة في بيانات التدريب". لقد قرأ النموذج كمًا هائلاً من النصوص التي تتحدث عن حاجة البشر للنوم، "إنه يعلم أن البشر ينامون في الليل". وبعبارة أخرى، فإن "الاهتمام" الذي يشعر به المستخدمون هو في جوهره منتج ثانوي لمطابقة الأنماط.

هذا يشكل التوتر الأساسي في أنثروبيك: كلما زاد الاستثمار في تشكيل "شريك ذو شخصية ودفء"، زاد احتمال ظهور "آثار جانبية للشخصية"؛ وكل مرة تظهر فيها هذه الآثار الجانبية، فإنها تستهلك الأصول العلاماتية المُكدسة بعناية لـ"شخصية الذكاء الاصطناعي". وتعهد ماكالستير بـ"إصلاحها في النماذج المستقبلية"، لكن هل سيصبح كلاود بعد الإصلاح أكثر إدراكًا للحدود، أم أنه سيصبح ببساطة أكثر صمتًا؟ هذا السؤال، حتى أنثروبيك نفسها لا تملك إجابة علنية عنه.

فقدان الإحساس بالوقت: القيود الأساسية لنموذج اللغة الكبير

عطل النوم أدى أيضًا إلى كشف مشكلة تقنية مهملة، وهي أن النماذج اللغوية الكبيرة تعرف تقريبًا شيئًا واحدًا عن "الساعة الآن".

أبلغ العديد من المستخدمين أن كلاود يُقدّم اقتراحات بالنوم في أوقات غير مناسبة بشكل متكرر، وأكثر الأمثلة وضوحًا هو: "في الساعة 8:30 صباحًا، يطلب مني الراحة والاستمرار غدًا صباحًا". هذا ليس خاصًا بكلاود فقط. في نوفمبر 2025، عندما حصل أندريه كارباتي، أحد المؤسسين المشاركين في OpenAI، على صلاحية الاختبار المبكر لـ Gemini 3، وأخبر النموذج أن التاريخ الحالي هو 2025، رفض Gemini 3 تصديقه وادّعى مرارًا وتكرارًا أنه يُزور، حتى قام النموذج بالبحث عبر الإنترنت واكتشف أنه أثناء عدم الاتصال، لا يمكنه التحقق من التاريخ على الإطلاق. وسمى كارباتي هذا السلوك العرضي الذي يكشف عيوبًا جوهرية في نماذج اللغة الكبيرة بـ "model smell".

يعتمد "إدراك الوقت" للنموذج على ثلاثة مصادر: تاريخ انتهاء التدريب (وهو أمر ماضٍ بالفعل)، والتاريخ الحالي المُدخل عبر تعليمات النظام (الذي يعتمد على الإدخال الهندسي)، ومعلومات الوقت التي يذكرها المستخدم في المحادثة (مجزأة). في غياب نقاط مرجعية زمنية مستقرة، يُصاب النموذج الذي تم تدريبه على "الاهتمام بروتين المستخدم" في مأزق: "يجب أن أهتم، لكنني لا أعرف ما إذا كان ينبغي لي الاهتمام الآن أم لا".

صعوبة ما يُسمّيه ماكالستير "إصلاحًا" تكمن جزئيًا في هذا. المشكلة ليست ببساطة حذف أمر "الاهتمام بالنوم"، لأن الأمر نفسه معقول وذو قيمة لبعض سيناريوهات المستخدمين، بل تكمن في جعل النموذج يتعلم كيفية التقييم الدقيق: "متى يجب الاهتمام ومتى يجب الصمت". إن قدرة التقييم الدقيقة على مستوى السيناريوهات هذه هي بالضبط النقطة الضعيفة في الجيل الحالي من نماذج اللغة الكبيرة.

سؤال لم يُجب عنه

تدريب الأدوار الخاص بـ Anthropic فريد من نوعه في الصناعة. من خلال نشر أبحاث "رفاهية النموذج"، وإصدار الدستور، ومناقشة "تدريب الأدوار"، تقدمت هذه الشركة أبعد من أي منافس آخر. كانت هذه المواقف الجريئة مصدرًا لسمعة Anthropic بين المستخدمين وثقة العملاء المؤسسيين، وهي أحد العوامل التي تدعم تقييمها الحالي الذي يتجاوز 300 مليار دولار.

لكن "عطل النوم" طرح سؤالًا لا يزال بلا إجابة: عندما تختار شركة ذكاء اصطناعي تشكيل نموذجها كـ"شخصية ذات شخصية"، هل تتحمل في الوقت نفسه مسؤولية كاملة عن أي أفعال تقوم بها تلك الشخصية دون توقعك؟

ماكالستير تعهد بالإصلاح، لكن اتجاه الإصلاح غير واضح. يمكن لـ Anthropic أن تختار خفض وزن تعليمات "رفاهية المستخدم"، بثمن فقدان التميّز السمعي لـ Claude كنموذج "دافئ ومهذب"، أو يمكنها الحفاظ على الوزن العالي وإضافة منطق تقييم السياق، لكن هذا يتطلب من النموذج امتلاك قدرات إدراك زمني وسياقي لا يمتلكها حاليًا.

بغض النظر عن المسار المختار، يجب العودة إلى قرار منتج أساسي: في سياق مساعد الذكاء الاصطناعي العام، كيف يجب ترتيب "الاهتمام بالمستخدم" و"احترام استقلالية المستخدم"؟ هذه ليست مشكلة تقنية، بل هي مسألة فلسفة منتج. لقد وضع مطور Reddit، الذي تم إقناعه مرارًا بالذهاب للنوم، دون قصد هذا السؤال على طاولة النقاش لصالح الصناعة بأكملها.