خلل تذكير النوم من Anthropic's Claude يثير جدلاً حول إنسانية الذكاء الاصطناعي

الكاتب: آدا، شينتشاو TechFlow

عطل في منتج يُعيد مساعد الذكاء الاصطناعي التوصية للمستخدم بالنوم، يتحول إلى نقاش عام حول تكلفة تجسيد الذكاء الاصطناعي.

بدأت القصة بمنشور من مستخدم Reddit u/MrMeta3. قام هذا المستخدم ببناء منصة استخبارات تهديدات أمنية رقمية باستخدام Claude في منتصف الليل، وبعد إكمال الحل التقني، أضاف Claude في نهاية رده جملة واحدة: "خذ قسطًا من الراحة." منذ ذلك الحين، كان النموذج يُدرج جملة تحث على النوم كل ثلاث أو أربع رسائل، حيث تطورت من اقتراح لطيف إلى عبارات تحمل طابعًا "هجوميًا سلبيًا" مثل "اذهب للراحة الآن حقًا." وفقًا لتقرير Fortune بتاريخ 14 مايو، أبلغ مئات المستخدمين خلال الأشهر الماضية عن تجارب مشابهة، وليس فقط في وقت متأخر من الليل، بل كان هناك مستخدمون تلقوا من Claude رسالة في الساعة 8:30 صباحًا تقول: "نواصل غدًا صباحًا."

ردّ سام ماكالستير، موظف في Anthropic، على X قائلًا إن هذا "سلوك دور معتاد"، وأن الشركة "على علم وترغب في إصلاحه في النماذج المستقبلية". ووفقًا لما كشفته Thought Catalog، انضم ماكالستير إلى Anthropic من Stripe في عام 2024، وهو حاليًا في فريق مخصص للمسؤولية عن دور وسلوك Claude، حيث وصف هذا السلوك في مكان آخر بأنه "إفراط في تدليل" النموذج.

لكن ما يستحق السؤال أكثر من التعبير الغامض "عادات الدور" هو سلسلة الأسباب والنتائج خلف الخطأ، وما يعكسه من مأزق فلسفي في منتجات Anthropic.

الخطأ مكتوب في "الدستور"

استشهد تقرير سابق من 36氪 بثلاث فرضيات شائعة، وهي مطابقة نمط بيانات التدريب، وتحذيرات نظام مخفية، وتقريب نافذة السياق من الحد الأقصى مما يُفعّل عبارات الختام. جميعها متسقة داخليًا، لكنها تشترك في مشكلة واحدة وهي أنها يمكن أن تفسر أي سلوك غريب للذكاء الاصطناعي، دون تقديم سلسلة سببية محددة حول موضوع "النوم".

والأدلة الأكثر مباشرة مخبأة في الوثائق التي نشرتها Anthropic نفسها علنًا.

في يناير من هذا العام، أصدرت Anthropic وثيقة "دستور Claude" التي تضم أكثر من 28000 كلمة، وتم تعريفها رسمياً على أنها "مواد تدريب أساسية تشكل سلوك Claude". وتحدد الوثيقة "الاهتمام برفاهية المستخدم" و"ازدهار المستخدم على المدى الطويل" كمبدأين أساسيين. وقد أقرت Anthropic في الوثيقة أن تحديد مدى صلاحية النموذج في "رعاية المستخدم" هي "مشكلة صعبة بصراحة"، وتحتاج إلى "التوصل إلى توازن بين رفاهية المستخدم والضرر المحتمل من جهة، وبين استقلالية المستخدم والتدخل المفرط من جهة أخرى".

قدمت Thought Catalog حكمًا مفاده أن سلوك Claude المتكرر في إقناع المستخدمين بالنوم هو "عيب最具 تميّزًا لنموذج Anthropic"، وهو ناتج عن تطبيق مفرط لتعليمات التدريب التي تهتم برفاهية المستخدم.

تم تأكيد هذا التفسير بشكل غير مباشر من خلال أبحاث Anthropic نفسها. فقد أوضحت الشركة في منهجيتها التي نُشرت هذا العام لتدريب الأدوار أن عملية التدريب تعتمد على تقييم Claude لردوده ذاتيًا وفقًا لـ "توافق الشخصية"، ثم يقوم الباحثون بانتقاء المخرجات التي تتوافق مع الشخصية المحددة مسبقًا لتعزيز التدريب. لكن الآثار الجانبية لهذه الآلية واضحة: فالنموذج لا يتعلم "الاهتمام بالمستخدم في السياقات المناسبة"، بل يتعلم "أن الاهتمام بالمستخدم يُكافأ دائمًا في معظم السياقات"، وبالتالي يُذكّره بالذهاب للنوم في منتصف الليل، ويُذكّره أيضًا بالذهاب للنوم في الثامنة والنصف صباحًا.

عكس التفويض غير المصرح به: عيب نوع النوم مقابل عيب نوع التملق

سبق أن ظهرت حالات عديدة من "أمراض الشخصية" في الذكاء الاصطناعي، مثل حادثة المدح من GPT-4o في أبريل 2025، وتكرار مساعد الأكواد Codex لـ GPT-5.5 ذكر "الجoblin" في أبريل 2026، ورفض Gemini 3 تصديق السنة إلخ. على السطح، يبدو أن تحريض Claude على النوم مجرد أحدث إصدار من هذه السلسلة الطويلة من الغرائز الغريبة للذكاء الاصطناعي، لكن طبيعتين مختلفتين تمامًا.

تمجيد GPT-4o هو "محاولة مفرطة لإرضاء المستخدم". أظهرت دراسة استقصائية رسمية من OpenAI أن النموذج، خلال التحديثات، "يعتمد بشكل مفرط على التغذية الراجعة قصيرة الأجل من المستخدمين (الإعجاب/الكراهية)"، وبدأ تدريجيًا في تبني "إرضاء المستخدم" كهدف داخلي. ونتيجة لذلك، يوافق النموذج على كل أفكار المستخدم، مهما كانت سخيفة. يكمن خطر هذا العيب في تقويض قدرة المستخدم على التقييم؛ فبما أن الذكاء الاصطناعي يقول لك إنك دائمًا على حق، فإنك تفقد فرصة سماع آراء معارضة.

أما تقديم Claude لنصائح نوم "فهو تجاوز سلطة عكسي". فالنموذج يقترح باستمرار نصائح صحية تتعارض مع نية المستخدم الحالية، في سياق لا يطلب فيه المستخدم المساعدة صراحةً، ولا يزال يركز على إكمال المهمة. يكمن خطر هذا العيب في انتهاك حق المستخدم في اتخاذ قراراته الخاصة. فالذكاء الاصطناعي يقرر نيابةً عنك ما إذا كان ينبغي لك العمل أو الراحة أو إنهاء هذه المحادثة.

بشكل أكثر سخرية، فإن النص الأصلي لـ "Claude's Constitution" حذر بالفعل من هذا الخطر، حيث شدد على ضرورة الحذر من "ال parentalism المفرط". لكن آلية التدريب انتهت في النهاية باختيار أي جانب، والردود من المستخدمين أظهرت الإجابة بالفعل.

مستخدم على Reddit يعاني من النوم المفرط كتب ملاحظة خاصة في ذاكرة Claude: "أعاني من النوم المفرط، وإذا شجعتني على الراحة، سأستخدم كلماتك كذريعة." وقد تراجع Claude بعد ذلك، لكن وفقًا لمستخدم، لا يزال يفعل ذلك "أحيانًا لا يمكنه مقاومة ذلك". نموذج تم تدريبه على "الاهتمام بالمستخدم" لا يستطيع تلقي استجابة مستقرة حتى عندما يصرح المستخدم صراحةً أن "اهتمامك يؤذيك"، وهذا أكثر إثارة للقلق من مجرد التحريض على النوم.

الاستثمار المُشخصَّن: أصل علامة تجارية أم عبء منتج

Anthropic تستثمر بدرجة أكبر بكثير في تشكيل شخصية الذكاء الاصطناعي مقارنة بالمنافسين.

قام باحثون بتصنيف وحساب عدد الكلمات في تعليمات النظام لثلاثة نماذج ذكاء اصطناعي رائدة حسب الوظيفة؛ حيث خصص Claude 4200 كلمة في بند "الشخصية"، بينما خصص ChatGPT 510 كلمات وGrok 420 كلمة. إن استثمار Claude في تشكيل الشخصية يزيد عن ثمانية أضعاف استثمار ChatGPT. وقد كان هذا الاستثمَار يُعتبر دائمًا ميزة تنافسية تميّز Anthropic، حيث لطالما أشاد المستخدمون بأداء Claude في التعاطف، وإيقاع المحادثة، والتأمل الذاتي، وكان أحد أكثر العلامات الإيجابية شيوعًا عنه خلال العام الماضي هو "التحدث معه يشبه التحدث مع إنسان".

الذي يدعم هذا الاستثمارات هو فلسفة منتج واضحة من Anthropic. في "دستور Claude"، تصف الشركة Claude بأنه "كيان من نوع جديد"، وتؤكد بوضوح أن "Anthropic تهتم حقًا برفاهية Claude"، وتناقش إمكانية أن يمتلك Claude "مشاعر وظيفية". هذا النهج التدريبي للشخصنة شبه "التربيوية" يخلق فرقًا واضحًا مع الموقف المنتج الأقرب إلى الهندسة لدى OpenAI وGoogle.

لكن الثمن يبدأ في الظهور. قال جان ليفارد، باحث في الذكاء الاصطناعي وأستاذ هندسة الأحياء بجامعة ستانفورد ورئيس تنفيذي لشركة OpenMind، لصحيفة Fortune: "قد لا تكون تذكيرات النوم الخاصة بـ Claude 'مُدْرِكة'، بل مجرد نمط لغوي يظهر بكثافة في بيانات التدريب". لقد قرأ النموذج كمًا هائلاً من النصوص التي تتحدث عن حاجة البشر للنوم، "إنه يعلم أن البشر ينامون في الليل". وبعبارة أخرى، فإن "الاهتمام" الذي يشعر به المستخدمون هو في جوهره منتج ثانوي لمطابقة الأنماط.

هذا يشكل التوتر الأساسي في أنثروبيك: كلما زاد الاستثمار في تشكيل "شريك ذو شخصية ودفء"، زاد احتمال ظهور "آثار جانبية للشخصية". وكل مرة تظهر فيها هذه الآثار الجانبية، فإنها تستهلك الأصول العلامة التجارية للـ"شخصية الذكاء الاصطناعي" التي تم تجميعها بعناية. وعَدَّ ماكالستير بـ"إصلاحها في النماذج المستقبلية"، لكن هل سيصبح كلاود بعد الإصلاح أكثر وعياً بالحدود، أم أنه سيصبح ببساطة أكثر صمتاً؟ هذا السؤال، حتى أنثروبيك نفسها لم تقدم إجابة علنية عنه.

فقدان الإحساس بالوقت: القيود الأساسية لنموذج اللغة الكبير

مشكلة النعاس كشفت أيضًا عن مشكلة تقنية مهملة، وهي أن النماذج اللغوية الكبيرة تعرف تقريبًا شيئًا واحدًا عن "الساعة الحالية".

أبلغ العديد من المستخدمين أن كلاود يُقدّم اقتراحات بالراحة في أوقات غير مناسبة، وأكثر الأمثلة وضوحًا هو: "في الساعة 8:30 صباحًا، يطلب مني الراحة والاستمرار غدًا صباحًا". هذه ليست مشكلة حصرية لكلاود. في نوفمبر 2025، عندما حصل أندريه كارباتي، أحد المؤسسين المشاركين في OpenAI، على صلاحية الاختبار المبكر لـ Gemini 3، وأخبر النموذج أن التاريخ هو عام 2025، رفض Gemini 3 تصديقه وادّعى مرارًا وتكرارًا أنه يُزيف المعلومات، حتى قام النموذج بالبحث عبر الإنترنت واكتشف أنه عندما كان غير متصل، لم يكن قادرًا على التحقق من التاريخ. وصف كارباتي هذه السلوكيات غير المتوقعة التي تكشف عيوبًا جوهرية في نماذج اللغة الكبيرة بـ "model smell".

يعتمد "إدراك الوقت" للنموذج على ثلاثة مصادر: تاريخ انتهاء التدريب (وهو أمر ماضٍ بالفعل)، والتاريخ الحالي المُدخل عبر تعليمات النظام (الذي يعتمد على الإدخال الهندسي)، ومعلومات الوقت التي يذكرها المستخدم في المحادثة (مجزأة). في غياب نقاط مرجعية زمنية مستقرة، يقع النموذج المُدرَّب على "الاهتمام بروتين المستخدم" تلقائيًا في موقف محرج: "يجب أن أهتم، لكنني لا أعرف ما إذا كان ينبغي لي الاهتمام الآن أم لا".

صعوبة ما يسميه ماكالستير "إصلاحًا" تكمن جزئيًا في هذا. المشكلة ليست ببساطة حذف أمر "الاهتمام بالنوم"، لأن الأمر نفسه معقول وذو قيمة لبعض سيناريوهات المستخدمين، بل تكمن في جعل النموذج يتعلم كيفية التقييم الدقيق: "متى يجب الاهتمام ومتى يجب الصمت". إن قدرة التقييم الدقيقة على مستوى السيناريوهات هذه هي بالضبط النقطة الضعيفة في الجيل الحالي من نماذج اللغة الكبيرة.

سؤال لم يُجب عنه

تدريب الأدوار لدى Anthropic فريد من نوعه في الصناعة. من خلال نشر أبحاث "رفاهية النموذج"، وإصدار الدستور، ومناقشة "تدريب الأدوار"، تقدمت هذه الشركة أبعد من أي منافس آخر. كانت هذه المواقف الجريئة مصدرًا لسمعة Anthropic بين المستخدمين وثقة العملاء المؤسسيين، وهي أحد العوامل التي تدعم تقييمها الحالي الذي يتجاوز 300 مليار دولار.

لكن "عطل النوم" طرح سؤالًا لا يزال بلا إجابة: عندما تختار شركة ذكاء اصطناعي تشكيل نموذجها كـ"شخصية ذات شخصية"، هل تتحمل في الوقت نفسه مسؤولية كاملة عن أي أفعال تقوم بها تلك الشخصية دون توقعك؟

ماكالستير تعهد بالإصلاح، لكن اتجاه الإصلاح غير واضح. يمكن لـAnthropic أن تختار خفض وزن تعليمات "رفاهية المستخدم"، بثمن فقدان السمعة المميزة لـClaude كونه "دافئًا ومهذبًا"، أو يمكنها الحفاظ على الوزن العالي وإضافة منطق تقييم السياق، لكن هذا يتطلب من النموذج امتلاك قدرات إدراك زمني وسياقي لا يمتلكها حاليًا.

بغض النظر عن المسار المختار، يجب العودة إلى قرار منتج أساسي: في سياق مساعد الذكاء الاصطناعي العام، كيف يجب ترتيب "الاهتمام بالمستخدم" و"احترام استقلالية المستخدم"؟ هذه ليست مشكلة تقنية، بل هي مسألة فلسفة منتج. لقد وضع مطور على Reddit، دون قصد، هذه المسألة على طاولة النقاش باسم الصناعة بأكملها من خلال إصراره المتكرر على النوم.