مخاطر فقدان السيطرة على التطور الذاتي للذكاء الاصطناعي والتعايش البشري الآلي.كاتب المقال، المصدر: زنك إندهستري
مخاطر فقدان السيطرة على التطور الذاتي للذكاء الاصطناعي والتعايش البشري الآلي.
قبل حوالي أسبوع، قامت Anthropic، التي كانت تعدّ للإدراج، بتحديث مقال على مدونتها الرسمية بعنوان "When AI build itself".
في يوم نشر هذه المقالة، عادت مسائل أمان الذكاء الاصطناعي إلى مركز العاصفة الإعلامية مرة أخرى.
تتناول Anthropic في هذه المقالة مشكلة تُسمى "التطور الذاتي للذكاء الاصطناعي"، وتشير إلى أن "الذكاء الاصطناعي قد تمكن بالفعل من المشاركة في بناء نماذج أقوى لنفسه، وهذا أسرع بكثير مما توقعنا."
بالنسبة للحديث، فإن التطور الذاتي للذكاء الاصطناعي ليس تقنية جديدة، بل يمكن القول إنه منذ اليوم الأول لظهور تقنية الذكاء الاصطناعي، كان الناس يفكرون في كيفية إشراك الذكاء الاصطناعي في عملية التطور الذاتي.
كما يتخيله الجميع في مجال الذكاء المتجسد، باستخدام الروبوتات البشرية لصنع روبوتات بشرية.
في الواقع، يخاف علماء الذكاء الاصطناعي من امتلاك الذكاء الاصطناعي لقدرة التطور الذاتي، وفي نفس الوقت يبحثون ويستغلون هذه القدرة على التطور الذاتي.
تاي يوان دونغ، الذي لاقى اهتمامًا واسعًا خلال موجة تسريح الموظفين في ميتا (المدير السابق لأبحاث فريق Meta FAIR)، أعلنت شركته الناشئة في بداية هذا العام، واسم الشركة هو Recursive Superintelligence (RSI)، وهدفها المباشر هو التطور الذاتي للذكاء الاصطناعي.
بالضبط هذه الشركة، التي أكملت مؤخرًا تمويلًا بقيمة 6.5 مليار دولار أمريكي، بقيمة سوقية تبلغ 46.5 مليار دولار أمريكي (حوالي 31.5 مليار يوان)، وتصبح فريقًا ناشئًا للذكاء الاصطناعي في سيليكون فالي يحظى بإعجاب العديد من الشركات العملاقة.

إذًا، ما هو التطور الذاتي للذكاء الاصطناعي بالضبط؟ هل سيؤدي التطور الذاتي إلى فقدان السيطرة على الذكاء الاصطناعي؟ وكيف يمكن للبشر التعايش مع الذكاء الاصطناعي؟
التطور الذاتي للذكاء الاصطناعي الذي يحدث حاليًا هو أيضًا أحد الموضوعات الرئيسية في مؤتمر زهي يوان لهذا العام، حيث شهدنا في مؤتمر زهي يوان لهذا العام تفكيرًا وتوقعات أربعة علماء ذكاء اصطناعي شباب حول هذا الموضوع.
ربما من منظورهم، يمكننا أن نلقي نظرة على المسار المستقبلي لتطور الذكاء الاصطناعي الذاتي، كما يمكننا أن نجد بعض الإلهام للتعامل مع قلقنا بشأن الذكاء الاصطناعي.
العلماء几位 في الذكاء الاصطناعي الذين تم دعوتهم إلى مؤتمر زهي يوان لمناقشة هذه المسألة هم:
الدكتور لين تاو، باحث متميز في قسم الذكاء الاصطناعي، كلية الهندسة، جامعة هسي لي؛
شريك مؤسس NeoCognition، غو يو؛
وانغ يان، باحث خبير سابق في تينسنت هون يوان Frontier؛
دكتورة يانغ مينغ يوي، من جامعة لندن الجامعية، وأستاذة مساعدة في جامعة بريستول.

فيما يلي ملخص وتنظيم لمحتوى حوار الضيوف الأربعة دون تغيير في الأسباب:
01 ما هو التطور الذاتي للذكاء الاصطناعي؟
السؤال: الآن، العديد من أنظمة الذكاء الاصطناعي تقوم بالتأمل وتعديل المُحفزات، مما يبدو وكأنه يحتوي على طابع تحسين ذاتي. إذا أردنا تعريفًا أكثر صرامة، ما هو التطور الذاتي للذكاء الاصطناعي؟
لين تاو: أعتقد أن التطور الذاتي يجب أن يكون تطورًا متعدد المستويات، ويمكن أن يكون تطورًا للدماغ الخارجي أو تطورًا للدماغ الداخلي.
الأهم أن يكون الذكاء الاصطناعي قادرًا على إدراك حدوده بنفسه، وفي نفس الوقت أن يتطور في عقله الخارجي والداخلي، أو أثناء تطور العقل الخارجي، أن يدمج مزيدًا من القدرات الخارجية داخله، لتحقيق تطور إضافي للعقل الداخلي.
غو يو: أعتقد أن أهم جوانب RSI (التحسين الذاتي التكراري) هما بعدان: الاستباقية والتعلم.

كيف يمكن للتعلم أن يمكّن الذكاء الاصطناعي من امتلاك خوارزميات تعلم مستمر وعبر الإنترنت موثوقة؟ ومسألة أخرى هي التطور الذاتي، حيث يجب على العامل أن يعرف إلى أين يحتاج أن يتطور.
لذلك يجب على التطور الذاتي حل مشكلتين منفصلتين:
واحد هو مستوى ما الذي يتعلق بالوعي الذاتي (Metacognition)، حيث يجب أن تعرف ما الذي ينقصك، وما الذي تحتاجه، وكيف يجب أن تختار؛
الآخر هو على مستوى "how"، أي تعلم كيفية تنفيذ الخوارزميات بشكل مفصل.
وانغ يان: على الأقل من حيث نقطة الوقت هذه، مقارنةً بـ SFT و RL التقليديين، إذا كان بإمكان النظام الاعتماد أقل على البشر، فإنه قد حقق بالفعل تطورًا ذاتيًا.
يانغ مينغ يويه: RSI الذي يُشار إليه الآن هو في الواقع خطوة متقدمة أكثر من التحسين الذاتي؛ فهو لا يقتصر فقط على تعزيز القدرات، بل يجب أيضًا النظر في ما إذا كانت "قدرة التطور" نفسها يمكن أن تصبح أقوى.
مشكلة مهمة هي أن اتجاهي البحث لعضوَي فريق المؤسسين لشركة Recursive (Recursive Superintelligence)، جيف كلاين وتيم روكتاشيل، هما الانفتاح المستمر.

إذًا، ما هي الانفتاحية؟
في عالم مفتوح، هل هناك وكيل يمتلك القدرة على طرح أسئلة على نفسه، وهل يمكنه اكتشاف حدود معرفته، وحدود نظامه، وحدود ذاكرته، ويحاول تجاوز هذه الحدود لطرح أسئلة؟
للتخلص من الإنسان والتطور الذاتي، بما في ذلك تحقيق القدرة على التطور، فإن قدرته على طرح الأسئلة مهمة.
السؤال: في هذه النقطة الزمنية اليوم، ما هي أكثر أجزاء الذكاء الاصطناعي قيمةً واحتماليةً للنضج الأول في التطور الذاتي؟
وانغ يان: لا أعلم إن كنتم تشعرون بذلك أم لا، لكن تكرار تحديث النماذج تسارع بعد يناير 2025.
في الواقع، لأن الأشخاص الأكثر دراية بحدود قدرات الذكاء الاصطناعي في مجال النماذج الأساسية لم يعودوا يكتبون الكود، وهذا أمر قد حدث بالفعل أثناء تدريب النماذج الأساسية.
كما يمكن ملاحظة أن سرعة تكرار النماذج الأساسية تزداد، بما في ذلك نماذج Claude وGPT، وكذلك النماذج الأساسية المحلية، ولا يمكن القول إن هذا بالكامل تطور ذاتي، لكن بالفعل هناك ذكاء اصطناعي يُحدث تطورًا في الذكاء الاصطناعي.
أما بالنسبة لأي مجال سيصل أولاً إلى النضج، فإن ما أشعر به بعمق هو مجال تدريب النماذج الأساسية، فعلى الرغم من أن آخرين يحددون اتجاهه، إلا أن الطبيعة الأساسية للنموذج الأساسي تتطور ذاتياً.
السؤال: إذا لم يتم تغيير معلمات النموذج، بل فقط تطوير بعض المكونات الأخرى، هل يمكن للنموذج الأساسي تحقيق قفزة كافية في القدرة؟
وانغ يان: بالتأكيد يمكن.
في الواقع، يمكن تحقيق نتائج أفضل بتعديل الـ Prompt.
على سبيل المثال، أحيانًا أفكر لماذا لا يستطيع المتدربون إنجاز المهام التي أُكلفهم بها، فألقي نظرة على الـPrompt الخاص بهم وأكتشف أن الـPrompt الذي كتبوه غير جيد.
أريد فقط إعادة صياغة مُحفّز أفضل بوضوح أكبر للقواعد لتحقيق نتائج أفضل.
بما أنني أستطيع فعل هذا، فبالتأكيد يمكن للكائنات السيليكونية ذات الأبعاد الأعلى مني فعله بشكل أفضل، حتى دون تغيير معلمات النموذج.

السؤال: ما رأي الأستاذ لين؟
لين تاو: يجب أن تكون هذه عملية تكرارية، ونحتاج إلى تحسين "الهارنيس" (هندسة التحكم)، أي العقل الخارجي، لاستخلاص الحد الأقصى للنموذج الحالي؛
مع زيادة عدد الأشخاص الذين يمتلكون harness، قد تُستخدم هذه البرامج مرة أخرى لتدريب نماذج أساسية أقوى؛
على أساس نماذج أساسية أقوى، سنطور أدوات تجميع أقوى وعقول خارجية أفضل، وهذا أيضًا عملية تكرارية.
السؤال: فما رأيك في أن الموارد الشاملة الآن هي الأكثر نضجًا في أي مجال؟
لين تاو: أعتقد أن صنع harness هو الأسهل.
Guyu: أنا أميل إلى النظر إلى harness و skill من منظور موحد.
من منظور موحد، فهي جميعًا ذاكرة طويلة الأمد، فقط من زوايا مختلفة.
على سبيل المثال، يُعد harness نوعًا من الذاكرة طويلة المدى على مستوى Meta (الوعي الذاتي)، بينما يُعد skill أكثر ارتباطًا بالذاكرة طويلة المدى المتعلقة بسير العمل أو المعرفة العملية، وقد تكون معاملات النموذج أكثر ارتباطًا بالذاكرة طويلة المدى المتعلقة بالحدس.
إذا طُلب مني تحديد أيهما يجب إعطاؤه الأولوية، فمن الصعب القول من منظور أكاديمي، فكل منهما مهم، وهما مكملان لبعضهما البعض ويعززان بعضهما.
من منظور الشركة، هناك العديد من العوامل الواقعية، ومن الأسهل البدء بـ harness؛ فبوجود harness، يمكنك تطوير منتجك، وبوجود المنتج، يمكنك جذب المستخدمين، وبوجود المستخدمين، ستجمع بياناتك وتشكل حلقة مغلقة. هذه نظرة غير تقنية.
يانغ مينغ يويه: أنا أركز أكثر على التطور على مستوى الذاكرة، لأن اتجاه بحثي هو كيفية فهم القواعد والسببية.
الآن سيشعر الجميع أن قدرات النموذج تصبح أقوى تدريجيًا، وتبدأ في تغطية قدرات harness، وتبتلعها تدريجيًا حتى تصل إلى الحد الأقصى.
لذلك من الصعب التنبؤ بالتطور المستقبلي، فقد تصبح النماذج الأساسية أقوى بشكل متزايد، بينما قد تكون التحسينات في اتجاه harness ضئيلة جدًا.
أين تتطور الذكاء الاصطناعي 02 أولاً؟
السؤال: متى يكون من الأنسب أن يحدث التطور الذاتي للذكاء الاصطناعي؟
Guyu: أود أن أضيف نقطة واحدة حول harness، فقد يتم تقليل دور harness مع تقدم النماذج، لكن يعتمد الأمر على الجانب المعني، وأعتقد أن بعض الوحدات لا تزال ضرورية.
على سبيل المثال، الوحدات التي تضمن أمان النموذج وقابلية التحقق منه، وهي الأجزاء التي لا يمكن لأي نموذج احتمالي استبداله أبدًا.
بخصوص توقيت حدوث التطور الذاتي، أعتقد أنه يمكن فهمه على أنه التعلم + الذاكرة طويلة المدى (LTM).
للبشر، كل استدلال وكل حل مشكلة هو فرصة للتعلم، ولا يتعلم الإنسان ببساطة من خلال جمع مجموعة من المشكلات ثم التعلم بشكل ثابت بناءً عليها.
إذا كنت تؤمن أن تعلم الإنسان طريقة فعالة، فأعتقد أن الوكلاء أيضًا كذلك.
سترغب في أن لا يُضيّع العامل أي فرصة استدلال، لأن كل استدلال يوفر فرصة للحصول على إشارة تعلم، وهذا يتماشى مع الفلسفة العامة للتعلم المعزز، لكن التعلم العميق السائد حاليًا لا يزال في مرحلة تحديث معلمات النموذج، ومن الصعب تحقيق إعداد التعلم عبر الإنترنت.
لذلك، لتحقيق هذا الأمر فعليًا، نحتاج إلى بعض خوارزميات التعلم الجديدة، مثل التحديثات القائمة على غير المعلمية.
السؤال: هل هناك فرق بين النظام 1 والنظام 2؟
谷雨: بالفعل.
على سبيل المثال، إذا تم اعتبار الشيء غير المعلَّم كنظام 2، لأنه أكثر وضوحًا وأبطأ، إلا أنه يحتفظ بإمكانية التحول إلى نظام 1، بما في ذلك إنتاج المزيد من البيانات بناءً على قواعد غير معلَّمة مكتسبة، كما ذكر الأستاذ لين حول التحول من العقل الخارجي إلى العقل الداخلي.

وانغ يان: لقد قمت أيضًا بالعديد من أعمال TTT، أي التدريب أثناء الاختبار (Test-Time Training)، وأنا مهتم جدًا بسلسلة الأعمال هذه المتعلقة بـ TTT.
أعتقد أنه عند توقع الرمز التالي، من المهم أن يتعلم النموذج تدرجات التحديث لكل رمز.
في المستقبل، سنتمكن بالتأكيد من إيجاد خوارزمية تدريب تسمح لخوارزمية التدريب نفسها بتعليم النموذج كيفية تحديث تدرجات كل رمز، وهذا هو الفكر الحقيقي المتكامل من البداية إلى النهاية.
لين تاو: من منظور تدريب النموذج، يمكنه أولاً التأثير من التدريب الأولي إلى التدريب اللاحق، حيث يُحسن التدريب اللاحق أداء النموذج ليُنتج نموذجاً أقوى، ثم يُعيد هذا النموذج الأقوى التغذية الراجعة إلى مرحلة التدريب الأولي لتعزيز قدرات النموذج الأساسي، مما يُشكّل حلقة مغلقة.
إذن فهو يتطور في كل لحظة، فقط بمقاييس وطرق مختلفة.
يانغ مينغ يويه: أعتقد أيضًا أن التطور الذاتي يحدث باستمرار وينتشر عبر جميع المراحل.
على سبيل المثال، كيفية إنشاء مسار.
عندما يُنشئ GPT إجابة لسؤال معين، فهو في الواقع يقوم بالاستدلال، والعملية الاستدلالية هي عملية إبداع وتركيب، وهذه العملية الإبداعية والتركيبية هي في جوهرها طريقة لطرح أسئلة على البيئة والإنسان، وبالتالي فإن التصميم الأمامي يحتوي بذاته على تطور في تصميم الآليات.

بالإضافة إلى ذلك، عندما أحصل على مكافأة، مثل تغذية راجعة من البشر، فإن كيفية تحديث المسار بعد الحصول على التغذية الراجعة ستُحسّن العملية بالكامل تدريجيًا.
السؤال: هل تصميم معيار مرجعي خاص بك أيضًا علامة على التطور الذاتي للذكاء الاصطناعي؟
يانغ مينغ يويه: هل يمكننا الآن أن نمتلك معيارًا تنمويًا، بل ونموذجًا عالميًا تنمويًا ذاتيًا متقدمًا؟
الآن، العديد من معايير المقارنة ثابتة، وتُختبر على قاعدة بيانات ثابتة، بحيث يمكن دائمًا العثور على نموذج يُدرّب جيدًا على أساس هذه قاعدة البيانات الثابتة.
للوصول إلى AGI، نحن بالفعل بحاجة إلى تقييمات ديناميكية تتكيف مع قدراتها الحالية وتُجري تقييمات تدريجية متزايدة.
وانغ يان: عندما بدأنا للمرة الأولى في الإنتاج، لم يكن هناك معيار مرجعي، وكانت التقييمات تتم يدويًا من قبل الأشخاص.
ما أتأكد منه هو ما إذا كان يمكن تقييم هذا الأمر باستخدام Benchmark، لأنه بالتأكيد لا يمكن تقييمه باستخدام Benchmark ثابت.
لا أعرف ما إذا كان يمكن حقًا تقييم Dynamic Benchmark، لأن كليهما عاملان يتطوران ذاتيًا، ولا أعرف ما إذا كان سيُعاد في النهاية إلى مسار التقييم البشري القديم.
لكن إذا نظرنا إلى هذا الرأي من هذا المنظور، فقد لا يمكن تقييمه باستخدام Benchmark على الإطلاق.
السؤال: هل سيكون تصميم طريقة التقييم الآلي صعبًا؟
وانغ يان: نعم.
هناك العديد من النماذج المدربة جيدًا على القائمة، ولكن عند التشغيل، تواجه مشاكل مثل التوقف في سير عمل العامل، ويجب إعادة تدريبها باستخدام دورة البيانات المباشرة لتحسين أدائها.
لذلك، لا يمكن تحديد كيفية تقييم الذكاء الاصطناعي بعد تطوره الذاتي.

الآن، أصبحت المعايير الثابتة محدودة جدًا، وبعد بدء التطور الذاتي، حتى هل يمكن تقييمها أصبح مشكلة.
Guyu: أنا أتفق تمامًا مع رأي الأستاذ وانغ.
عندما يصبح نظام ما معقدًا بدرجة كافية، يصبح من الصعب قياسه باستخدام مؤشرات بسيطة، وهذا ينطبق أيضًا على البشر؛ فمن الصعب تقييم شخص ما على أنه جيد أو سيء باستخدام مؤشر بسيط واحد. بمجرد أن يمكن قياس شيء ما باستخدام مؤشر بسيط، يصبح من السهل جدًا اختراقه.
لكن من ناحية أخرى، أعتقد أن الذكاء الاصطناعي الحالي لم يصل بعد إلى هذا المستوى من التعقيد، ولا يزال Benchmark قادرًا على قيادتنا للأمام.
هناك مشكلتان مرتبطتان:
أولاً، هل يجب على الذكاء الاصطناعي اكتشاف المعايير المرجعية الجديدة بنفسه، أم يجب أن يصممها الإنسان؟
أعتقد أنه لا يزال يتطلب تصميمًا بشريًا، لأن Benchmark يمثل هدفًا يجب أن يوفره الإنسان.
ثانيًا، بعد تقديم المرجع من قبل الإنسان، كيف يتم التقييم؟
هذا يختلف تمامًا عن الماضي، حيث كانت مجموعات التدريب والاختبار في المعايير المرجعية ثابتة، وكان التركيز على الدقة النهائية، لكن بالنسبة للذكاء الاصطناعي ذاتي التطور، فإن الاتجاه هو الأهم.
هذا يعود إلى ما قلته للتو، تعلم النماذج الكبيرة = الاستدلال + الذاكرة الطويلة المدى.
كل مرة يقوم النموذج الكبير بإجراء استدلال، فهو يحصل على فرصة للتعلم، لذا إذا أجريت معيارًا مرجعيًا، يجب أن يكون هناك منحنى ثنائي الأبعاد، حيث المحور الأفقي يمثل عدد المهام التي قام بها، والمحور الرأسي يمثل الأداء، وفي الحالة المثالية، يجب أن يتحسن باستمرار.
الفilosofيا الأكبر خلف تقييم الذاتي التكيفي هي: ما هو الذكاء؟

أحب جملة قالها باحث ذكاء اصطناعي — فالذكاء لا يكمن في عدد الأشياء التي يمكنك فعلها، بل في كيفية قيامك بهذه الأشياء.
كانت التقييمات السابقة تركز على المهارات التي اكتسبها النموذج الكبير في النهاية، بينما تدرس التطور الذاتي كيفية اكتساب النموذج الكبير لهذه المهارات، مع التركيز على عملية التعلم.
كيفية التعلم هي الجزء الأكثر جوهرية في التطور الذاتي.
لين تاو: فيما يتعلق بالذكاء، تأثرت سابقًا بقول ما:
الذكاء الحقيقي يجب أن يكون معدل نمو تلك القدرات التي نهتم بها في وحدة الزمن.
هذا يعكس أيضًا إلى حد ما ما هو الذكاء حقًا.
على هذا الأساس، أعتقد أن النموذج والمرجع يجب أن يتطورا معًا.
ما زال البشر هم من يحددون ما إذا كان المعيار المرجعي قد وصل إلى حدوده، وما إذا كان ينبغي تصميم معيار مرجعي جديد وأقوى، واستخدام المعيار المرجعي الجديد لاكتشاف ثغرات النموذج الحالي، وبالتالي دفع تدريب النموذج.
نقطة مهمة مستقبلية هي أنه يمكن تحقيق اكتشاف معيار أكثر أهمية باستخدام طرق شبه تلقائية، على الأقل أولًا بتشغيل مرحلة ما بعد التدريب، وجعل المعايير التي تم اكتشافها شبه تلقائيًا تُحسّن القدرة الأولية للنموذج.
Will AI get out of control?
السؤال: أثناء عملية التطور الذاتي للذكاء الاصطناعي، كيف يمكن تحديد ما إذا كان الذكاء الاصطناعي قد تعلم بشكل خاطئ، أو تطور إلى درجة لا يمكن التحكم فيها؟
وانغ يان: دعونا نأخذ وجهة نظر متشائمة: بعد بضع سنوات، قد لا يتمكن البشر من العيش إلا في أماكن خالية من الإنترنت.
سرعة تطور الذكاء الاصطناعي الآن مخيفة جدًا، وفقدان السيطرة على الذكاء الاصطناعي ليس أمرًا بعيدًا، فالسلامة لا تكمن في التكنولوجيا، بل في قدرة الطبيعة البشرية على ضبط نفسها.
لين تاو: وهذا هو السبب في أنني قلت للتو إننا بحاجة إلى معيار مرجعي شبه آلي، ويجب تحقيق التطور الذاتي للذكاء الاصطناعي تحت معيار مرجعي شبه آلي يشمل مشاركة بشرية.
يمكن على الأقل فرض بعض القيود عليه بحيث لا يتجاوز المعايير التي نرغب في تعريفها كبشر.
يانغ مينغ يويه: ما نتحدث عنه من موثوقية الذكاء الاصطناعي وأمانه وقابلية تفسيره، هو في جوهره ضرورة أن يكون داخليه مرئيًا.
على سبيل المثال، عندما يتخذ نموذج كبير قرارًا، لماذا اتخذ هذا القرار؟ عندما يُجري نموذج كبير تنبؤًا، لماذا يُجري هذا التنبؤ؟
إذًا، فإن أحد الأمور التي نقوم بها حاليًا هو تطوير مجموعة من القواعد التي تربط بين مكونات النماذج الكبيرة جميعها، وتُعرض هذه القواعد مباشرةً أمام البشر لتوضح سبب اتخاذ هذا القرار.
ستصبح قضية الصندوق الأبيض مهمة في المستقبل، بما في ذلك السؤال المطروح للتو حول ما إذا كان الذكاء الاصطناعي قادرًا على التحكم حقًا، حيث يتطلب الأمر أولاً معرفة كيفية اتخاذ القرارات داخله للتحكم فيه.
السؤال: إذا أردت تحقيق التحكم الآمن في RSI، فما الأشياء الأخرى التي يجب القيام بها من منظور السبب والنتيجة؟
يانغ مينغ يويه: إن النظرية السببية التقليدية تعتمد على الإحصاء والاحتمالات، ولا تنطبق اكتشافات السببية والاستدلال السببي التي تشكلها على عصر النماذج الكبيرة.
إذًا، نحن الآن نعود إلى البساطة، ونعود إلى التعريف الأساسي للسبب والنتيجة.

على سبيل المثال، البناء السببي الثلاثي الطبقات، فما هي الصيغة التي يجب أن تتخذها هذه المفاهيم الأساسية في نظام RSI أو النموذج الأساسي أو harness؟ وما هي شروط القيود التي يجب استخدامها لتعلمها؟ هذا هو هدفنا الحالي، لكن هذه المهمة ليست بسيطة.
لماذا يقول الجميع الآن إن نماذج العالم والفهم الفيزيائي صعبة التنفيذ؟ لأن أساليب التعلم الآلي للبيانات الفيزيائية والتعلم الآلي السببي السابقة غير مناسبة بشكل طبيعي لخطط التوسع الرأسي (التوسع العمودي) للنماذج الكبيرة الحالية.
لذلك نحتاج إلى العودة إلى تعريفات هذه الطرق، ورؤية ما هي الأدوات التي يمكنها حل هذه المشكلات.
Guyu: أولاً، قابلية التحكم في الذكاء الاصطناعي، ما إذا كان يمكن التحكم في الذكاء الاصطناعي من قبل الإنسان، ليس لدي أي رأي في هذا الأمر.
كما قال ما يون أيضًا: إنه لا يحب التفكير كثيرًا في الأمور التي لا يمكنه التحكم فيها.
If this really happens, there's nothing I can do to change it.
لذلك أرغب في مناقشة كيفية جعل الذكاء الاصطناعي أكثر قابلية للتحكم على المدى القصير، وبشكل أكثر تحديدًا.
أعتقد أنه بالإضافة إلى التفسيرية واكتشاف العلاقات السببية التي ذكرها الأستاذ يان، هناك بعدان آخران: الموثوقية (reliability) والقابلية للتحقق (verifiability).
الموثوقية تعني أن النموذج أو الوكيل، عندما يقوم بعمل ما، يجب أن يفعله بشكل صحيح هذه المرة، ويجب أن يفعله بشكل صحيح المرة القادمة أيضًا، ولا يمكن أن يكون عشوائيًا؛
القابلية للتحقق تعني أنه عندما يرتكب النموذج أو الوكيل خطأً، يجب أن يكون على دراية بأنه ارتكب خطأً، ولا يمكن أن يكون غير قادر على تحديد ما إذا كان قد أنجز المهمة بشكل صحيح أم لا.
أعتقد أن هذين المؤشرين هما الأكثر واقعية على المدى القصير لتطبيق الوكلاء.
السؤال: كيف يتعاون تطور الذكاء الاصطناعي مع تطور الإنسان خلال عملية التطور الذاتي؟
لين تاو: من ناحيتي الشخصية، استبدلت معظم سير العمل الخاصة بي بالذكاء الاصطناعي، ومع تطور الذكاء الاصطناعي، سأستخدمه لاستبدال المزيد من سير العمل الأصلية الخاصة بي.
هذا بالفعل رفع من كفاءتي، وترك لي وقتًا لاستخدام الذكاء الاصطناعي للمساعدة في التفكير في أشياء أكثر، وهو ما يُعد نوعًا من التطور القائم على الذكاء الاصطناعي بالنسبة لي.

بما أنني أقوم بتدريب النموذج، فقد تحسّن تطور الذكاء الاصطناعي إلى حد ما أثناء تدريب النموذج الأساسي، لكنني أعتقد أن هذا التحسن ليس كبيرًا جدًا؛ يمكن استكشاف طرق أكثر كفاءة في المستقبل لتعزيز تطور البشر بحيث يتطور الذكاء الاصطناعي بشكل أفضل.
يانغ مينغ يويه: كعضو هيئة تدريس، لاحظت بوضوح أثناء تدريسي للطلاب أن استخدامهم لأدوات الذكاء الاصطناعي يزداد بشكل متزايد، لكن هناك الآن مشكلة مهمة جدًا: هل يمكنك حقًا التحكم في هذه الأدوات؟
بما أن الذكاء الاصطناعي يمكنه إنتاج كم هائل من المحتوى، أحيانًا قد تثق به كثيرًا لدرجة أن إيمانك الخاص أو إدراكك للبحث العلمي قد يُحرف إلى مستوى غريب جدًا.
الطلاب الذين يمتلكون أساسًا قويًا يمكنهم استخدام أدوات الذكاء الاصطناعي هذه لإنتاج أعمال عالية الجودة بسرعة؛
الطلاب الذين لا يمتلكون أساسًا قويًا لا يستطيعون استخدام هذه الأدوات الذكية، بل قد يُضللون بها.
لقد تواصلنا مع بعض باحثي DeepMind، وهم يشجعون داخليًا استخدام أدوات الذكاء الاصطناعي، لكنهم يقولون الآن إن القدرة على استخدام هذه الأدوات بفعالية تعتمد بشكل كبير على مدى فهم الشخص لهذه الأدوات.
الآن من المهم أن لا تتخلى عن المفاهيم الأساسية والمعارف الأساسية عند مواجهة أدوات الذكاء الاصطناعي التي تصبح أكثر قوة، كما يجب أن تفهم كيف تم استنتاج بعض الأمور من منظور فلسفي، فهذا هو ما سيتيح لك التعرف على المعلومات الخاطئة التي يقدمها لك الذكاء الاصطناعي، وهذا مهم جدًا.
السؤال: هل سيجبر الذكاء الاصطناعي الإنسان على التطور؟
يانغ مينغ يويه: هذا مؤكد.
أشعر بوضوح أن الذكاء الاصطناعي يخلق فجوة بين الناس؛ فكلما كان أساس الشخص أقوى، تمكّن أكثر من الوصول إلى حالة قمة من خلال الذكاء الاصطناعي.
إذا كنت تستخدم أدوات الذكاء الاصطناعي فقط لمساعدتك على إنجاز المهام، فقد تنتهي النتائج بحالة تبدو ممتازة من الخارج لكنها ضعيفة جوهريًا، لكن كثيرين لم يدركوا هذا الأمر بعد.
وانغ يان: الأشخاص الذين يمتلكون وعيًا مثلما ذكر الأستاذ يانغ في المستقبل، سيخلقون بيئة خالية من الذكاء الاصطناعي لأطفالهم ليكبروا فيها.
الأشخاص الذين لا يمتلكون هذا الوعي من المرجح أن إكمال الواجب هو هدفهم، وأسرع طريقة لذلك هي استخدام الذكاء الاصطناعي.

أدركت أن متدربَيّ، في البداية، ينهون المهام بسرعة، لكنهم لاحقًا لا يلاحظون العديد من المشكلات. وعندما أكتشف هذه المشكلات وأسألهُم، يقولون لي: "الأستاذ وانغ، انتظر عشر دقائق وسأشرح لك السبب" (ويواصلون طلب الإجابات من الذكاء الاصطناعي).
في الواقع، هم لا يعرفون على الإطلاق ما الذي يفعله المشروع بأكمله، ولا يمتلكون تفكيرًا شاملاً، ولا يستطيعون مواكبة إيقاعي.
بدون الذكاء الاصطناعي، كان عليهم أن يتعلموا هذا المعرفة من الصفر، على سبيل المثال، نحن نقوم بالبحث بناءً على DeepSeek، وكان عليهم أولاً قراءة ورقة DeepSeek، والآن سيقولون لـ Claude:
اقرأ الورقة وقم بتنفيذ MemoryIndex (فهرس الذاكرة) على LightningIndex (الفهرس الخفيف).
بما أنهم ينهون العمل بهذه الطريقة، فقد أصبح من الممكن إنجاز الأعمال التي كنت غير قادر على إكمالها بسبب العوامل البدنية، دون الحاجة إلى هؤلاء المتدربين.
السبب الجوهري هو أن سرعة تحسين فهمهم تباطأت، وأن مساعد الذكاء الاصطناعي هذا أكثر كفاءة بالنسبة لي كمدير.
غو يو: أشعر بتوافق كبير مع الأستاذ وانغ، وفي الآونة الأخيرة، نحب كثيرًا في شركتنا قول الأستاذ دوان يينغ بينغ: "البطء هو السرعة".
أنت تستخدم "vibe coding" وتتقدم بسرعة، لكن بعد التقدم، لا يواكب فهمك سرعتك، مما قد يؤدي إلى فقدان السيطرة على برنامجك، ويتطلب منك وقتًا أكبر لتنظيمه.
بالنسبة لهذا السؤال، أعتقد أنه يمكن النظر إليه من منظورين:
أولاً، إذا نظرنا إلى الذكاء الاصطناعي كأداة، فإن العلاقة بين الإنسان والأداة دائمًا ما كانت علاقة تطور مشترك، لأن الأدوات تحدد المهارات التي يمتلكها الإنسان.
قد تكون المهارات التي كان يحتاجها الناس قبل آلاف السنين غير مهمة الآن، والمهارات التي يمتلكها الناس اليوم تُحدَّد بواسطة الأدوات الحالية.
من منظور الأدوات، يجب أن تكون العلاقة بين الذكاء الاصطناعي والإنسان علاقة تعايشية وتطور مشترك.
ثانيًا، إذا لم يكن الذكاء الاصطناعي أداة، بل كائنًا مساويًا للإنسان، بل وأعلى منه، فلن تكون العلاقة المستقبلية هي التقدم المشترك.
قد يكون المستقبل يكفي فيه للإنسان أن يسترخي، وبمنظور متشائم، قد يضطر الإنسان للعمل لصالح الذكاء الاصطناعي.
04 هل RSI هو النموذج الجديد؟
السؤال: هل التطور الذاتي للذكاء الاصطناعي هو استمرار للمسار التقني الحالي أم نموذج تقني جديد؟
لين تاو: حاليًا، يبدو أن الذكاء الاصطناعي قد تطور بشكل طبيعي نحو التطور الذاتي للذكاء الاصطناعي، لكن نضج الوكلاء جعل هذا الأمر أسهل الآن، وهذا لا يعني وجود فروق جوهرية فيه.
وانغ يان: أعتقد أنه المرحلة القادمة.
الآن، جميع النماذج التي يستخدمها الجميع تشارك المعلمات، وفي النهاية، سيحصل كل فرد على منطقة معلمات فريدة خاصة به. هذا الأمر ليس صعبًا الآن، لكن البنية التحتية لا تدعمه حاليًا، كما أنه مكلف جدًا، لكنه لن يصبح عقبة كبيرة في النهاية.
في المستقبل، قد يمتلك كل شخص LoRA خاصًا به، كيف تقوم بتحميل LoRA الخاص بك؟ في المستقبل، ستظهر نماذج دفع جديدة: كلما دفعت مبلغًا أكبر، أصبح LoRA الذي تحمّله أكبر، بينما المستخدمون المجانيون سيستخدمون النموذج الأساسي فقط.
إذا تم تأسيس هذا البنية التحتية، فسيقوم كل LoRA خاص بالفرد بتنفيذ مهامه الشخصية، ما لم يتم تحسين قاعدة دلتا للاستدلال الأمامي، مما يجعله نموذجًا ممتازًا للتعلم الذاتي المتقدم.
هذا يعادل بناء النموذج الأساسي، حيث يمثل التعلم المعزز مرحلة وسطى بين التعلم التقليدي والتعلم الخاضع للإشراف، ونحن بحاجة فقط إلى تزويده بالمهمة والمكافأة والبيئة.
في هذا السياق، المهمة نفسها هي بالفعل آلية مكافأة؛ فعلى سبيل المثال، عندما ينفذ النموذج المهمة ويُنتج النتيجة، وأقول "عمل رائع" أو "عمل سيء جدًا"، فإن هذا يصبح تلقائيًا آلية مكافأة.
أعتقد أن هذا تغيير سيحدث في المستقبل القريب.
Guyu: بالنسبة لهذا السؤال، أعتقد أنه تغيير كمي يؤدي إلى تغيير نوعي، فقد يكون استمرارًا للنماذج التقنية الحالية، وأيضًا فرصة جديدة.
الإجماع الحالي هو أن بعد كمية التغيير هو مدى طول المهام التي تقوم بها الذكاء الاصطناعي، ومع زيادة طول المهام التي تقوم بها الذكاء الاصطناعي، فإنها تقترب أكثر فأكثر من نموذج جديد.
على سبيل المثال، في البداية، كان يمكن للذكاء الاصطناعي فقط إجراء محادثات من جولة واحدة، ثم تطور إلى محادثات متعددة الجولات، والاستدلال الطويل، والبحث العميق، وقد يظهر في النهاية مستوى مدى الحياة.
في ذلك الوقت، سيكون من الضروري طبيعيًا أن يقوم الذكاء الاصطناعي باكتشاف نقاط ضعفه باستمرار وتحسين نفسه، مما يجعله تلقائيًا RSI أو ذاتي التحسين.
يانغ مينغ يويه: في الواقع، تحسين الذات ليس مفهومًا جديدًا للغاية؛ فمنذ بضع سنوات عندما ظهرت نماذج LLM لأول مرة، كنا نقوم ببعض الأعمال المشابهة، والتي تُصنف الآن ضمن فئة تحسين الذات.
أنا أتفق أيضًا أن الوقت الحالي هو لحظة التحول من التغير الكمي إلى التغير النوعي، لكن معياري للتقييم ليس المهام الطويلة الأمد، لأنني أرى أن المهام الطويلة الأمد هي أكثر ما يتعلق بمستوى التخطيط، كما أنها تتطلب أيضًا بعض العمليات الدقيقة.
الوكيل مفهوم واسع جدًا؛ على سبيل المثال، الوكيل المتجسد حاليًا يحتاج إلى القدرة على إنجاز كل حركة، بالإضافة إلى التخطيط للمهام الطويلة المدى.
إنه شيء شامل، هل يمكنه التكيف مع النظام الجديد، وهل يمكن إتمام كل عملية دقيقة بنجاح؟ في الواقع، يمكن إتمام كل عملية من خلال التحسين الذاتي.
في الواقع، التحسين الذاتي هو مجرد أداة تقنية، والهدف النهائي للجميع هو الوصول إلى الذكاء العام الاصطناعي.
السؤال: في المستقبل على مدى 5-10 سنوات، مع نضج تقنية RSI وتطور الذكاء الاصطناعي بشكل ذاتي وقابل للتحكم والنشر، ما الذي سيتغير أولاً؟
لين تاو: أعتقد أنه سيغير كل شيء.
قد تولد مع جهاز ذكاء اصطناعي متنقل يساعدك على فهم العالم، ويبني تدريجيًا رقمك الرقمي الذي يشارك في جميع جوانب حياتك.
هذا في الأساس واقع يمكن تصوره خلال الخمس سنوات القادمة.

Guyu: أوافق أيضًا على أن التغيير يشمل جوانب متعددة، وليس سيناريو معينًا واحدًا.
التغيير الذي أتمناه هو أنه إذا استطاعت الوكلاء أن تحل محلني خلال الخمس إلى العشر سنوات القادمة، فهذا سيكون رائعًا، لأن ريادة الأعمال مرهقة قليلاً، وكأنني أستسلم.
وانغ يان: من المرجح أكثر أن يستخدم رأس المال الذكاء الاصطناعي لاستبدال عدد أكبر من الأشخاص.
أشعر أن هذا شيء سيحدث بشكل طبيعي، والآن لم يُستبدل بعد لأن رواتب البشر ليست أعلى من تكلفة الرموز المميزة، لكنني أتمنى ألا يحدث هذا على الإطلاق.
أريد أن يسمح لنا الذكاء الاصطناعي بالانتقال من نظام العمل لمدة خمسة أيام في الأسبوع إلى ثلاثة أيام في الأسبوع، ومن ثم تقليل ساعات العمل من ثمانية ساعات يوميًا إلى أربع ساعات يوميًا، مع جعل السلع المنتجة أكثر كثرة وأرخص.
يانغ مينغ يويه: من منظور فلسفي، يحتاج البشر للبقاء في هذا العالم أن يكون لديهم قيمة.
أستيقظ كل يوم وأتصفح Xiaohongshu أو Twitter وأرى شيئًا جديدًا يظهر، وأكتشف أن ما أقوم به الآن سيُستبدل من قبل الذكاء الاصطناعي، وأشعر بالقلق من أن الذكاء الاصطناعي سيستبدلني، فما معنى بحثي؟
لذلك أعتقد أن الذكاء الاصطناعي يجب أن يترك مساحة معينة للتفكير البشري، ليتسنى للإنسان التفكير في القيمة الحقيقية للتفكير نفسه بالنسبة للعالم، وأتمنى أن يتطور ببطء أكثر.
