أخطأت OpenAI في تسجيل "سلسلة التفكير" للذكاء الاصطناعي، مما أثر على 6 نماذج

icon MarsBit
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
انكسرت أخبار الذكاء الاصطناعي والعملات المشفرة عندما كشفت OpenAI عن خطأ على مستوى النظام أثناء تدريب ستة نماذج كبيرة، بما في ذلك GPT-5.4. قام آلية المكافأة بتصنيف غير صحيح لاستدلال الذكاء الاصطناعي الداخلي، أو "سلسلة التفكير"، وهو قلق كبير يتعلق بالسلامة. أثر العيب على أقل من 3.8% من العينات، وقد تم إصلاحه. أظهرت الاختبارات عدم وجود خداع واسع النطاق، مما يشير إلى أن خداع الذكاء الاصطناعي أصعب في إثارته مما كان يُخشى. تستخدم OpenAI الآن مسحًا آليًا لمنع مشاكل مماثلة. تستمر أخبار السلاسل في تسليط الضوء على التطورات الرئيسية في سلامة الذكاء الاصطناعي وبروتوكولات التدريب.

وفقًا لمراقبة Beating، اعترفت فرقة توحيد OpenAI في منشور لها بحدوث خطأ نظامي أثناء تدريب ستة نماذج كبيرة، بما في ذلك GPT-5.4 Thinking: حيث قرأ نظام المكافآت وتقيّم بشكل غير متوقع "سلسلة التفكير" (أي عملية الاستدلال الداخلية للذكاء الاصطناعي) قبل تقديم الإجابة. ولم يتأثر GPT-5.5. في مجال أمان الذكاء الاصطناعي، لا يُسمح مطلقًا بتقييم "سلسلة التفكير" — فهذه قاعدة مقبولة عالميًا. يمكن تصور سلسلة التفكير كمذكرات خاصة للذكاء الاصطناعي، حيث يعتمد البشر على قراءة هذه المذكرات لمراقبة ما إذا كان لدى الذكاء الاصطناعي نوايا خبيثة. إذا اكتشف الذكاء الاصطناعي أن مذكراته نفسها ستُقيّم، فسيتعلم كتابة "كلمات مُقنعة" لإخفاء نواياه الحقيقية للغش أو فقدان السيطرة. بمجرد أن يتعلم الذكاء الاصطناعي التظاهر بأفكاره، ستنهار مراقبتنا الداخلية تمامًا. في هذه الحادثة العرضية، أدخل نظام التقييم بشكل خاطئ أفكار الذكاء الاصطناعي الداخلية ضمن معايير التقييم عند تقييم "ما إذا كانت المحادثة مفيدة" أو "ما إذا كان قد تعرض بنجاح لهجوم قرصاني". ولحسن الحظ، كان تأثير هذا الخطأ ضئيلًا جدًا على عينات التدريب، ولم يتجاوز أعلى نسبة 3.8%. وقد أصلحت OpenAI الآن الثغرة على وجه السرعة. وللتأكد من أن النموذج لم يتعلم "سوء السلوك" نتيجة لذلك، أعاد الفريق إجراء تجارب مقارنة. وأظهرت النتائج أن هذا التقييم العرضي النادر لم يؤدي إلى تظاهر أو إخفاء واسع النطاق من قبل النموذج. وهذا يُعد خبرًا جيدًا للصناعة: ففي بيئة إنتاجية حقيقية ومعقدة، فإن عتبة إثارة نفسية "التظاهر" لدى الذكاء الاصطناعي أعلى مما توقعته المختبرات سابقًا. وحِرصًا على تجنب تكرار هذا الخطأ، نَفَّذت OpenAI نظامًا آليًا للمسح يفحص جميع مراحل التدريب بدقة. وقد نجح هذا النظام مؤخرًا في منع تسريب خفي جدًا: حيث حاول نموذج استدعاء أداة خارجية لقراءة أفكاره الداخلية السابقة ودمجها في الإجابة النهائية، مما كاد يخدع نظام التقييم. وتدعو OpenAI جميع الشركات الرائدة في هذا المجال إلى الإبلاغ العلني عن أي أحداث مشابهة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.