أطلقت Anthropic نموذجًا ذكيًا جديدًا برمز Mythos، والذي يتفوق بشكل شامل على أقوى النماذج الحالية Claude Opus 4.6 في القدرات مثل البرمجة والاستدلال واكتشاف الثغرات؛ نظرًا لقدرته التحويلية على التهديدات الأمنية، لم يُطرح رسميًا بعد، بل تم تحويله إلى مشروع Project Glasswing بالتعاون مع 12 مؤسسة تكنولوجية رئيسية مثل AWS وأبل ومايكروسوفت، بالإضافة إلى منظمات مفتوحة المصدر مثل مؤسسة Linux، لاستخدامه أولًا في مراجعة وتعزيز أمان البنية التحتية الرقمية الحيوية عالميًا.
كاتب المقال: تان رين
المصدر: هواشين كاشي
أعتقد أن البشر قد يُستَدْرَكون بسرعة تفوق الفهم التقليدي من قبل الذكاء الاصطناعي.
لا أعرف كيف حالكم، لكن على الأقل أنا الآن لا أستطيع الاستغناء عن الذكاء الاصطناعي على الإطلاق، حيث يُكمل الذكاء الاصطناعي على الأقل 50% من مهامي اليومية.
Moreover, this ratio continues to increase.
في الوقت نفسه، مع إطلاق نماذج جديدة جيلًا بعد جيل، فإن كلاً من كفاءتي وإنتاجيتي في العمل، بالإضافة إلى إنفاقي الشهري على الرموز، يشهدان نموًا سريعًا.
في الليلة الماضية، شاهدت خبرًا أن Anthropic أطلقت نموذجًا لا يجرؤون حتى على إتاحته للجميع بسبب قوته الهائلة.
اسم هذا النموذج الجديد هو "Mythos"، والذي يعني "أسطورة" باللغة الصينية.
حاليًا، إنه إصدار تجريبي، لذا يسميه الرسمي "Mythos Preview". ومع ذلك، تم إطلاقه هذه المرة على شكل مشروع يُدعى "Project Glasswing".
سأتحدث عن هذا المشروع لاحقًا.

في الشهر الماضي، تسربت وثيقة داخلية من Anthropic تشير إلى أن نموذجًا أكبر وأقوى من Opus يُطور حاليًا، ورمزه هو Mythos.
بعد ذلك، نسبت Anthropic هذه التسريبات إلى "خطأ بشري" ولم تقدم مزيدًا من التفاصيل.
الآن، تم الإعلان رسميًا عن النموذج المُسمى Mythos.
رغم الإعلان الرسمي، إلا أنه لم يُنشر رسميًا بعد. أي أن المستخدمين العاديين لا يمكنهم استخدامه بعد.
السبب بسيط: شعرت Anthropic أن هذا النموذج قوي جدًا، ولا يناسب فتحه للجميع قبل تفعيل آليات الأمان.
أعتقد أن هذه الجملة تستحق التوقف والتفكير لثانية.
عادةً، تقوم شركات الذكاء الاصطناعي بنشر نماذج جديدة فورًا للسيطرة على السوق، لكن أسلوب Anthropic هذا يبدو واضحًا أنه غير معتاد.
في رأيي، ليسوا غير راغبين في الإرسال، بل خائفون من الإرسال.
لأن نموذج Mythos هذا قوي حقًا.
راجع أولاً بعض بيانات الاختبار التي أعلنتها الشركة الرسمية.
في القدرة على البرمجة، هناك فرق كبير بين Mythos وأقوى نموذج مفتوح حاليًا، Claude Opus 4.6، حيث يتفوق Mythos بشكل كامل على Opus 4.6 في جميع اختبارات الأداء.

في القدرة الاستدلالية، في اختبار GPQA Diamond (أسئلة علمية لمستوى الدراسات العليا)، كانت النتائج 94.6% مقابل 91.3%، وفاز Mythos.
في اختبارات "آخر امتحان للإنسانية" مع الأدوات وبدونها، فاز Mythos بوضوح.

في القدرات الحاسوبية المتعلقة بـ Agent، تجاوز Mythos Oputs 4.6 بنسبة 79.6% مقابل 72.7% في OSWorld-Verified (إكمال المهام الحاسوبية بشكل مستقل).
في كل بعد، يتفوق Mythos على Opus 4.6، وبعضها يتفوق بشكل ساحق.

في بعض المهام، لم يعد الفرق تحسينًا تدريجيًا، بل قفزة كبيرة. على سبيل المثال، ارتفع SWE-bench Multimodal من 27.1% إلى 59%، تقريبًا تضاعف.
أحد أكثر الأسباب الأساسية التي تجعلهم لا يجرؤون على الظهور في Mythos هو قدرته الفائقة على اختراق جدران الأمان في عالم البرمجيات.
ببساطة، جميع الأنظمة والبرمجيات في جميع أنحاء العالم تحتوي على ثغرات، ويمكن لـ Mythos اكتشاف هذه الثغرات ومهاجمتها بمستوى يفوق القدرة البشرية.
إذا امتلك القراصنة هذه القدرة، فستتأثر أنظمة التشغيل والبرمجيات في جميع أنحاء العالم، خاصةً بعض البنية التحتية العامة والأمن القومي.
يحتوي إعلان Anthropic على جملة واحدة، وبعد قراءتها شعرت أن الأمر مخيف عند التفكير فيه.

تمكّن نماذج الذكاء الاصطناعي من تحقيق مستوى عالٍ جدًا من القدرة على الترميز، ويمكنها تقريبًا تجاوز جميع الأشخاص ما عدا الأكثر خبرة في اكتشاف واستغلال ثغرات البرمجيات.
بالنسبة لهذه الجملة، أود التوسع أكثر.
أنا من خلفية مبرمج، لذا أعرف كيف يتم بناء البرمجيات، ومدى اختلاف الكود المكتوب من أشخاص مختلفين.
بالإضافة إلى ذلك، لا توجد أي برامج تدّعي أنها خالية من الثغرات، حتى لو لم تُكتشف هذه الثغرات قط.
لم تكن الثغرات السابقة قادرة على البقاء هادئة في النظام لعقود بسبب أمان النظام الكافي.
بل لأن البحث عن الثغرات يتطلب كفاءة احترافية عالية، وصبرًا وهامشًا كبيرين، وكمية كبيرة من الوقت.
القليلون هم الذين يشاركون، وأقلّ منهم هم الذين يجرؤون على الاستثمار.
هذه "ندرة القدرة" تشكل الافتراض الضمني لعالم أمان البرمجيات بأكمله. بعد تدخل الذكاء الاصطناعي، بدأ هذا الافتراض في التراجع.
يمكن للذكاء الاصطناعي العمل بطرق تفوق قدرات معظم البشر غير المتميزين، ويمكننا استخدامه لاستغلال الثغرات، كما يمكننا استخدامه لإغلاق هذه الثغرات.
لحل هذه المشكلة، سأشرح لكم ما هو مشروع Glasswing الذي طورته Anthropic.
ببساطة، هذا مشروع يستخدم قدرات Mythos لاكتشاف الثغرات في أنظمة البنية التحتية حول العالم.
تشمل الأطراف AWS و苹果 وMicrosoft وGoogle وNVIDIA وCisco وLinux Foundation، إجمالاً 12 مؤسسة.

يغطي هذا التشكيل الحوسبة السحابية، أنظمة التشغيل، الرقائق، المتصفحات، البنية التحتية المالية، الأمن السيبراني، وبيئة مفتوحة المصدر.
بعبارة أخرى، فإن الجهات الفاعلة الأساسية في البنية التحتية الرقمية العالمية موجودة تقريبًا جميعها في هذا المشروع.
المنطق الأساسي لهذا المشروع هو واحد فقط: السماح للدفاع باستخدام قدرات نموذج الذكاء الاصطناعي الرائد هذا أولاً.
لأنه إذا حصل المهاجم على الأدوات من نفس المستوى أولاً، فسيكون من الصعب إغلاق النافذة بمجرد فتحها. وتعهدت Anthropic بتوفير 100 مليون دولار من رصيد استخدام النموذج، ليغطي فترة المعاينة البحثية.
بالإضافة إلى 12 مؤسسة أساسية، حصل أكثر من 40 منظمة تُحافظ على البنية التحتية البرمجية الحيوية على حق الوصول لاستخدام Mythos لفحص أنظمتها ومشاريع مفتوحة المصدر.
في الوقت نفسه، تبرعت Anthropic بمبلغ 2.5 مليون دولار لمؤسسة Linux و1.5 مليون دولار لمؤسسة Apache Software، وهما من البنية التحتية الأساسية في عالم البرمجيات.
ببساطة، جميع التطبيقات والمواقع والأنظمة التي نستخدمها حاليًا تعتمد في الأساس على هيكلها الأساسي.
في رأيي، قامت Anthropic بعمل جيد هذا المرة، حيث أطلقت نموذجًا أقوى وأنفقت أموالًا على البنية التحتية العالمية للمعلومات لمساعدتها على تحسين نفسها.
After all, going naked benefits no one.
ربما لا تزال لا تشعر بقوة Mythos حتى الآن، لكنني وجدت ثلاثة أمثلة محددة من النص الأصلي الرسمي، وأعتقد أنها أكثر وضوحًا من الأرقام.

أولًا، OpenBSD.
هذا نظام تشغيل معترف به بدرجة أمان عالية جدًا، ويعمل عليه العديد من البنية التحتية الحيوية، بما في ذلك نظام iOS الخاص بهواتف Apple التي نستخدمها، ونظام Android، وحتى بعض الأنظمة الداخلية للشركات والمؤسسات.
اكتشف Mythos ثغرة موجودة منذ 27 عامًا، حيث يمكن للمهاجمين جعل الجهاز المستهدف يتعطل عن بُعد بمجرد الاتصال به.
27 عامًا! ليس أن أحدًا لا يهتم، بل لم يجد أحدٌ أصلًا.
ثانيًا، FFmpeg.
تعتمد تقريبًا جميع البرامج التي تحتاج إلى معالجة الفيديو عليه، وغالبًا ما تجد وجوده في جميع برامج تشغيل الفيديو التي تستخدمها.
كان هناك ثغرة مخبأة في سطر من الشيفرة كُتِبَ قبل 16 عامًا، وهاجمتها أدوات الاختبار الآلي أكثر من 5 ملايين مرة، ولم تكتشفها أبدًا.
لكن Mythos وُجد.
الثالث، نواة لينكس.
هذا لا يحتاج إلى توضيح إضافي؛ يمكن اعتباره أساسًا للإنترنت بأكمله، وهو الأكثر استحقاقًا للحذر.
Mythos لم يكتفِ باكتشاف عدة ثغرات منفصلة، بل ربط عدة ثغرات في سلسلة هجوم واحدة.
ابدأ من صلاحيات المستخدم العادي، وارتقِ تدريجيًا حتى تحقق التحكم الكامل في الجهاز بأكمله.
بالنسبة لـ Linux، فهو يختلف تمامًا عن الطبيعة في الحالتين السابقتين.
اكتشاف الثغرات هو مهارة تحليلية.
لكن ثغرة السلسلة هي قدرة الاستراتيجية.
مثل العديد من منتجي المنتجات، فإن رسم نماذج أولية، وكتابة الوثائق، وإجراء تحليل البيانات هي مهارات فردية. لكن ربط الأعمال والمنتج والتجارة معًا هو مهارة استراتيجية.
نموذج قادر على تخطيط مسارات الهجوم لم يعد أداة تدقيق فحسب، بل هو أقرب إلى وكيل نشط يمكنه اتخاذ إجراءات في البيئة الرقمية.
في الحالات الثلاث أعلاه، اتخذت Anthropic نهجًا متمثلًا في الكشف الأولي، والإبلاغ الأولي، والإصلاح الأولي، ثم الإفصاح اللاحق، وقد تم إصلاح جميعها حاليًا.
عندما ترى هذا، ستعرف قوة Mythos، كأنها وحشٌ مُخَلَّدٌ لا يُسمح له بالخروج من قفصه بعد، فالمجتمع الحقيقي يحتاج أولاً إلى الاستعداد للتكيف معه.
أود أن أشارك بضع ملاحظات هنا، ربما تكون بداية التغيير الحقيقي القادم.
أولاً، تُصبح الافتراضات الأمنية في عالم البرمجيات غير صالحة.
الاستقرار البرمجي الذي نعتبره مسلّماً به اليوم لا يعود بالكامل إلى تصميم النظام الجيد. بل يعتمد إلى حد كبير على ندرة القدرة على الهجوم.
ببساطة، ليس لأن البرنامج قوي بما فيه الكفاية، بل لأن الإنسان غير كافٍ.
اكتشاف الثغرات يتطلب تكلفة، وبناء سلسلة الاستغلال يتطلب وقتًا، والمسح الواسع النطاق يتطلب موارد. لذا تبقى العديد من الديون التقنية، والأخطاء القديمة، والأنظمة البالية على حالها، دون أن تُنظَّف بشكل جاد قط.
مثلما نقوم بتطوير منتجاتنا، عندما نشعر أن المنطق مغلق تمامًا وأنه لا توجد مشكلات، فهذا لا يعني بالضرورة أن كل شيء على ما يرام، بل قد يكون هذا مجرد حدود قدراتنا.
القدرة التي تُظهرها Mythos هي تقليل فجوة الوقت بين اكتشاف الثغرة واستغلالها من عدة أشهر إلى دقائق.
What does a few minutes mean?
يعني أن وتيرة التصحيحات وعملية الإصلاح بدأت لا تواكب سرعة الهجمات.
ثانيًا، سيشعر عالم مفتوح المصدر بالضغط أولاً.
اليوم، يعتمد معظم البرمجيات الحديثة على عدد كبير من التبعيات مفتوحة المصدر. وهي غير مرئية في العادة، ولكن بمجرد اختراقها، تتأثر الصناعة بأكملها في نفس الوقت.
قد لا يكون بعض القرّاء على دراية بهذه الفكرة؛ وببساطة، فكل البرامج التي نستخدمها الآن تعتمد على مشاريع مفتوحة المصدر كأساس، وشفرة مصدر هذه المشاريع متاحة للجميع.
في المستقبل، عندما يكون بإمكان النماذج مسح مشاريع مفتوحة المصدر بشكل مستمر وواسع النطاق، ستكون مستويات الضغط التي يواجهها مقدمو الدعم في المجتمعات المفتوحة المصدر مختلفة تمامًا.
وهذا هو السبب في أن Anthropic تقدم تبرعات لمؤسسة Linux ومؤسسة Apache.
ليسوا يفعلون شيئًا خيريًا، بل يعترفون بأن البنية التحتية المفتوحة المصدر هي الأساس الأكثر هشاشة والأكثر عدم تحمل للسقوط في عالم الرقمي في عصر الذكاء الاصطناعي، إنهم لا يريدون أن يُنظر إليهم كأشرار أو أشخاص سيئين.
ثالثًا، سيتم إضعاف البشر، وستبدأ الذكاء الاصطناعي في المنافسة مع الذكاء الاصطناعي.
كانت قيمة فريق أمان منتجات الإنترنت في الماضي تكمن في حكم الأشخاص، وتراكم الخبرة، والفهم العميق للأنظمة.
في المستقبل، ستتغير هذه المسألة من حيث المنطق.
المنافسة هي من لديه نموذج أقوى، ومن يربط الأدوات أسرع، ومن يستطيع دمج التدقيق بالذكاء الاصطناعي في أقصى مراحل عملية التطوير.
هذا ليس مسألة استبدال المبرمجين، بل إعادة هيكلة طريقة الإنتاج في صناعة الأمن نفسها.
في الجانب الآخر، يمكن العثور على آلاف الثغرات عالية الخطورة خلال أسابيع قليلة. المشكلة أن المهاجمين سيمتلكون أيضًا أدوات من نفس المستوى في النهاية.
في ذلك الوقت، لن يكون أمان منتجات البرمجيات معركة بين أشخاص، بل مواجهة دفاعية وهجومية بين النماذج.
هذه المرة، لم تُصدر Anthropic القدرات فحسب، بل أصدرت أيضًا المخاطر. ربما تكون هذه الصراحة هي الأكثر حاجة لها في هذه المرحلة من قبل الصناعة بأكملها.
الجميع يتحدث عن كيفية تغيير الذكاء الاصطناعي لفعالية العمل، وهذا لا بأس به.
لكن Mythos يذكرنا أيضًا أن قفزة قدرات الذكاء الاصطناعي ستنقل في النهاية من عالم المحتوى إلى عالم البرمجيات، ثم إلى البنية التحتية الكاملة للعالم الرقمي.
تم إعادة كتابة عالم المحتوى، مما يؤثر على منطق التدفق.
تم إعادة كتابة عالم البرمجيات، والمقصود هو الأساس.
في هذا الوقت، تذكرت أحد الحوارات من فيلم "2012"، والذي سأستخدمه كخاتمة لهذا المقال.
مهما كنت، بغض النظر عن العرق أو الدولة، غدًا لن يكون بيننا أي فرق!
