عرش AlphaFold مهدد!
نشرت Nature مقالًا: أطلقت Biohub التابعة لزوكربيرغ ضربة قوية، ونشرت فجأة 1.1 مليار تنبؤ ببنية بروتينية، مما يزيد قاعدة بيانات AlphaFold بـ 800 مليون تنبؤ.
يُدّعي النموذج الذكي الخلفي ESMFold2 أنه يتفوق بشكل شامل على AlphaFold3.
الأهم من ذلك، مفتوح المصدر بالكامل، دون قيود على الاستخدام التجاري.

https://www.nature.com/articles/d41586-026-01686-3
المركز المهيمن لـ Google DeepMind في مجال الذكاء الاصطناعي للبروتينات، الذي استغرق سنوات عديدة من الجهد، يُهدد الآن من قبل مُعَرِّض مفتوح المصدر.
قد يتم إعادة كتابة خريطة طريق سباق البروتين AI.
1.1 مليار بنية بروتينية، مُقدمة لك مباشرة
في 27 مايو، أطلقت مؤسسة البيوميدانيك Biohub، التي أسسها زوجان زوكربيرغ، قاعدة بيانات هيكل البروتينات المسمى ESM Atlas.
1.1 مليار بنية بروتينية متوقعة، بالإضافة إلى 6.8 مليار تسلسل بروتيني.
تجمع قاعدة بيانات AlphaFold أكثر من 200 مليون تنبؤ بالهيكل، ويزيد ESM Atlas بملياري تنبؤ إضافي.
النموذج الذكي الذي أنشأ هذه التنبؤات يُسمى ESMFold2، وتم تطويره بقيادة أليكس ريفز، المسؤول العلمي في Biohub.

ريفس يقول:
This graph depicts the full scope of protein biology, especially the most unknown parts.
Why is protein structure prediction important?
البروتينات هي المكونات الأساسية لعمل الحياة؛ معرفة شكلها تمكنك من فهم وظيفتها، وبالتالي تصميم أدوية جديدة ومكافحة الأمراض.
فاز AlphaFold بجائزة نوبل في الكيمياء بسبب هذا، وهو مثال رمزي على كيفية تغيير الذكاء الاصطناعي للعلم.
الآن ظهر نموذج جديد يحمل مجموعة بيانات أكبر بخمس مرات.
ما الذي يجعل ESMFold2 قويًا كنموذج ذكاء اصطناعي؟
ESMFold2 اتبعت مسارًا تقنيًا مختلفًا عن AlphaFold.
تم بناؤه على أساس "نموذج لغة البروتين" الذي تم إصداره في عام 2024، حيث استوحي الفكرة الأساسية من مجال معالجة اللغة الطبيعية، واعتُبرت تسلسلات البروتينات كـ"لغة"، وتم تدريب النموذج على مليارات بيانات البروتينات لتمكينه من التنبؤ مباشرة بالهيكل ثلاثي الأبعاد من التسلسل.
يجب أن يشعر زملاء AlphaFold الذين يشاهدون هذا بالتعارف، فهذا يتوافق مع المنطق الذي تتعلّم به النماذج اللغوية الكبيرة لغة البشر.
مدى تغطية بيانات التدريب هو متغير حاسم.
يحتوي ESMFold2 على كمية كبيرة من بيانات البروتينات الميكروبية من بيئات مثل التربة والمحيطات، وهي فجوة في قاعدة بيانات AlphaFold.
كلما زاد نطاق التغطية، أصبحت "عالم البروتينات" الذي رآه النموذج أكثر اكتمالاً.
يُشير فريق Biohub إلى أن ESMFold2 يتفوق على AlphaFold3 في التنبؤ بالهياكل المركبة للتفاعلات بين البروتينات.
لكن الأكثر إقناعًا ليس الأداء، بل التحقق العملي.
صمم الفريق بروتينات جديدة باستخدام ESMFold2، وتم تصنيعها واختبارها في المختبر، ونجح عدد كبير من التصاميم كما كان متوقعًا.
من "التنبؤ" إلى "التصميم" ثم إلى "التحقق"، عندما تُنفَّذ هذه السلسلة، ينتقل القيمة من الأوراق البحثية إلى العالم الحقيقي.

مفتوح المصدر بالكامل، هذا هو السلاح الأكبر
أقوى أداة تنافسية لـ ESMFold2 هي أنها مفتوحة المصدر بالكامل وخالية من القيود التجارية.
المعنى الاستراتيجي لهذا الخيار يصبح أكثر وضوحًا في سياق صناعة الذكاء الاصطناعي بأكملها.
على الرغم من وجود قاعدة بيانات مفتوحة لـ AlphaFold، إلا أن AlphaFold3 فرضت قيودًا على الاستخدام التجاري في بداية إصداره.
نموذج تنبؤ التفاعلات البروتينية الذي أطلقته Isomorphic Labs، التابعة لـ Google DeepMind، هذا العام هو نموذج مغلق بالكامل.
قراءة إضافية: أطلقت جوجل "AlphaFold 4"، ولم تعد مفتوحة المصدر! الأداء يفوق النسخة السابقة بشكل ساحق
أشار عالم الحوسبة البيولوجية في معهد ماساتشوستس للتكنولوجيا، أوفتشيننيكوف، مباشرة إلى قيمة المصدر المفتوح: "أتوقع أن يشعر الكثير من الأشخاص بالإثارة لتجربة ESMFold2."
تم التحقق من تأثير الرافعة المالية للذكاء الاصطناعي المفتوح المصدر في سباق نماذج اللغة الكبيرة، وسلسلة Llama من Meta هي أفضل مثال على ذلك.
نموذج مفتوح المصدر قوي بما يكفي لحث المجتمع العالمي على تطويره وتطبيقه واكتشاف استخدامات لم تخطر على بال المطورين الأصليين.
حالة مجال بروتينات الذكاء الاصطناعي أكثر خصوصية، حيث هناك عدد كبير من المختبرات والمؤسسات البحثية حول العالم التي تحتاج بشكل عاجل إلى أداة مجانية وغير مقيدة للتنبؤ بالبنية، فحتى لو كانت النماذج المغلقة أقوى، فإن قاعدة المستخدمين التي يمكنها الوصول إليها محدودة.
اختار Biohub فتح المصدر بالكامل، وهو نهج متماشٍ مع استراتيجية Meta في نماذج اللغة الكبيرة.
استراتيجية زوكربيرغ في مجال الذكاء الاصطناعي تصبح أكثر وضوحًا — استخدام مفتوح المصدر كبنية تحتية، واستخدام البيئة كحاجز تنافسي.

الزملاء الخبراء، هل تشتريون؟
ردود الفعل الأكاديمية إيجابية، لكن الآراء التحفظية واضحة أيضًا.
وصف جيمما أتكينسون من جامعة لوند السويدية ESM Atlas بأنه "يجب أن يصبح موردًا استثنائيًا للبيولوجيا".

تشير كريستين أورينغو من جامعة لندن الجامعية إلى قيمته، لكنها تؤكد أن نتائج التنبؤ تحتاج إلى التحقق المستقل.

سؤال أكثر حدة جاء من مارتن شتاينيغر من جامعة سيول الوطنية.

ما يهتم به هو أداء ESMFold2 عند مواجهة "الهياكل الجديدة" التي تختلف بشكل كبير عن البروتينات المعروفة.
كانت فريقه قد اكتشف سابقًا أن الإصدار الأول من ESMFold لم يكن ممتازًا في هذا الجانب. لا يزال هذا السؤال معلقًا بالنسبة لـ ESMFold2.
قدم أوفتشيننيكوف من معهد ماساتشوستس للتكنولوجيا أكثر التقييمات هدوءًا، معتبرًا أن ESM Atlas أكثر ملاءمة كمكمل لقاعدة بيانات AlphaFold.

وأشار أيضًا إلى أن نماذج Isomorphic Labs المغلقة، بالإضافة إلى بعض نماذج Biohub التي لا توجد نماذج مفتوحة المصدر مباشرة للمقارنة معها، حققت نتائج على مستوى مماثل.
التفوق الذي يمتلكه ESMFold2 قد لا يكون كبيرًا كما تشير الورقة.
هذا الحذر يعكس بدقة أن المنافسة في مسار البروتينات الذكية قد بلغت ذروتها.
تتطور جميع النماذج — المفتوحة المصدر، والمغلقة المصدر، والأكاديمية، والتجارية — بسرعة هائلة.
الأكثر قوة اليوم قد يتم تجاوزه بعد ستة أشهر. هذا الوتيرة تشبه إلى حد كبير سباق التسلح في قطاع النماذج اللغوية الكبيرة.
عندما تبدأ الذكاء الاصطناعي في فهم شفرة الحياة الأصلية
في الماضي، قد يستغرق تحليل البنية ثلاثية الأبعاد لبروتين واحد عدة أشهر إلى سنوات من العمل المخبري.
أثبت AlphaFold لأول مرة أن الذكاء الاصطناعي يمكنه القيام بذلك في دقائق.
الآن، يدفع ESMFold2 حجم التنبؤ إلى مستوى مليار، ويشمل كمية كبيرة من البروتينات التي لم تُحلل من قبل.
إذا استمررنا في هذا المسار، فعندما يكون بوسع الذكاء الاصطناعي التنبؤ بدقة بجميع هياكل البروتينات، وتصميم بروتينات وظيفية جديدة تم التحقق من فعاليتها تجريبيًا، فقد يكون وصول الذكاء الاصطناعي العام إلى مجال علوم الحياة أقرب مما يتخيله الكثيرون.
إذا جاءت ASI حقًا، فلن تكون البيولوجيا بالنسبة لها علمًا يحتاج إلى "البحث"، بل نظامًا يمكن "هندسته".
تصميم الحياة على المستوى الجزيئي، وتصنيع البروتينات حسب الطلب، وإعادة كتابة قواعد التطور.
هذا يبدو كخيال علمي، لكن أدوات مثل ESMFold2 تُحوّل تدريجيًا "الخيال العلمي" إلى "مشكلة هندسية".
اليوم، تم عرض 1.1 مليار بنية بروتينية على الطاولة، ويمكن لأي عالم لديه اتصال بالإنترنت في أي مكان في العالم الوصول إليها مجانًا.
هذا يعني أن فهم الذكاء الاصطناعي للحياة قد ارتفع إلى مستوى آخر.
المراجع: https://www.nature.com/articles/d41586-026-01686-3
هذا المقال من حساب WeChat "New Intelligence Yuan"، المؤلف: Apocalypses of ASI؛ المحرر: ماكو
