AlphaFold تختہ خطرے میں!
نیچر نے مضمون شائع کیا: زکبرگ کے تحت بائیوہب نے ایک بڑا جھٹکا دیا، اور ایک ساتھ 1.1 ارب پروٹین سٹرکچر کے پیشگوئیاں جاری کیں، جو الفا فولڈ ڈیٹا بیس سے 800 ملین زیادہ ہیں۔
پیچھے کا AI ماڈل ESMFold2 کو AlphaFold3 کی تمام صلاحیتوں سے زیادہ بہتر قرار دیا جاتا ہے۔
زیادہ اہم بات یہ ہے کہ یہ مکمل طور پر اوپن سورس ہے اور تجارتی استعمال کے لیے کوئی پابندی نہیں۔

https://www.nature.com/articles/d41586-026-01686-3
گوگل ڈیپ مائنڈ کی طرف سے کئی سالوں تک کام کیا گیا پروٹین AI کا راج، ایک اوپن سورس چیلنج کر رہا ہے۔
پروٹین AI کے شعبے کا منظر تبدیل ہو سکتا ہے۔
11 ارب پروٹین ڈھانچے، اب آپ کے سامنے ہیں
27 مئی کو، زاکبرگ جوڑے کے ذریعہ قائم کیا گیا بائیو میڈیکل ادارہ Biohub نے ESM Atlas نامی پروٹین سٹرکچر ڈیٹا بیس کو لاUNCH کیا۔
11 ارب پروٹین سٹرکچر کے پیشگوئی، اور 68 ارب پروٹین سیکوئنس معلومات۔
AlphaFold کے ڈیٹا بیس میں 20 کروڑ سے زائد سٹرکچر پیشگوئیاں جمع ہو چکی ہیں، جبکہ ESM Atlas صرف ایک بار میں 80 کروڑ اضافہ کر دیتا ہے۔
ان پیشگوئیوں کو بنانے والے AI ماڈل کا نام ESMFold2 ہے، جس کی ترقی Biohub کے سائنسی ہدایت کار Alex Rives کی قیادت میں کی گئی۔

ریوز کہتے ہیں:
یہ گراف پروٹین بائیولوجی کی مکمل تصویر، خاص طور پر سب سے کم جانے جانے والے حصوں کو ظاہر کرتا ہے۔
پروٹین کی ساخت کی پیشگوئی کیوں اہم ہے؟
پروٹین زندگی کے کام کرنے کا مرکزی حصہ ہیں، اس کی شکل جاننا اس کے فنکشن کو سمجھنے اور نئی دواوں کا ڈیزائن کرنے، بیماریوں پر قابو پانے کے لیے ممکن بناتا ہے۔
الفافولڈ نے یہی کامیابی حاصل کر کے نوبل انعامِ کیمیاء جیتا، جو AI کے سائنس کو بدلنے کا علامتی مثال ہے۔
اب ایک نیا ماڈل بڑے 5 گنا ڈیٹا سیٹ کے ساتھ سامنے آ گیا ہے۔
ای آئی ماڈل کے طور پر، ESMFold2 کی طاقت کیا ہے؟
ESMFold2 نے AlphaFold سے مختلف ٹیکنیکل راستہ اپنایا۔
اسے 2024 میں جاری کیے گئے "پروٹین لینگویج مدل" پر بنایا گیا ہے، جس کا مرکزی خیال NLP کے شعبے سے متاثر ہے، جہاں پروٹین سیکوئنس کو "زبان" کے طور پر سمجھا جاتا ہے، اور اسے اربوں پروٹین ڈیٹا پر تربیت دی گئی تاکہ مدل سیکوئنس سے براہ راست تین بعدی ساخت کا پیشن گوئی کرنا سیکھ سکے۔
الفافولڈ کے AI ہم جنس لوگوں کو یہاں دیکھ کر وہی محسوس ہونا چاہیے، کیونکہ یہ بڑے زبانی ماڈلز کے انسانی زبان سیکھنے کے منطق کے مطابق ہے۔
ٹریننگ ڈیٹا کا دائرہ کار ایک اہم متغیر ہے۔
ESMFold2 نے مٹی، سمندر اور دیگر ماحولیاتی ذرائع سے حاصل کیے گئے بڑی تعداد میں مائیکرو بائیوٹک پروٹین ڈیٹا شامل کیا ہے، جو AlphaFold کے ڈیٹا بیس میں خالی ہے۔
زیادہ وسیع دائرہ، ماڈل نے زیادہ مکمل "پروٹین دنیا" دیکھی ہے۔
بائوہب ٹیم کا کہنا ہے کہ ESMFold2، پروٹینز کے درمیان تعامل کی مرکب ساخت کی پیشگوئی میں AlphaFold3 سے بہتر کام کرتا ہے۔
لیکن سب سے زیادہ قائل کرنے والی بات ٹیسٹ اسکور نہیں، بلکہ عملی تصدیق ہے۔
ٹیم نے ESMFold2 کا استعمال کرتے ہوئے مکمل طور پر نئے پروٹین ڈیزائن کیے، جنہیں لیب میں تیار کرنے اور ٹیسٹ کرنے کے لیے بھیجا گیا، اور ڈیزائن کا ایک اعلیٰ تناسب توقعات کے مطابق کام کیا۔
"پیش بینی" سے "ڈیزائن" اور پھر "تصدیق" تک، اس سلسلے کو مکمل کرنا، اقدار کو تحقیقی مقالوں سے حقیقی دنیا تک پھیلاتا ہے۔

مکمل طور پر اوپن سورس، یہی سب سے بڑا کلیدی فائدہ ہے
ESMFold2 کی سب سے زیادہ طاقتور مقابلہ کی تلوار یہ ہے کہ یہ مکمل طور پر اوپن سورس ہے اور تجارتی استعمال کے لیے کوئی پابندی نہیں۔
اس کے انتخاب کا تصور، پورے AI صنعت کے حوالے سے زیادہ واضح ہوتا ہے۔
الفافولڈ کے پاس ایک اوپن ڈیٹا بیس ہے، لیکن الفافولڈ 3 کے شروعاتی اجرا میں تجارتی استعمال پر پابندی عائد کی گئی تھی۔
گوگل ڈیپ مائنڈ کے زیر انتظام اسومورفک لیبز نے اس سال پروٹین انٹر ایکشن پیش گوئی ماڈل مکمل طور پر بند سورس جاری کیا۔
مزید پڑھیں: گوگل نے "AlphaFold 4" جاری کیا، اب یہ اوپن سورس نہیں ہے! پرفارمنس پچھلے ورژن کو دبا دیتی ہے
ایم آئی ٹی کے کمپیوٹیشنل بائیولوجسٹ اووچنیکوف نے کھلے ذرائع کی اہمیت کو براہ راست واضح کیا، "میں یہ توقع کرتا ہوں کہ بہت سے لوگ ESMFold2 آزمانے کے لیے بہت خوش ہوں گے۔"
اوپن سورس AI کا لیوریج اثر بڑی زبان ماڈلز کے شعبے میں پوری طرح ثابت ہو چکا ہے، میٹا کا Llama سیریز اس کا بہترین مثال ہے۔
ایک کافی طاقتور آوٹ سورس ماڈل جو عالمی کمیونٹی کو اس کی ترقی، استعمال اور ایسے استعمالات دریافت کرنے کے لیے متاثر کر سکے جو اصل ڈویلپرز نے کبھی سوچے بھی نہ ہوں۔
پروٹین AI کے شعبے میں صورتحال مزید خاص ہے، جہاں دنیا بھر میں بہت سے لیبز اور تحقیقی ادارے ایک مفت، بے حد کارکردگی والے سٹرکچر پریڈکشن ٹول کی فوری ضرورت محسوس کر رہے ہیں، بند ماڈل جتنا بھی طاقتور ہو، اس تک پہنچنے والے صارفین کی تعداد محدود ہوتی ہے۔
بائوہب نے میٹا کے بڑے زبان ماڈل پر اپنائے گئے طریقہ کار کے ساتھ مکمل طور پر اوپن سورس کا انتخاب کیا ہے۔
زکبرگ کی AI شعبے میں حکمت عملی اب زیادہ واضح ہو رہی ہے — اوپن سورس کو بنیادی ڈھانچہ بنانا اور ایک生态系统 کو دفاعی دیوار کے طور پر استعمال کرنا۔

ساتھی ماہر، کیا آپ خریدیں گے؟
اکادمیک برادری نے مثبت رد عمل دیا، لیکن محتاط رائیں بھی واضح ہیں۔
سويڈن کے لونڈ یونیورسٹی کی جیما اٹکنسن نے ESM Atlas کو "حیاتیات کا ایک عظیم وسائل" بننا چاہیے کہا۔

یونیورسٹی کالج لندن کی کرسٹین اورینگو نے اس کی قدر کو تسلیم کیا، لیکن زور دیا کہ پیشگوئیوں کی مستقل تصدیق کی ضرورت ہے۔

سیول نیشنل یونیورسٹی کے مارٹن اسٹائنگر سے زیادہ تیز سوالات آئے۔

وہ یہ جاننا چاہتا ہے کہ ESMFold2، جو معلوم پروٹین سے بہت مختلف "نئی ساختوں" کا مقابلہ کرتا ہے، اس کی کارکردگی کیا ہے۔
اس کی ٹیم نے پہلے پایا کہ ESMFold کا پہلا ورژن اس حوالے سے اچھا نہیں تھا۔ یہ مسئلہ ESMFold2 کے لیے اب بھی حل نہیں ہوا ہے۔
ایم آئی ٹی کے اوچنکنکوف نے سب سے پُر سکون جائزہ دیا، جس میں ان کا خیال ہے کہ ESM Atlas کو AlphaFold ڈیٹا بیس کا مکمل کرنے کے لیے ڈیزائن کیا جانا چاہیے۔

اس نے مزید کہا کہ آئیسو مورفک لیبز کا بند ماڈل اور کچھ بائیو ہب کے ایسے کوئی بھی کھلا ماڈل جن کا براہ راست موازنہ نہیں کیا گیا، انہوں نے بھی اسی سطح کے نتائج حاصل کیے۔
ESMFold2 کی لیڈنگ مارجن، ممکنہ طور پر تحقیقی مقالے میں اشارہ کیے گئے سے کم ہے۔
یہ س остھی، بالکل پروٹین AI کے شعبے میں مقابلے کے تیز ہو جانے کا اظہار ہے۔
اوپن سورس، بند سورس، اکیڈمک، اور کمرشل — تمام ماڈلز تیزی سے ترقی کر رہے ہیں۔
آج کا "سب سے طاقتور"، چھ ماہ بعد ممکنہ طور پر نئی ریکارڈ سے مٹا دیا جائے گا۔ یہ رفتار، بڑے زبانی ماڈلز کے شعبے میں اسلحہ کے مقابلے کے بہت قریب ہے۔
جب AI زندگی کے سرکاری کوڈ کو سمجھنا شروع کر دے
گزشتہ زمانے میں، ایک پروٹین کی تین ابعادی ساخت کو سمجھنا ماہوں سے لے کر سالوں تک کا لیب کا کام ہو سکتا تھا۔
AlphaFold نے پہلی بار ثابت کیا کہ AI منٹوں میں ایسا کر سکتا ہے۔
اب ESMFold2 نے پیشگوئی کے سائز کو ایک ارب کے سطح تک پہنچا دیا ہے، جس سے پہلے کبھی حل نہیں ہونے والے بہت سے پروٹینز کو شامل کیا گیا ہے۔
اس راستے کو آگے بڑھاتے ہوئے، جب AI تمام پروٹین سٹرکچرز کا درست پیشگوئی کر سکے، مکمل طور پر نئے فنکشنل پروٹین ڈیزائن کر سکے اور ان کی تجرباتی تصدیق ہو جائے، تو AGI کا زندگی کی علوم میں لاگو ہونا زیادہ تر لوگوں کی توقع سے زیادہ قریب ہو سکتا ہے۔
اگر ASI واقعی طور پر آ جائے، تو اس کے لیے حیاتیات ایک ایسی ڈسپلائن نہیں رہے گی جسے "مطالعہ" کیا جائے، بلکہ ایک ایسا نظام ہو گا جسے "انجینئرنگ" کیا جا سکے۔
زندگی کو مولیکیولر لیول پر ڈیزائن کریں، ضرورت کے مطابق پروٹینز بنائیں، اور ترقی کے قوانین کو دوبارہ لکھیں۔
یہ سائنس فکشن جیسا لگتا ہے، لیکن ESMFold2 جیسے ٹولز "سائنس فکشن" کو آہستہ آہستہ "انجینئرنگ مسئلہ" میں تبدیل کر رہے ہیں۔
آج، 1.1 ارب پروٹین کی ساختیں میز پر رکھ دی گئی ہیں، جن پر دنیا بھر کے کوئی بھی انٹرنیٹ سے جڑے سائنسدان مفت استعمال کر سکتے ہیں۔
اس کا مطلب ہے کہ AI کی زندگی کو سمجھنے کی صلاحیت ایک نئے مرحلے تک پہنچ گئی ہے۔
حوالہ جات: https://www.nature.com/articles/d41586-026-01686-3
یہ مضمون ویچن گروپ "نیوزی یوان" سے ہے، مصنف: ASI وحی؛ ایڈیٹر: مارکو
