बायोहब ने 11 अरब प्रोटीन संरचनाओं के साथ ESM एटलस लॉन्च किया, जो अल्फाफोल्ड को चुनौती देता है

icon MarsBit
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
बायोहब, जो मार्क जकरबर्ग द्वारा स्थापित एक अनुसंधान संस्थान है, ने ESM Atlas लॉन्च किया है, जो 11 अरब भविष्यवाणी किए गए संरचनाओं और 68 अरब अनुक्रमों का एक प्रोटीन डेटाबेस है। AI मॉडल ESMFold2 दावा करता है कि यह AlphaFold3 से बेहतर प्रदर्शन करता है और व्यावसायिक उपयोग के लिए ओपन-सोर्स है। यह विकास प्रोटीन AI क्षेत्र में हलचल पैदा कर सकता है। इस कदम ने AI + क्रिप्टो समाचार वृत्तों में ऑन-चेन अनुप्रयोगों और नए डेटा एकीकरण संभावनाओं के बारे में चर्चा को जन्म दिया है।

AlphaFold का राजगद्दी खतरे में है!

Nature ने प्रकाशित किया: ज़ैकरबर्ग के अधीन बायोहब ने एक बड़ा झटका दिया, जिसमें एक साथ 11 अरब प्रोटीन संरचनाओं के अनुमान प्रकाशित किए गए, जो AlphaFold डेटाबेस से 8 अरब अधिक हैं।

पीछे का AI मॉडल ESMFold2 को AlphaFold3 की तुलना में सभी पहलुओं में बेहतर प्रदर्शन का दावा किया जाता है।

अधिक महत्वपूर्ण बात यह है कि यह पूरी तरह से ओपन सोर्स है और व्यावसायिक उपयोग के लिए कोई प्रतिबंध नहीं है।

बायोहब

https://www.nature.com/articles/d41586-026-01686-3

Google DeepMind ने कई वर्षों तक प्रोटीन AI के क्षेत्र में अपनी शीर्ष स्थिति बनाई है, लेकिन अब एक ओपन सोर्स प्रतियोगी इसे कमजोर कर रहा है।

प्रोटीन AI खेल का मानचित्र फिर से लिखा जा सकता है।

11 अरब प्रोटीन संरचनाएँ, एक बार में सेवा की गईं

27 मई को, ज़ैकरबर्ग जोड़ी द्वारा स्थापित बायोमेडिकल संस्थान बायोहब ने ESM Atlas नामक प्रोटीन संरचना डेटाबेस को लॉन्च किया।

1.1 billion predicted protein structures, plus 6.8 billion protein sequence entries.

AlphaFold के डेटाबेस में 20 करोड़ से अधिक संरचना भविष्यवाणियाँ जमा हो चुकी हैं, जबकि ESM Atlas ने तुरंत 80 करोड़ और जोड़ दिए।

इन भविष्यवाणियों को बनाने वाला AI मॉडल ESMFold2 है, जिसका विकास Biohub के वैज्ञानिक नेता एलेक्स रिव्स के नेतृत्व में किया गया।

बायोहब

रिव्स कहते हैं:

यह ग्राफ़ प्रोटीन जीवविज्ञान की पूरी छवि, विशेष रूप से सबसे अज्ञात हिस्सों को दर्शाता है।

Why is protein structure prediction important?

प्रोटीन जीवन के कार्य के लिए केंद्रीय घटक हैं, उनकी आकृति जानने से उनके कार्य को समझा जा सकता है, जिससे नए दवाएँ डिज़ाइन की जा सकती हैं और बीमारियों पर काबू पाया जा सकता है।

AlphaFold ने इसके लिए नोबेल पुरस्कार जीता, जो AI द्वारा विज्ञान को बदलने का एक चिह्नित उदाहरण है।

अब एक नया मॉडल बड़े 5 गुना डेटासेट के साथ सामने आया है।

AI मॉडल के रूप में, ESMFold2 की शक्ति क्या है

ESMFold2 ने अल्फाफोल्ड के अलग तकनीकी रास्ते का अनुसरण किया।

यह 2024 में जारी «प्रोटीन भाषा मॉडल» पर आधारित है, जिसका मूल विचार NLP क्षेत्र से लिया गया है, जिसमें प्रोटीन अनुक्रम को «भाषा» के रूप में समझा जाता है, और अरबों प्रोटीन डेटा पर प्रशिक्षित करके मॉडल को अनुक्रम से सीधे त्रि-आयामी संरचना का अनुमान लगाना सिखाया गया है।

AlphaFold के AI साथी यहाँ यह देखकर परिचित महसूस करेंगे, क्योंकि यह बड़े भाषा मॉडल के मानव भाषा सीखने के तर्क के समान है।

Training data coverage is a key variable.

ESMFold2 ने मिट्टी, समुद्र आदि पर्यावरणों से आने वाले बड़ी मात्रा में सूक्ष्मजीवी प्रोटीन डेटा को शामिल किया है, जो AlphaFold के डेटाबेस में खाली है।

जितना अधिक कवरेज, उतना ही पूर्ण 'प्रोटीन दुनिया' मॉडल देखता है।

Biohub टीम के अनुसार, ESMFold2, AlphaFold3 की तुलना में प्रोटीन के बीच अंतर्क्रियाओं की जटिल संरचना का अनुमान लगाने में बेहतर प्रदर्शन करता है।

लेकिन सबसे अधिक प्रभावी बात रनिंग स्कोर नहीं, बल्कि लाइव प्रमाणीकरण है।

टीम ने ESMFold2 का उपयोग करके नए प्रोटीन डिज़ाइन किए, जिन्हें प्रयोगशाला में संश्लेषित और परीक्षण किया गया, और डिज़ाइन का उच्च अनुपात अपेक्षित रूप से काम किया।

प्रेडिक्शन से डिज़ाइन और फिर वेरिफिकेशन तक, इस लिंक को जोड़ने से मूल्य पत्रों से वास्तविक दुनिया तक विस्तारित होता है।

बायोहब

पूरी तरह से ओपन सोर्स, यही सबसे बड़ा हथियार है

ESMFold2 का सबसे तीव्र प्रतिद्वंद्वी हथियार पूर्ण रूप से ओपन सोर्स और व्यावसायिक उपयोग के लिए कोई प्रतिबंध नहीं है।

इस विकल्प की रणनीतिक महत्वता, पूरे AI उद्योग के संदर्भ में अधिक स्पष्ट होती है।

AlphaFold के पास एक खुला डेटाबेस है, लेकिन AlphaFold3 के शुरुआती प्रकाशन के दौरान व्यावसायिक उपयोग के लिए प्रतिबंध लगाए गए थे।

गूगल डीपमाइंड के अंतर्गत आने वाला Isomorphic Labs ने इस वर्ष प्रोटीन अंतर्क्रिया भविष्यवाणी मॉडल को पूरी तरह से बंद स्रोत बना दिया है।

अतिरिक्त पढ़ने के लिए: गूगल ने 'AlphaFold 4' जारी किया, अब ओपन सोर्स नहीं! प्रदर्शन पिछली पीढ़ी को दबा देता है

MIT के कंप्यूटेशनल बायोलॉजिस्ट Ovchinnikov ने सीधे खुले स्रोत के मूल्य को बताया, "मुझे उम्मीद है कि बहुत से लोग ESMFold2 आजमाने के लिए उत्साहित होंगे।"

ओपन सोर्स AI का लीवरेज इफेक्ट लार्ज लैंग्वेज मॉडल स्पेस में पहले ही साबित हो चुका है, और मेटा का Llama सीरीज इसका सर्वश्रेष्ठ उदाहरण है।

एक पर्याप्त शक्तिशाली ओपन सोर्स मॉडल जो वैश्विक समुदाय को इसे अपडेट करने, लागू करने और मूल विकासकर्ताओं द्वारा भी अनुमानित उपयोगों की खोज करने के लिए प्रेरित कर सके।

प्रोटीन AI के क्षेत्र में स्थिति अधिक विशिष्ट है, जहां दुनिया भर में कई प्रयोगशालाएं और अनुसंधान संस्थानें एक मुफ्त, असीमित संरचना भविष्यवाणी उपकरण की तीव्र आवश्यकता महसूस कर रही हैं; बंद स्रोत मॉडल जितने भी शक्तिशाली हों, उनके उपयोगकर्ता समूह का आकार सीमित होता है।

Biohub ने पूर्ण रूप से ओपन सोर्स करने का चयन किया है, जो Meta की बड़े भाषा मॉडल पर रणनीति के साथ संगत है।

ज़करबर्ग की AI क्षेत्र में रणनीति धीरे-धीरे स्पष्ट हो रही है—ओपन सोर्स के साथ बुनियादी ढांचा बनाएं, और पारिस्थितिकी के साथ रक्षा बनाएं।

बायोहब

同行 विशेषज्ञ, क्या आप इसमें विश्वास करते हैं?

शैक्षणिक समुदाय से सकारात्मक प्रतिक्रिया मिली, लेकिन आरक्षित राय भी स्पष्ट हैं।

स्वीडन के लुंड विश्वविद्यालय की गेमा एटकिनसन ने ESM Atlas को "जीवविज्ञान का अद्भुत संसाधन बनना चाहिए" कहा।

बायोहब

Christine Orengo of University College London acknowledges its value but emphasizes that predictions require independent validation.

बायोहब

सीएनएन के मार्टिन स्टेइनेगर द्वारा अधिक तीव्र प्रश्न।

बायोहब

वह यह जानना चाहता है कि ESMFold2, जो ज्ञात प्रोटीन से काफी अलग "नए संरचनाओं" का सामना करता है, उन पर कैसे प्रदर्शन करता है।

उसकी टीम ने पहले पाया था कि ESMFold का पहला संस्करण इस क्षेत्र में अच्छा नहीं था। यह समस्या ESMFold2 के लिए अभी भी अनुत्तरित है।

MIT के Ovchinnikov ने सबसे शांत निर्णय दिया, जिसमें उन्होंने ESM Atlas को AlphaFold डेटाबेस का पूरक माना।

बायोहब

उन्होंने यह भी बताया कि Isomorphic Labs के बंद स्रोत मॉडल और कुछ Biohub के ऐसे मॉडल, जिनके लिए सीधे तुलना के लिए ओपन सोर्स मॉडल उपलब्ध नहीं हैं, ने भी समान स्तर के परिणाम प्राप्त किए हैं।

ESMFold2 का अग्रणी अंतर, शायद उस अनुसंधान पत्र द्वारा सुझाए गए उतना बड़ा नहीं है।

यह सावधानी ठीक उस बात को दर्शाती है कि प्रोटीन AI प्रतियोगिता बहुत तीव्र हो चुकी है।

ओपन सोर्स, प्राइवेट सोर्स, एकेडमिक, और कमर्शियल—सभी मॉडल अत्यंत तेजी से अपडेट हो रहे हैं।

आज का "सबसे शक्तिशाली" छह महीने बाद अपडेट हो सकता है। यह गति, बड़े भाषा मॉडल के क्षेत्र में हो रही हथियार प्रतिस्पर्धा के बहुत करीब है।

जब AI जीवन के स्रोत कोड को पढ़ना शुरू कर दे

पिछले समय में, एक प्रोटीन की त्रिआयामी संरचना को समझने में महीनों से लेकर कई वर्षों तक का प्रयोगशाला कार्य लग सकता था।

AlphaFold ने पहली बार साबित किया कि AI कितने मिनटों में कर सकता है।

अब ESMFold2 ने भविष्यवाणी के पैमाने को 11 अरब स्तर तक बढ़ा दिया है, जिससे पहले कभी हल नहीं किए गए कई प्रोटीन्स को कवर किया गया है।

इस राह पर आगे बढ़ते हुए, जब AI सभी प्रोटीन संरचनाओं का सटीक रूप से भविष्यवाणी कर सके, नए कार्यात्मक प्रोटीन डिज़ाइन कर सके और प्रयोगात्मक पुष्टि सफल हो सके, तो AGI का जीव विज्ञान के क्षेत्र में लागू होना, अधिकांश लोगों की कल्पना से अधिक निकट हो सकता है।

अगर ASI वास्तव में आ जाता है, तो जीवविज्ञान इसके लिए एक ऐसा विषय नहीं रह जाता जिसे "अध्ययन" किया जाना चाहिए, बल्कि एक ऐसी प्रणाली हो जाती है जिसे "इंजीनियरिंग" किया जा सकता है।

जीवन को अणु स्तर पर डिज़ाइन करें, आवश्यकतानुसार प्रोटीन कस्टमाइज़ करें, विकास के नियमों को पुनः लिखें।

यह विज्ञान कथा की तरह लगता है, लेकिन ESMFold2 जैसे उपकरण "विज्ञान कथा" को धीरे-धीरे "इंजीनियरिंग समस्या" में बदल रहे हैं।

आज, 11 अरब प्रोटीन संरचनाएँ मेज पर रखी गई हैं, और दुनिया भर के कोई भी नेटवर्क से जुड़े वैज्ञानिक इन्हें मुफ्त में उपयोग कर सकते हैं।

इसका मतलब है कि AI की जीवन को समझने की क्षमता एक नया स्तर प्राप्त कर चुकी है।

संदर्भ: https://www.nature.com/articles/d41586-026-01686-3

यह लेख वेचेन ग्रुप "न्यूज़िज़यून" से आया है, लेखक: ASI अपोकैलिप्स; संपादक: माको

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।