Anthropic ने Mythos कोडनाम के साथ एक अत्यंत शक्तिशाली AI मॉडल लॉन्च किया है, जो कोडिंग, तर्क और दुर्बलता खोज जैसी क्षमताओं में वर्तमान शीर्ष मॉडल Claude Opus 4.6 को पूरी तरह से पीछे छोड़ देता है; चूंकि इसमें ब्रेकथ्रू सुरक्षा खतरे की क्षमता है, इसलिए इसे सार्वजनिक रूप से लॉन्च नहीं किया गया है, बल्कि Project Glasswing प्रोजेक्ट शुरू किया गया है, जिसमें AWS, Apple, Microsoft सहित 12 प्रमुख प्रौद्योगिकी संगठन और Linux Foundation जैसे ओपन सोर्स संगठनों के साथ मिलकर इसे वैश्विक महत्वपूर्ण डिजिटल बुनियादी ढांचे की सुरक्षा निरीक्षण और मजबूती के लिए पहले से ही उपयोग किया जा रहा है।
लेखक: टैंग रेन
स्रोत: हुन्स फाइनेंस
मुझे लगता है कि मानवता संभवतः एक ऐसी गति से AI द्वारा पीछे किया जा रही है जो सामान्य ज्ञान से परे है।
आपकी वर्तमान स्थिति के बारे में मुझे नहीं पता, लेकिन कम से कम मैं अब AI के बिना असंभव हो चुका हूँ; मेरे दैनिक कार्य का कम से कम 50% AI की सहायता से पूरा होता है।
And this ratio continues to rise.
इसी बीच, नए मॉडलों की लगातार लॉन्च के साथ, मेरी कार्यक्षमता और गुणवत्ता दोनों, और मैं प्रति महीने टोकन पर करता हूँ, वह तेजी से बढ़ रहा है।
पिछली रात मैंने एक समाचार देखा, एंथ्रोपिक ने एक मॉडल जारी किया जिसे वे खुद भी सभी के लिए प्रकाशित करने से डर रहे हैं क्योंकि यह वास्तव में बहुत शक्तिशाली है।
इस नए मॉडल का नाम "Mythos" है, जिसका अर्थ चीनी में "पौराणिक कथा" है।
यह अभी प्रीव्यू संस्करण है, इसलिए इसे आधिकारिक रूप से "Mythos Preview" कहा जाता है। हालाँकि, इसे "Project Glasswing" नामक एक प्रोजेक्ट के रूप में लॉन्च किया गया है।
इस प्रोजेक्ट के बारे में मैं बाद में बताऊंगा।

पिछले महीने, एंथ्रोपिक के एक आंतरिक दस्तावेज़ का अनावरण हो गया, जिसमें यह उल्लेख किया गया कि ओपस से बड़ा और अधिक शक्तिशाली मॉडल विकसित किया जा रहा है, जिसका कोडनाम मिथोस है।
इसके बाद, एंथ्रोपिक ने इस लीक को "मानवीय त्रुटि" का कारण बताया और कोई अतिरिक्त व्याख्या नहीं दी।
अब, Mythos नामक मॉडल की आधिकारिक घोषणा कर दी गई है।
आधिकारिक घोषणा तो हुई है, लेकिन इसे अभी तक सार्वजनिक रूप से लॉन्च नहीं किया गया है। इसका मतलब है कि सामान्य उपयोगकर्ता अभी इसका उपयोग नहीं कर सकते।
कारण सीधा है, एंथ्रोपिक को लगता है कि यह मॉडल बहुत शक्तिशाली है, और सुरक्षा तंत्र तैयार न होने तक इसे सभी के लिए खोलना उपयुक्त नहीं है।
मुझे लगता है, इस वाक्य पर एक सेकंड के लिए रुककर सोचना चाहिए।
आम तौर पर, एक AI कंपनी नए मॉडल को जल्द से जल्द लॉन्च करने के लिए तत्पर रहती है, लेकिन इस बार Anthropic का तरीका स्पष्ट रूप से असामान्य है।
मेरी राय में, वे नहीं भेजना चाहते, बल्कि भेजने से डरते हैं।
क्योंकि, Mythos नामक मॉडल वास्तव में बहुत शक्तिशाली है।
कुछ आधिकारिक रूप से प्रकाशित परीक्षण डेटा देखें।
कोडिंग क्षमता में, Mythos और वर्तमान में सार्वजनिक रूप से सबसे शक्तिशाली Claude Opus 4.6 के बीच काफी अंतर है, और सभी बेंचमार्क परीक्षणों में, Mythos Opus 4.6 को पूरी तरह से हरा देता है।

GPQA Diamond (ग्रेजुएट लेवल साइंस क्वेश्चन एंड आंसर) टेस्ट में रीजनिंग क्षमता के मामले में परिणाम 94.6% बनाम 91.3% है, जिसमें Mythos जीतता है।
Humanity's Last Exam के टूल वाले और टूल विहीन परीक्षणों में भी Mythos ने पूर्ण विजय प्राप्त की।

एजेंट से संबंधित कंप्यूटर ऑपरेशन क्षमता में, OSWorld-Verified (स्वतंत्र रूप से कंप्यूटर कार्य पूरा करना) में Mythos, Oputs 4.6 के 72.7% की तुलना में 79.6% से आगे है।
हर एक आयाम में, Mythos, Opus 4.6 से बेहतर है, कुछ तो दबावपूर्ण रूप से आगे हैं।

कुछ कार्यों के प्रदर्शन में अंतर छोटे चरणों की बजाय भारी कूद हो गया है। उदाहरण के लिए, SWE-bench Multimodal 27.1% से बढ़कर 59% हो गया, जो लगभग दोगुना हो गया।
माइथोस के लिए सबसे मुख्य कारण यह है कि यह सॉफ्टवेयर दुनिया की सुरक्षा सीमाओं को इतना मजबूती से तोड़ देता है।
बस यही है कि दुनिया भर के सभी सिस्टम और सॉफ्टवेयर में दरारें होती हैं, और Mythos इन दरारों को मानवीय स्तर से अधिक क्षमता के साथ खोज सकता है और उन पर हमला कर सकता है।
अगर इस क्षमता को हैकर्स के हाथ लग जाए, तो पूरी दुनिया के ऑपरेटिंग सिस्टम और सॉफ्टवेयर प्रभावित होंगे, खासकर कुछ सार्वजनिक बुनियादी ढांचे और राष्ट्रीय सुरक्षा।
एंथ्रोपिक के घोषणा पत्र में एक वाक्य था, जिसे पढ़कर मुझे गहराई से डर लगा।

AI मॉडल की कोडिंग क्षमता अब बहुत उच्च स्तर पर पहुंच गई है, और वे सॉफ्टवेयर दुर्बलताओं की खोज और उपयोग में सबसे अनुभवी मनुष्यों के अलावा सभी को पार कर सकते हैं।
इस वाक्य के बारे में, मैं थोड़ा और विस्तार करना चाहूँगा।
मैं प्रोग्रामर के रूप में शुरू हुआ, इसलिए मुझे पता है कि सॉफ्टवेयर कैसे बनाया जाता है और अलग-अलग लोगों द्वारा लिखी गई कोड में कितना अंतर होता है।
और कोई भी सॉफ्टवेयर ऐसा नहीं है जो दावा करे कि उसमें कोई फनल नहीं है, भले ही यह दरार कभी खोजी न गई हो।
पिछले वल्नरेबिलिटी के कारण दशकों तक सिस्टम में शांति से रहने का कारण यह नहीं था कि सिस्टम पर्याप्त सुरक्षित था।
लेकिन वल्नरेबिलिटी ढूंढने के लिए अत्यधिक पेशेवर क्षमता, बहुत अधिक धैर्य और ऊर्जा, और बहुत समय की आवश्यकता होती है।
बहुत कम लोग जानते हैं, और निवेश करने के लिए तैयार होने वाले और भी कम हैं।
यह "क्षमता की दुर्लभता" पूरे सॉफ्टवेयर सुरक्षा दुनिया की अंतर्निहित पूर्वधारणा है। AI के हस्तक्षेप के बाद, यह पूर्वधारणा ढीली पड़ने लगी है।
AI अधिकांश शीर्ष नहीं बनने वाले मनुष्यों की क्षमता से अधिक कुशलता से काम कर सकता है, हम इसका उपयोग वल्नरेबिलिटी पर हमला करने के लिए कर सकते हैं, और इसी तरह इसका उपयोग वल्नरेबिलिटी को बंद करने के लिए भी कर सकते हैं।
इस समस्या को हल करने के लिए, अब मैं बताता हूँ कि Anthropic द्वारा बनाया गया Project Glasswing क्या है।
बस यह एक प्रोजेक्ट है जो Mythos की क्षमताओं का उपयोग करके दुनिया भर के बुनियादी ढांचे प्रणालियों में बग्स ढूंढता है।
भागीदारों में AWS, ऐप्पल, माइक्रोसॉफ्ट, गूगल, न्वीडिया, सिस्को, लिनक्स फाउंडेशन आदि कुल 12 संस्थाएँ शामिल हैं।

यह रूपरेखा क्लाउड कंप्यूटिंग, ऑपरेटिंग सिस्टम, चिप, ब्राउज़र, वित्तीय बुनियादी ढांचा, साइबर सुरक्षा और ओपन सोर्स इकोसिस्टम को कवर करती है।
In other words, almost all the key players in the global digital infrastructure are in this project.
इस प्रोजेक्ट की केंद्रीय तर्क एक ही है: रक्षात्मक पक्ष को पहले इस शीर्ष AI मॉडल की क्षमताओं का उपयोग करने दें।
क्योंकि यदि हमलावर पहले समान स्तर के उपकरण प्राप्त कर लेता है, तो खिड़की खुलने के बाद बंद करना मुश्किल हो जाता है। Anthropic ने अनुसंधान पूर्वावलोकन अवधि के लिए 100 मिलियन डॉलर की मॉडल उपयोग की सीमा प्रदान करने का वादा किया है।
12 मुख्य संस्थाओं के अलावा, 40 से अधिक संगठन जो महत्वपूर्ण सॉफ्टवेयर बुनियादी ढांचे को बनाए रखते हैं, को Mythos का उपयोग करके अपने प्रणालियों और ओपन सोर्स प्रोजेक्ट्स की जांच के लिए पहुंच प्राप्त है।
इसी समय, Anthropic ने Linux फाउंडेशन को 2.5 मिलियन डॉलर और Apache सॉफ्टवेयर फाउंडेशन को 1.5 मिलियन डॉलर दान किए हैं, जो दोनों ही सॉफ्टवेयर दुनिया की बुनियादी ढांचे हैं।
Let's put it this way: virtually all the apps, websites, and systems we use today are built on top of them.
मेरी राय में, Anthropic ने इस बार एक अच्छा काम किया है, न केवल अधिक शक्तिशाली मॉडल लॉन्च किया, बल्कि वैश्विक सूचना अवसंरचना को अपने सुधार के लिए पैसा भी दिया।
After all, going naked benefits no one.
शायद अब तक आपको अभी भी मिथोस की शक्ति का अहसास नहीं हुआ है, मैंने आधिकारिक मूल पाठ में तीन विशिष्ट उदाहरण देखे हैं, जो मुझे लगता है कि संख्याओं से अधिक स्पष्ट करते हैं।

पहला, OpenBSD।
यह एक ऐसा ऑपरेटिंग सिस्टम है जिसकी सुरक्षा को बहुत अधिक मान्यता दी गई है, और इस पर कई महत्वपूर्ण बुनियादी ढांचे चलते हैं, जिनमें हमारे उपयोग किए जाने वाले ऐपल फोन iOS सिस्टम, Android सिस्टम, और कुछ उद्योगों और संगठनों के आंतरिक सिस्टम शामिल हैं।
Mythos ने 27 साल पुराना एक दरार पाया, जिसका उपयोग हमलावर कर सकता है ताकि लक्ष्य मशीन को रिमोट से क्रैश कर सके।
27 साल! कोई नहीं ध्यान दे रहा, बल्कि किसी ने ही नहीं ढूंढा।
दूसरा, FFmpeg।
इसका उपयोग वीडियो को संसाधित करने वाले लगभग सभी सॉफ्टवेयर द्वारा किया जाता है, और आप जिन वीडियो प्लेयर सॉफ्टवेयर का उपयोग करते हैं, उनमें लगभग सभी में इसकी उपस्थिति होती है।
एक दरार 16 साल पहले लिखी गई एक पंक्ति कोड में छिपी थी, और स्वचालित परीक्षण उपकरण ने 500 लाख बार बार-बार हमला किया, लेकिन हर बार इसे नहीं पाया।
लेकिन, Mythos को ढूंढ लिया गया।
तीसरा, लिनक्स कर्नेल।
इसके बारे में अधिक कहने की आवश्यकता नहीं है, यह लगभग पूरे इंटरनेट का बुनियादी ढांचा है और सबसे अधिक सावधानी बरतने योग्य है।
Mythos ने केवल कुछ स्वतंत्र दुर्बलताएँ नहीं खोजीं, बल्कि कई दुर्बलताओं को एक हमला श्रृंखला में जोड़ दिया।
सामान्य उपयोगकर्ता अधिकार से शुरू करते हुए, अधिकार बढ़ाते हुए, अंततः पूरे मशीन पर पूर्ण नियंत्रण प्राप्त करें।
Linux के बारे में, यह पिछले दो उदाहरणों की प्रकृति से पूरी तरह अलग है।
दरार ढूंढना, विश्लेषणात्मक क्षमता है।
But the string vulnerability is the strategy capability.
जैसे कई प्रोडक्ट मैनेजर्स प्रोटोटाइप बनाते हैं, दस्तावेज लिखते हैं और डेटा विश्लेषण करते हैं, ये एकल क्षमताएँ हैं। लेकिन व्यवसाय, प्रोडक्ट और व्यापार को जोड़ना, रणनीतिक क्षमता है।
एक आक्रमण पथ की योजना बनाने में सक्षम मॉडल, अब केवल ऑडिट उपकरण नहीं है, यह डिजिटल वातावरण में सक्रिय रूप से कार्य करने वाले एजेंट के करीब है।
ऊपर के तीनों मामलों में, Anthropic ने सभी को पहले खोजा, फिर रिपोर्ट किया, फिर ठीक किया, और फिर ही इसकी घोषणा की, और अब सभी ठीक हो चुके हैं।
इसे देखकर आप समझ जाएंगे कि Mythos कितना शक्तिशाली है, जैसे एक ऐसा शिकारी जिसे अभी तक बंदी के बाहर नहीं निकाला गया है; वास्तविक दुनिया को इसके लिए तैयार होना होगा।
मैं यहाँ कुछ अवलोकन कहना चाहता हूँ, जो शायद आगे के वास्तविक परिवर्तन की शुरुआत होंगे।
सबसे पहले, सॉफ्टवेयर दुनिया की सुरक्षा की धारणाएँ अमान्य हो रही हैं।
हम आज जिस सॉफ्टवेयर स्थिरता को सामान्य मानते हैं, वह पूरी तरह से सिस्टम डिज़ाइन के पर्याप्त अच्छे होने के कारण नहीं है। इसका बड़ा हिस्सा हमले की क्षमता की दुर्लभता पर निर्भर करता है।
सीधे बोलें, यह सॉफ्टवेयर कमजोर नहीं है, बल्कि लोग कमजोर हैं।
दरार ढूंढने के लिए लागत की आवश्यकता होती है, दुरुपयोग श्रृंखला बनाने के लिए समय की आवश्यकता होती है, और व्यापक स्कैनिंग के लिए संसाधनों की आवश्यकता होती है। इसलिए कई तकनीकी ऋण, पुराने बग, और पुरानी प्रणालियाँ ऐसे ही जीवित रहती हैं, जिन्हें कभी गंभीरता से साफ नहीं किया गया है।
जैसे हम उत्पाद बनाते हैं, हमें लगता है कि तर्क पूरा हो गया है, कुछ समस्या नहीं है, लेकिन इसका मतलब यह नहीं है कि सब कुछ सुरक्षित है, शायद हमारी क्षमता की सीमा पहुंच गई है।
Mythos द्वारा प्रदर्शित क्षमता, दर्ज किए जाने से लेकर दुरुपयोग तक के समय की खिड़की को पिछले कई महीनों से कुछ मिनटों में समेट देती है।
What does a few minutes mean?
इसका मतलब है कि पैच की गति और ठीक करने की प्रक्रिया, हमलों की गति के साथ चलने में असमर्थ हो रही है।
दूसरा, ओपन सोर्स दुनिया सबसे पहले दबाव महसूस करेगी।
आज के अधिकांश 현대 सॉफ्टवेयर के नीचे बहुत सारी ओपन सोर्स निर्भरताएँ दबी होती हैं। ये सामान्य रूप से दिखाई नहीं देतीं, लेकिन जब इन पर हमला होता है, तो पूरा उद्योग एक साथ प्रभावित हो जाता है।
शायद कुछ पाठकों को यह तर्क समझ में नहीं आ रहा हो, सरल शब्दों में कहें तो, हम जिन सभी सॉफ्टवेयर का उपयोग कर रहे हैं, उनके नीचे ओपन सोर्स प्रोजेक्ट्स होते हैं, और इन प्रोजेक्ट्स का सोर्स कोड सभी के लिए दृश्यमान होता है।
जब भविष्य में मॉडल सक्षम हो जाएंगे कि वे निरंतर और व्यापक रूप से ओपन सोर्स प्रोजेक्ट्स को स्कैन करें, तो ओपन सोर्स कम्युनिटी मेंटेनर्स के सामने दबाव का स्तर पूरी तरह से अलग हो जाएगा।
यही कारण है कि Anthropic ने Linux फाउंडेशन और Apache फाउंडेशन को दान किया।
यह सामाजिक कार्य नहीं है, बल्कि यह मानना है कि ओपन सोर्स इंफ्रास्ट्रक्चर AI युग के पूरे डिजिटल दुनिया की सबसे कमजोर, लेकिन सबसे अटूट नींव है, और वे केवल बुरे और दुष्ट लोगों के रूप में नहीं देखे जाना चाहते।
तीसरा, मनुष्य कमजोर हो जाएंगे, और AI शुरू कर देगा AI के साथ बहस करना।
पहले इंटरनेट उत्पाद सुरक्षा टीम का मूल्य, मानवीय निर्णय लेने की क्षमता, अनुभव के संचय और प्रणाली की गहरी समझ पर निर्भर करता था।
भविष्य में, इस बात का तर्क बदल जाएगा।
जो अपना मॉडल सबसे मजबूत बनाता है, जो अपने टूल्स को सबसे तेजी से जोड़ता है, और जो AI ऑडिट को डेवलपमेंट प्रक्रिया के सबसे आगे के चरण में शामिल करता है, वही जीतता है।
यह प्रोग्रामर के स्थान पर अन्य के आने का मुद्दा नहीं है, बल्कि सुरक्षा उद्योग की स्वयं की उत्पादन प्रणाली पुनर्गठित होगी।
अच्छा, उस ओर, हजारों उच्च जोखिम वाले दरारों को कुछ हफ्तों में ढूंढा जा सकता है। समस्या यह है कि हमलावर भी अंततः समान स्तर के उपकरणों के साथ आ जाएंगे।
उस समय, सॉफ्टवेयर उत्पादों की सुरक्षा मानव और मानव के बीच का संघर्ष नहीं, बल्कि मॉडल और मॉडल के बीच का आक्रमण और रक्षा का खेल होगी।
इस बार, एंथ्रोपिक ने केवल क्षमताएँ ही नहीं, बल्कि जोखिम भी प्रकाशित किए हैं। शायद इस चरण में, पूरे उद्योग को देखने की सबसे बड़ी आवश्यकता ऐसी ईमानदारी है।
सभी AI के बारे में बात कर रहे हैं कि यह कैसे कार्यक्षमता को बदल रहा है, और इसमें कोई गलती नहीं है।
लेकिन माइथोस हमें यह भी याद दिला रहा है कि AI क्षमताओं की छलांग अंततः सामग्री दुनिया से सॉफ्टवेयर दुनिया में, और फिर पूरे डिजिटल दुनिया के बुनियादी ढांचे में फैलेगी।
कंटेंट वर्ल्ड को रीव्राइट किया गया है, जिससे ट्रैफिक लॉजिक प्रभावित होता है।
सॉफ्टवेयर दुनिया को फिर से लिखा जा रहा है, और इसकी नींव हिल रही है।
इस समय, मैं फिल्म '2012' की एक बात याद करता हूँ, जो इस लेख का अंत भी है।
तुम कोई भी हो, जाति के आधार पर नहीं, देश के आधार पर नहीं, कल हम सब एक जैसे हैं!
