लेखक: Anthropic
Compiled by: Shenchao TechFlow
शनि का सारांश: Anthropic ने एक अभी तक गुप्त अग्रणी मॉडल Claude Mythos Preview जारी किया है, जिसकी कोड ऑडिट क्षमता अधिकांश मानव सुरक्षा विशेषज्ञों से अधिक है और यह दशकों पुराने ज़ीरो-डे दुर्बलताओं को स्वयं खोज सकता है।
इस क्षमता के आधार पर, Anthropic ने AWS, ऐप्पल, गूगल, माइक्रोसॉफ्ट, न्वीडिया सहित 12 टेक दिग्गजों के साथ Project Glasswing शुरू किया है, जिसमें 100 मिलियन डॉलर की क्रेडिट लाइन निवेश की गई है, और लक्ष्य है कि हम आक्रमकों को समान क्षमता प्राप्त होने से पहले वैश्विक महत्वपूर्ण सॉफ्टवेयर के दरारों को बंद कर दें।
प्रस्तावना
आज हम प्रोजेक्ट ग्लासविंग की घोषणा कर रहे हैं, जो अमेज़न वेब सर्विसेज (AWS), Anthropic, ऐप्पल, ब्रॉडकम, सिस्को, CrowdStrike, गूगल, जेपी मॉर्गन, लिनक्स फाउंडेशन, माइक्रोसॉफ्ट, न्विडिया और Palo Alto Networks को एकत्रित करता है, जिसका लक्ष्य वैश्विक स्तर पर सबसे महत्वपूर्ण सॉफ्टवेयर सुरक्षा को सुरक्षित करना है।
हमने Project Glasswing शुरू किया क्योंकि Anthropic द्वारा प्रशिक्षित एक नया अग्रणी मॉडल ऐसी क्षमताएँ दर्शाता है जो हमारे विचार में साइबर सुरक्षा के परिदृश्य को पुनर्परिभाषित कर सकती हैं। Claude Mythos Preview एक सामान्य, अभी तक जारी नहीं किया गया अग्रणी मॉडल है, जो एक कठोर सच्चाई को प्रकट करता है: AI मॉडल की कोडिंग क्षमता इतनी उन्नत हो चुकी है कि वे सॉफ्टवेयर दुर्बलताओं की खोज और दुरुपयोग में सबसे शीर्ष विशेषज्ञों के अलावा सभी को पार कर सकते हैं।
Mythos Preview ने हर प्रमुख ऑपरेटिंग सिस्टम और हर प्रमुख ब्राउज़र में हज़ारों गंभीर दुर्बलताएँ खोज ली हैं। AI की प्रगति की गति के अनुसार, ऐसी क्षमता आने वाले भविष्य में फैल जाएगी और शायद ज़िम्मेदारी न लेने वाले उपयोगकर्ताओं के हाथों में चली जाए। आर्थिक, सार्वजनिक सुरक्षा और राष्ट्रीय सुरक्षा पर पड़ने वाला प्रभाव बहुत गंभीर हो सकता है। Project Glasswing इन क्षमताओं को पहले सुरक्षा के लिए प्राथमिकता देने का एक तत्काल प्रयास है।
Project Glasswing के एक हिस्से के रूप में, उपरोक्त साझेदार Mythos Preview का उपयोग अपने रक्षात्मक सुरक्षा कार्यों में करेंगे; Anthropic अपने अनुभव साझा करेगा ताकि पूरे उद्योग को लाभ मिल सके। हमने अतिरिक्त 40 से अधिक संगठनों को, जो महत्वपूर्ण सॉफ़्टवेयर बुनियादी ढांचे का निर्माण या रखरखाव करते हैं, अपने प्रणालियों और ओपन सोर्स सिस्टम को स्कैन और मजबूत करने के लिए पहुँच प्रदान की है। Anthropic ने Mythos Preview के उपयोग के लिए अधिकतम 100 मिलियन डॉलर की प्रतिबद्धता और ओपन सोर्स सुरक्षा संगठनों को 4 मिलियन डॉलर की सीधी दान की प्रतिबद्धता की है।
Project Glasswing केवल एक शुरुआत है। कोई भी संस्थान अकेले साइबर सुरक्षा समस्याओं को हल नहीं कर सकता: अग्रणी AI विकासकर्ता, अन्य सॉफ्टवेयर कंपनियाँ, सुरक्षा शोधकर्ता, ओपन सोर्स रखरखावकर्ता और विश्वभर की सरकारें अपरिहार्य भूमिका निभाती हैं। वैश्विक साइबर बुनियादी ढांचे की रक्षा में कई वर्ष लग सकते हैं; जबकि अग्रणी AI क्षमताएँ अगले कुछ महीनों में भारी रूप से उन्नत हो सकती हैं। साइबर रक्षा कर्मियों को लाभ प्राप्त करने के लिए, उन्हें अभी कार्रवाई करनी होगी।
AI युग की साइबर सुरक्षा
हम जिन सॉफ्टवेयर पर रोजाना निर्भर हैं—बैंकिंग प्रणाली चलाने, मेडिकल रिकॉर्ड स्टोर करने, लॉजिस्टिक्स नेटवर्क को जोड़ने, और बिजली ग्रिड को संचालित रखने—उनमें हमेशा बग होते हैं। अधिकांश नामंजूर होते हैं, लेकिन कुछ गंभीर सुरक्षा दोष होते हैं, जिन्हें खोजने पर हमलावर प्रणाली को हाइजैक कर सकते हैं, संचालन को बंद कर सकते हैं या डेटा चुरा सकते हैं।
网络攻击对企业网络、医疗系统、能源基础设施、交通枢纽以及各国政府机构的破坏性后果已经有目共睹。在全球层面,来自中国、伊朗、朝鲜和俄罗斯的国家级攻击已经威胁到了支撑民用生活和军事准备的基础设施。即使是针对单个医院或学校的小规模攻击,也能造成巨大经济损失、暴露敏感数据,甚至危及生命。全球网络犯罪的年度经济损失难以精确估算,但可能在 5000 亿美元左右。
पिछले समय में, कई सॉफ़्टवेयर दोष वर्षों तक अनदेखे रहे क्योंकि उन्हें खोजने और उपयोग करने के लिए बहुत कम सुरक्षा विशेषज्ञों के पास ही आवश्यक विशेषज्ञता होती थी। लेकिन नवीनतम एआई मॉडल के आगमन के साथ, सॉफ़्टवेयर दुर्बलताओं की खोज और उनका दुरुपयोग करने की लागत, प्रयास और विशेषज्ञता की सीमा में काफी कमी आई है। पिछले वर्ष में, एआई मॉडल कोड पढ़ने और तर्क करने में अधिक कुशल हो गए हैं, विशेषकर दुर्बलताओं की खोज और उपयोग के तरीकों के निर्माण में अद्भुत प्रदर्शन किया है। Claude Mythos Preview ने इन साइबर सुरक्षा कौशलों में क्रांतिकारी प्रगति की है—इसने कुछ ऐसी दुर्बलताएँ खोजी हैं जो कई दशकों तक मानवीय समीक्षा के बाद और लाखों स्वचालित सुरक्षा परीक्षणों के बाद भी बची हुई थीं, और इसके द्वारा विकसित किए गए उपयोग कोड भी धीरे-धीरे अधिक परिष्कृत होते जा रहे हैं।
पहले DARPA साइबर चैलेंज के दस साल बाद, अग्रणी AI मॉडल शीर्ष मानव द्वारा विभेदन और उपयोग की क्षमता के करीब पहुंच रहे हैं। यदि आवश्यक सुरक्षा उपाय नहीं हैं, तो ये शक्तिशाली साइबर क्षमताएं विश्व के सबसे महत्वपूर्ण सॉफ़्टवेयर में मौजूद बड़ी संख्या में दोषों का दुरुपयोग करने के लिए उपयोग की जा सकती हैं। साइबर हमले अधिक आम, अधिक विनाशकारी हो जाएंगे और संयुक्त राज्य अमेरिका और इसके सहयोगियों के प्रतिद्वंद्वियों को शक्ति प्रदान करेंगे। यह लोकतांत्रिक देशों के लिए एक महत्वपूर्ण सुरक्षा प्राथमिकता है।
अच्छी खबर यह है कि जो क्षमताएँ AI मॉडल को गलत हाथों में खतरनाक बना देती हैं, वे उन्हें महत्वपूर्ण सॉफ़्टवेयर दोषों की खोज और ठीक करने में अत्यधिक मूल्यवान बनाती हैं—और सुरक्षित बग कम वाले नए सॉफ़्टवेयर के उत्पादन में भी मदद करती हैं। प्रोजेक्ट ग्लासविंग, आगामी AI-संचालित साइबर सुरक्षा युग में रक्षाकर्मियों के लिए स्थायी लाभ बनाने का एक महत्वपूर्ण कदम है।
Claude Mythos Preview क्षमता का पूर्वावलोकन दोष और उनके दुरुपयोग की पहचान करने की
पिछले कुछ सप्ताहों में, हमने Claude Mythos Preview का उपयोग करके प्रत्येक प्रमुख ऑपरेटिंग सिस्टम, प्रत्येक प्रमुख ब्राउज़र और अन्य कई महत्वपूर्ण सॉफ़्टवेयर में हज़ारों ज़ीरो-डे दोष (जो पहले सॉफ़्टवेयर विकासकों को पता नहीं थे) की खोज की है, जिनमें से कई उच्च जोखिम के हैं।
Frontier Red Team ब्लॉग पर, हमने उन वैल्नरेबिलिटीज के तकनीकी विवरण और Mythos Preview द्वारा पाए गए उपयोग के तरीके प्रकाशित किए हैं, जिनमें से कुछ को पहले ही ठीक कर दिया गया है। इनमें से लगभग सभी वैल्नरेबिलिटीज (और कई संबंधित उपयोग के तरीकों के विकास) का पता लगाना मॉडल ने पूरी तरह से स्वतंत्र रूप से किया, बिना किसी मानवीय मार्गदर्शन के। यहाँ तीन उदाहरण हैं:
- Mythos Preview ने OpenBSD में 27 साल पुराना एक दरार पाया है। OpenBSD अत्यधिक सुरक्षित सुदृढीकरण के लिए जाना जाता है और फायरवॉल और अन्य महत्वपूर्ण बुनियादी ढांचे में व्यापक रूप से उपयोग किया जाता है। यह दरार हमलावर को लक्ष्य मशीन से केवल कनेक्ट करके दूरस्थ रूप से इसे क्रैश करने की अनुमति देती है।
- इसने FFmpeg में एक 16 साल पुराना दोष भी खोजा। FFmpeg का उपयोग असंख्य सॉफ्टवेयर वीडियो कोडेक के लिए करता है। समस्या एक पंक्ति कोड में थी, और स्वचालित परीक्षण उपकरण ने इस पंक्ति पर 50 लाख बार प्रहार किया है, लेकिन कभी समस्या नहीं पकड़ी।
- इस मॉडल ने लिनक्स कर्नेल (जो दुनिया के अधिकांश सर्वर्स को चलाता है) में कई वल्नरेबिलिटीज को स्वतः खोजा और जोड़ा, जिससे सामान्य उपयोगकर्ता अधिकारों से मशीन पर पूर्ण नियंत्रण प्राप्त करने के लिए प्रिविलेज एस्केलेशन हमला संभव हुआ।
हमने उपरोक्त दोषों की सभी जानकारी संबंधित सॉफ्टवेयर रखरखावकर्ताओं को रिपोर्ट कर दी है, और उन सभी को ठीक कर दिया गया है। अन्य कई दोषों के लिए, हमने आज एन्क्रिप्टेड हैश का विवरण प्रदान किया है (Red Team ब्लॉग देखें), और ठीक करने के बाद ही हम विशिष्ट जानकारी सार्वजनिक करेंगे।
CyberGym जैसे मानकों ने Mythos Preview और हमारे दूसरे सबसे मजबूत मॉडल Claude Opus 4.6 के बीच के महत्वपूर्ण अंतर की पुष्टि की है:
साइबर सुरक्षा दुर्बलता का पुनर्निर्माण - CyberGym

हमारे अपने कार्य के अलावा, कई साझेदारों ने क्लॉड माइथोस प्रीव्यू का उपयोग कई सप्ताहों से किया है। यहाँ उनकी प्रतिक्रियाएँ हैं:
AI क्षमताएँ एक सीमा पार कर चुकी हैं, जिससे क्रिटिकल इंफ्रास्ट्रक्चर को साइबर खतरों से बचाने की आवश्यकता में मौलिक और अपरिवर्तनीय परिवर्तन आ गया है। हमने इन मॉडल्स के आधारभूत कार्य के माध्यम से दिखाया है कि हार्डवेयर और सॉफ्टवेयर में सुरक्षा दुर्बलताओं की पहचान और ठीक करने की गति और पैमाने में अभूतपूर्व प्रगति संभव है। यह एक गहरा परिवर्तन है और एक स्पष्ट संकेत है कि पुराने सिस्टम मजबूतीकरण के तरीके पर्याप्त नहीं हैं। तकनीकी प्रदाताओं को तुरंत नए तरीकों को सक्रिय रूप से अपनाना होगा, और ग्राहकों को इसके लिए तैयार होना होगा। यही कारण है कि सिस्को Project Glasswing में शामिल हुआ है—यह कार्य बहुत महत्वपूर्ण और तत्काल है, इसे अकेले नहीं किया जा सकता।
—— एंथनी ग्रिको, सिस्को के सीनियर वाइस प्रेसिडेंट और चीफ सिक्योरिटी एंड ट्रस्ट ऑफिसर
AWS पर, हम खतरे आने से पहले ही बचाव बनाते हैं, जिसमें कस्टम चिप से लेकर पूरी तकनीकी स्टैक शामिल है। सुरक्षा किसी एक चरण का मामला नहीं है, यह लगातार होती है और हम जो कुछ भी करते हैं, उसमें घुली-मिली है। हमारी टीम खतरों का पता लगाने के लिए रोजाना 400 ट्रिलियन से अधिक नेटवर्क ट्रैफ़िक का विश्लेषण करती है, और AI हमारी बड़े पैमाने पर सुरक्षा क्षमता का केंद्र है। हमने Claude Mythos Preview को अपनी सुरक्षा संचालन में परीक्षण किया है, इसे महत्वपूर्ण कोडबेस पर लागू किया है, और यह हमारे कोड को मजबूत करने में पहले से ही मदद कर रहा है। हम Anthropic के साथ साझेदारी में गहरी सुरक्षा विशेषज्ञता ला रहे हैं और Claude Mythos Preview को मजबूत करने में मदद कर रहे हैं, ताकि अधिक संगठन उच्चतम सुरक्षा मानकों के साथ काम कर सकें।
—— एमी हर्जोग, अमेज़न वेब सर्विसेज के वाइस प्रेसिडेंट और मुख्य सूचना सुरक्षा अधिकारी
जब साइबर सुरक्षा केवल मानवीय क्षमताओं पर सीमित नहीं रहती, तो AI का जिम्मेदारी से उपयोग करके सुरक्षा को बड़े पैमाने पर बढ़ाने और जोखिम को कम करने का अवसर अभूतपूर्व है। Project Glasswing में शामिल होकर Claude Mythos Preview तक पहुँच प्राप्त करने से हमें जोखिमों की पहचान और उनकी शमता के लिए शीघ्र समय मिलता है, जिससे हमारी सुरक्षा और विकास समाधान मजबूत होते हैं और ग्राहकों और माइक्रोसॉफ्ट की बेहतर सुरक्षा होती है। हमारे ओपन-सोर्स सुरक्षा बेंचमार्क CTI-REALM पर परीक्षण करने पर, Claude Mythos Preview ने पिछले मॉडल की तुलना में महत्वपूर्ण सुधार दिखाया है। हम Anthropic और व्यापक उद्योग के साथ सहयोग करके सभी के लिए सुरक्षा परिणामों में सुधार करने की उम्मीद करते हैं।
—— इगोर त्स्यांस्की, माइक्रोसॉफ्ट साइबर सुरक्षा और माइक्रोसॉफ्ट रिसर्च के एग्जीक्यूटिव वाइस प्रेसिडेंट
अंतराल जिसमें दरार का पता चलता है और उसे हैकर्स द्वारा दुरुपयोग किया जाता है, वह ढह चुका है—जिसे पहले महीनों लगते थे, अब AI के साथ कुछ मिनटों में पूरा किया जा सकता है। Claude Mythos Preview ने रक्षात्मक कार्रवाई की संभावना दिखाई, और विरोधी अपरिहार्य रूप से इसी क्षमता का दुरुपयोग करने की कोशिश करेंगे। यह धीमे होने का कारण नहीं है, बल्कि एक साथ तेज़ होने का कारण है। AI को लागू करने के लिए सुरक्षा आवश्यक है। यही कारण है कि CrowdStrike पहले दिन से ही इसमें शामिल है।
—— एलिया जैत्सेव, क्राउडस्ट्राइक के मुख्य प्रौद्योगिकी अधिकारी
पिछले समय में, सुरक्षा विशेषज्ञता केवल बड़ी सुरक्षा टीमों वाले संगठनों के लिए एक लक्ज़री थी। ओपन सोर्स सॉफ़्टवेयर मेंटेनर—जिनका सॉफ़्टवेयर दुनिया भर के अधिकांश महत्वपूर्ण बुनियादी ढांचे को संचालित करता है—पारंपरिक रूप से सुरक्षा समस्याओं का समाधान करने के लिए अपने आप पर निर्भर रहे। ओपन सोर्स सॉफ़्टवेयर आधुनिक प्रणालियों के अधिकांश कोड का निर्माण करता है, जिसमें AI एजेंट्स द्वारा नए सॉफ़्टवेयर लिखे जाने वाले प्रणालियां भी शामिल हैं। Project Glasswing, इन महत्वपूर्ण ओपन सोर्स कोडबेस के मेंटेनर्स को नवीनतम AI मॉडल्स तक पहुंच प्रदान करके—जो बड़े पैमाने पर सक्रिय रूप से दोषों की पहचान करने और उन्हें ठीक करने में सक्षम हैं—इस स्थिति में परिवर्तन का एक व्यावहारिक मार्ग प्रदान करता है। यही AI-सशक्त सुरक्षा कैसे बड़ी टीमों के लिए एक विशिष्ट उपकरण से हर मेंटेनर के लिए एक विश्वसनीय सहायक में परिवर्तित हो रही है।
—— जिम जेमलिन, लिनक्स फाउंडेशन के सीईओ
जीपी जेम्स के मिशन का केंद्र वित्तीय प्रणाली की साइबर सुरक्षा और लचीलापन को बढ़ावा देना है, और हम मानते हैं कि जब अग्रणी संस्थाएं आम चुनौतियों पर साथ मिलकर काम करती हैं, तो उद्योग सबसे मजबूत होता है। प्रोजेक्ट ग्लासविंग एक अनूठा प्रारंभिक अवसर प्रदान करता है, जिससे हम अपने मानकों के अनुसार अगली पीढ़ी के AI उपकरणों की क्षमता का मूल्यांकन कर सकें, जबकि सम्मानित तकनीकी नेताओं के साथ साथ चलते हुए महत्वपूर्ण बुनियादी ढांचे की रक्षात्मक साइबर सुरक्षा में। हम यह निर्धारित करने के लिए एक कठोर, स्वतंत्र दृष्टिकोण अपनाएंगे कि हम कैसे आगे बढ़ें और कैसे मदद प्रदान करें। एंथ्रोपिक की पहल इस क्षण की आवश्यकता के अनुसार भविष्यदृष्टि और सहयोगात्मक दृष्टिकोण को दर्शाती है।
—— पैट ओपेट, जेपी मॉर्गन के मुख्य सूचना सुरक्षा अधिकारी
गूगल इस अंतर्विभागीय साइबर सुरक्षा पहल के गठन को देखकर खुश है और Vertex AI के माध्यम से प्रतिभागियों को Mythos Preview प्रदान कर रहा है। उभरती सुरक्षा समस्याओं—जैसे कि पोस्ट-क्वांटम क्रिप्टोग्राफी, जिम्मेदार जीरो-डे दोष अलग करना, ओपन सोर्स सॉफ्टवेयर सुरक्षा, या AI-आधारित हमलों के खिलाफ सुरक्षा—पर उद्योग का सहयोग हमेशा महत्वपूर्ण रहा है। हमने हमेशा माना है कि AI साइबर रक्षा में नए चुनौतियाँ और अवसर दोनों प्रस्तुत करता है, इसीलिए हम Big Sleep और CodeMender जैसे AI-संचालित उपकरण बना रहे हैं ताकि महत्वपूर्ण सॉफ्टवेयर दोषों की पहचान और उनकी मरम्मत की जा सके। हम अग्रणी साइबर सुरक्षा प्लेटफॉर्म पर निवेश करते रहेंगे और उपयोगकर्ताओं, ग्राहकों, पारिस्थितिकी तंत्र और राष्ट्रीय सुरक्षा की सुरक्षा को केंद्र में रखते हुए संस्कृति को बढ़ावा देंगे।
—— हीथर एडकिन्स, गूगल सुरक्षा इंजीनियरिंग के उपाध्यक्ष
पिछले कुछ हफ्तों से, हमने Claude Mythos Preview मॉडल का उपयोग किया है ताकि पिछली पीढ़ी के मॉडल द्वारा पूरी तरह से लुप्त हो गए जटिल दरारों की पहचान की जा सके। इससे छिपे हुए दरारों की खोज का खेल बदल गया है, और इसका मतलब है कि हमलावर जल्द ही पिछले समय की तुलना में अधिक शून्य-दिन के दरारों की पहचान करने और उनका दुरुपयोग करने में सक्षम होंगे। स्पष्ट है कि इन मॉडलों को ओपन सोर्स प्रोजेक्ट मालिकों और सभी रक्षाकर्मियों के हाथों में सौंपा जाना चाहिए, ताकि हमलावरों को इनकी पहुंच प्राप्त होने से पहले दरारें पहचानी जा सकें और उन्हें ठीक किया जा सके। शायद अधिक महत्वपूर्ण बात: हर किसी को AI-सहायता प्राप्त हमलावरों के लिए तैयार होना होगा। हमले अधिक, तेज़ और अधिक जटिल होंगे। अब साइबर सुरक्षा प्रणाली को समग्र रूप से अपग्रेड करने का समय है। हम Anthropic की प्रशंसा करते हैं, जिसने उद्योग के साथ सहयोग किया है ताकि इन शक्तिशाली क्षमताओं को पहले रक्षा के लिए प्राथमिकता दी जा सके।
—— ली क्लारिच, पालो अल्टो नेटवर्क्स के मुख्य उत्पाद और प्रौद्योगिकी अधिकारी
Claude Mythos प्रीव्यू की शक्तिशाली साइबर सुरक्षा क्षमता इसकी उत्कृष्ट एजेंट कोडिंग और तर्क क्षमता से उत्पन्न होती है। निम्नलिखित मूल्यांकन परिणाम दर्शाते हैं कि यह मॉडल कई सॉफ्टवेयर कोडिंग कार्यों में सभी ज्ञात मॉडल्स में सर्वोच्च अंक प्राप्त करता है।
Agent Coding

Reasoning

Agent Search and Computer Usage

टिप्पणी:
- SWE-bench Verified, Pro और Multilingual: मेमोराइजेशन स्क्रीनिंग ने कुछ प्रश्नों को चिह्नित किया है। मेमोराइजेशन की संभावना वाले प्रश्नों को हटाने के बाद, Mythos Preview का Opus 4.6 के सापेक्ष लाभ अपरिवर्तित रहता है।
- SWE-bench Multimodal: आंतरिक कार्यान्वयन का उपयोग करते हुए, अंक सार्वजनिक लीडरबोर्ड के साथ सीधे तुलना नहीं किए जा सकते।
- Terminal-Bench 2.0: Terminus-2 फ्रेमवर्क का उपयोग करते हुए, अनुकूलन विचार मोड में अधिकतम प्रयास, प्रत्येक कार्य के लिए कुल बजट 100 लाख टोकन, 1 गुना गारंटी / 3 गुना अधिकतम संसाधन आवंटन, प्रत्येक कार्य के लिए 5 प्रयासों का औसत। टाइमआउट सीमा बढ़ाकर 4 घंटे करने और Terminal-Bench 2.1 के अद्यतन के बाद, Mythos Preview स्कोर 92.1% है।
- BrowseComp: Claude Mythos Preview का स्कोर Opus 4.6 से अधिक है, जबकि इसका token उपयोग केवल 1/4.9 है।
- मानवता की अंतिम परीक्षा: Mythos निम्न प्रयास मोड में भी अच्छा प्रदर्शन कर रहा है, जिससे एक कोटि की याददाश्त का संकेत मिलता है।
इस मॉडल की क्षमताओं, सुरक्षा विशेषताओं और मूल विशेषताओं के बारे में अधिक जानकारी के लिए, Claude Mythos Preview सिस्टम कार्ड देखें।
हम Claude Mythos Preview को जनता के लिए उपलब्ध कराने की योजना नहीं बना रहे हैं, लेकिन अंतिम लक्ष्य यह है कि उपयोगकर्ता Mythos स्तर के मॉडल को सुरक्षित रूप से बड़े पैमाने पर तैनात कर सकें—न केवल साइबर सुरक्षा के लिए, बल्कि इस तरह के उच्च क्षमता वाले मॉडल द्वारा लाए जाने वाले अन्य अनेक मूल्यों के लिए। इसके लिए, हमें साइबर सुरक्षा (और अन्य) सुरक्षा उपायों के विकास में प्रगति करनी होगी, जो मॉडल के सबसे खतरनाक आउटपुट का पता लगा सकें और उन्हें रोक सकें। हम आगामी Claude Opus मॉडल में नए सुरक्षा उपाय प्रकाशित करने की योजना बना रहे हैं, ताकि हम Mythos Preview के समान जोखिम स्तर के बिना एक मॉडल का उपयोग करके इन उपायों को सुधार और परिष्कृत कर सकें।
Project Glasswing की अगली योजना
Today's launch is the beginning of a long-term effort. Success requires broad participation from within and outside the technology industry.
Project Glasswing के साझेदार Claude Mythos Preview के लिए एक्सेस प्राप्त करेंगे, जिसका उपयोग उनके बेसिक सिस्टम में वल्नरेबिलिटीज और कमजोरियों की पहचान और ठीक करने के लिए किया जाएगा—जो वैश्विक साझा नेटवर्क अटैक सरफेस का एक बड़ा हिस्सा हैं। अपेक्षित कार्य केंद्रित होंगे स्थानीय वल्नरेबिलिटी डिटेक्शन, बाइनरी ब्लैक-बॉक्स टेस्टिंग, एंडपॉइंट सिक्योरिटी और सिस्टम पेनेट्रेशन टेस्टिंग पर।
एंथ्रोपिक द्वारा प्रोजेक्ट ग्लासविंग और अन्य भागीदारों के लिए वादा किए गए 100 मिलियन डॉलर के मॉडल उपयोग की राशि, अनुसंधान पूर्वावलोकन के दौरान बड़ी मात्रा में उपयोग को कवर करेगी। इसके बाद, Claude Mythos Preview को भागीदारों के लिए प्रति मिलियन इनपुट/आउटपुट टोकन 25 डॉलर / 125 डॉलर की दर से उपलब्ध कराया जाएगा (भागीदार Claude API, Amazon Bedrock, Google Cloud Vertex AI और Microsoft Foundry के माध्यम से इस मॉडल तक पहुँच सकते हैं)।
मॉडल उपयोग की सीमा के अलावा, हमने लिनक्स फाउंडेशन के माध्यम से अल्फा-ओमेगा और ओपनएसएसएफ को 2.5 मिलियन डॉलर और एपाचे सॉफ्टवेयर फाउंडेशन को 1.5 मिलियन डॉलर का दान किया है, ताकि ओपन सोर्स सॉफ्टवेयर मेंटेनर्स इस परिवर्तित परिदृश्य का सामना कर सकें (दिलचस्पी रखने वाले मेंटेनर्स Claude for Open Source योजना के माध्यम से पहुंच के लिए आवेदन कर सकते हैं)।
हम इस कार्य को कई महीनों तक विस्तारित रखने और अपने अनुभवों को जितना संभव हो उतना साझा करने का इरादा रखते हैं, ताकि अन्य संगठन इन अनुभवों को अपनी सुरक्षा के लिए लागू कर सकें। साझेदार अपनी स्थिति के अनुसार जानकारी और श्रेष्ठ अभ्यासों को आपस में साझा करेंगे; 90 दिनों के भीतर, Anthropic हमारी खोजों, सुधारित दोषों और सुधारों की सार्वजनिक रिपोर्ट प्रकाशित करेगा। हम शीर्ष सुरक्षा संगठनों के साथ मिलकर AI युग में सुरक्षा अभ्यासों के विकास पर व्यावहारिक सुझाव तैयार करेंगे, जिसमें शामिल हो सकते हैं: दोष प्रकटीकरण प्रक्रिया, सॉफ़्टवेयर अपडेट प्रक्रिया, ओपन सोर्स और सप्लाई चेन सुरक्षा, सॉफ़्टवेयर विकास जीवनचक्र और सुरक्षा डिज़ाइन अभ्यास, नियमित उद्योग मानक, ट्रिज़िंग स्केलिंग और स्वचालन, और पैच स्वचालन।
Anthropic ने अभी तक अमेरिकी सरकारी अधिकारियों के साथ Claude Mythos Preview की साइबर सुरक्षा हमले और रक्षा क्षमताओं पर चर्चा की है। महत्वपूर्ण बुनियादी ढांचे की सुरक्षा लोकतांत्रिक देशों के लिए प्राथमिक राष्ट्रीय सुरक्षा प्राथमिकता है—इन साइबर सुरक्षा क्षमताओं के उभार से यह फिर से साबित होता है कि अमेरिका और उसके सहयोगी AI प्रौद्योगिकी पर निर्णायक अग्रणी बने रहने के लिए आवश्यक हैं। सरकार का AI मॉडल से संबंधित राष्ट्रीय सुरक्षा जोखिमों के मूल्यांकन और उन्हें कम करने में अनिवार्य भूमिका है। हम इन कार्यों को पूरा करने में सहायता के लिए सभी स्तरों पर सरकारी प्रतिनिधियों के साथ सहयोग करने को तैयार हैं।
हम चाहते हैं कि प्रोजेक्ट ग्लासविंग एक बड़े पैमाने पर प्रयास को जन्म दे, जिसमें उद्योग और सार्वजनिक क्षेत्र शामिल हों, ताकि शक्तिशाली मॉडलों के सुरक्षा प्रभावों के सबसे बड़े मुद्दों का सामना किया जा सके। हम अन्य AI उद्योग सदस्यों को आमंत्रित करते हैं कि वे उद्योग मानकों के निर्माण में मदद करें। मध्यम अवधि में, एक स्वतंत्र तीसरे पक्ष की संस्था—जो निजी और सार्वजनिक क्षेत्र के संगठनों को एकत्रित कर सके—इन बड़े पैमाने पर साइबर सुरक्षा परियोजनाओं के भविष्य के कार्यों के लिए एक आदर्श मंच हो सकती है।
नोट
- इस प्रोजेक्ट का नाम कांच के पंखों वाले तितली (Greta oto) से रखा गया है। इस रूपक के दो अर्थ हैं: तितली के पारदर्शी पंख इसे अदृश्य बना देते हैं, जिसका अर्थ है कि यह लेख में चर्चा किए गए कोड में छिपे दुर्बलताओं की तरह है; पारदर्शी पंख इसे क्षति से बचने में मदद करते हैं, जिसकी तरह हम पारदर्शी दृष्टिकोण का समर्थन करते हैं।
- Mythos शब्द प्राचीन ग्रीक भाषा से आया है, जिसका अर्थ है 'कथा' या 'कहानी': सभ्यता द्वारा दुनिया को समझने के लिए उपयोग की जाने वाली कहानियों की प्रणाली।
- इन सुरक्षा उपायों से प्रभावित सुरक्षा विशेषज्ञ आगामी साइबर सुरक्षा प्रमाणीकरण कार्यक्रम (Cyber Verification Program) के लिए आवेदन कर सकते हैं।
