एंथ्रोपिक दावा करता है कि एआई स्व-सुधार का मार्ग स्पष्ट हो रहा है, जिससे आईपीओ नैरेटिव बहस शुरू हो गई है

लेख | अक्षर AI

एंथ्रोपिक ने कल रात एक लंबा लेख प्रकाशित किया, जिसका शीर्षक है "When AI builds itself" (जब AI खुद को बनाता है), जो ऐसा लगता है जैसे एसिमोव की कोई विज्ञान कथा हो, और विषय भी वास्तव में एक बहुत ही विज्ञान कथात्मक अवधारणा है: recursive self-improvement (आनुपातिक स्व-सुधार)।

Claude

सरल शब्दों में, पिछले समय तक मानव शोधकर्ता लोग कोड लिखते, प्रयोग करते, मॉडल को प्रशिक्षित करते और फिर AI को अधिक शक्तिशाली बनाते। लेकिन अगर AI अपने अगले संस्करण के डिज़ाइन, प्रशिक्षण, परीक्षण और अनुकूलन में स्वयं शामिल होने लगे, तो AI की प्रगति की गति केवल मानव द्वारा ही नहीं, बल्कि AI के “स्व-विकास” द्वारा भी हो सकती है।

इसके लिए, Anthropic ने आह्वान किया:

We believe it would be greatly beneficial for the world if it could choose to slow down or temporarily halt the development of frontier AI, allowing societal structures and alignment research to catch up with technological progress.

यह वाक्य सुरक्षा चेतावनी की तरह लगता है, लेकिन Anthropic के IPO की तैयारी के समय पर, इसे Claude इतना उपयोगी हो गया है कि यह स्वयं अगली पीढ़ी का Claude बना रहा है, इस तरह की एक और कहानी की तैयारी के रूप में भी देखा जा सकता है।

एक नया तूफान आ चुका है

AI के अपने विकास में बढ़ती हुई भागीदारी को समझाने के लिए, Anthropic ने कई आंतरिक डेटा प्रस्तुत किए।

उदाहरण के लिए, 2026 मई तक, Anthropic द्वारा कोडबेस में एकीकृत कोड का अधिकांश 80% Claude द्वारा लिखा गया था। Claude Code के लॉन्च से पहले, यह संख्या केवल एक अंक थी।

2026 द्वितीय तिमाही तक, एंथ्रोपिक के आंकड़ों के अनुसार, इंजीनियर्स द्वारा दैनिक मर्ज किए गए कोड की मात्रा 2024 की तुलना में लगभग 8 गुना बढ़ गई है।

Claude

कोड की मात्रा से अधिक महत्वपूर्ण बात यह है कि क्लॉड अधिक खुले इंजीनियरिंग समस्याओं को सुलझा रहा है।

Anthropic ने लिखा है कि पिछले वर्ष में कर्मचारियों द्वारा Claude को सुधारने, Claude को सही दिशा में लाने या कार्य को मध्य में संभालने की आवृत्ति लगातार कम हो रही है। यह परिवर्तन केवल सरल कार्यों पर ही नहीं, बल्कि सबसे जटिल खुले कार्यों पर भी हुआ है।

खुले कार्य का अर्थ है बिना स्पष्ट निर्देशों वाली समस्याएँ। उदाहरण के लिए, सिस्टम क्रैश हो जाना या ट्रेनिंग कार्य रुक जाना, जिसमें इंजीनियर शुरू में ही नहीं जानते कि उत्तर कैसा होगा, और उन्हें जांच करते हुए निर्णय लेना पड़ता है।

इस प्रकार के कार्यों पर पहले अधिकतर मानव अनुभव पर निर्भर किया जाता था, लेकिन सबसे अधिक खुले कार्यों में, क्लॉड की सफलता की दर 2026 मई तक 76% हो गई, जो छह महीनों में 50 प्रतिशत बढ़ गई।

Claude

केवल कोड लिखने के अलावा, Anthropic Claude का उपयोग कोड समीक्षा के लिए भी करता है, जिसमें बग, सुरक्षा विरूपताएँ और अन्य दोषों की जांच की जाती है। उन्होंने पीछे की विश्लेषण किया कि अगर पिछली हर कोड संशोधन को Claude द्वारा स्वचालित रूप से समीक्षा की जाती, तो claude.ai पर हुए लगभग एक-तिहाई बग्स को लाइव होने से पहले रोका जा सकता था।

और आगे, क्लॉड अब अनुसंधान प्रक्रिया में शामिल हो चुका है।

एंथ्रोपिक के पास एक निश्चित परीक्षण है: क्लॉड को एक छोटे मॉडल के प्रशिक्षण के लिए कोड दिया जाता है, और उसे बिना त्रुटि के परिणाम बदले, कोड को तेज़ चलाने का तरीका ढूंढना होता है। मई 2025 में, क्लॉड ओपस 4 लगभग 3 गुना तेज़ी ला सकता था; अप्रैल 2026 तक, क्लॉड मिथोस प्रीव्यू ने इस संख्या को लगभग 52 गुना तक पहुंचा दिया।

एंथ्रोपिक ने एक खुला AI सुरक्षा अनुसंधान मामला भी उल्लेख किया। उन्होंने क्लॉड द्वारा संचालित एजेंट को एक प्रश्न दिया: क्या एक कमजोर मॉडल एक अधिक शक्तिशाली मॉडल की विश्वसनीय निगरानी कर सकता है?

इस प्रक्रिया में परिकल्पनाएँ बनानी, परिकल्पनाओं का परीक्षण करना, और समानांतर एजेंटों के साथ खोजों को साझा करना शामिल है, जिसे बार-बार दोहराया जाता है।

दो मानव शोधकर्ताओं ने एक सप्ताह बिताकर लगभग 23% के अंतर को पूरा किया; जबकि क्लॉड ने लगभग 800 घंटे और लगभग 18,000 डॉलर की कैलकुलेशन लागत के साथ 97% को पूरा किया।

इस परिणाम की अवश्य सीमाएँ हैं, लेकिन प्रश्न मानव द्वारा चुने गए हैं, मूल्यांकन मापदंड भी मानव द्वारा निर्धारित किए गए हैं, और परिणाम पूरी तरह से उत्पादन स्तर के मॉडल पर स्थानांतरित नहीं हुए हैं। फिर भी, यह दर्शाता है कि Claude एक मानव द्वारा सेट किए गए दिशा-निर्देश वाले अनुसंधान ढांचे में, स्वयं प्रयोग डिज़ाइन कर सकता है, स्वयं निष्पादित कर सकता है, और स्वयं इटरेट कर सकता है।

इसके अलावा, मानव शोधकर्ता गलत रास्ते पर चले जाने पर, क्लॉड बेहतर अगला कदम निर्धारित कर सकता है।

Anthropic ने 129 आंतरिक Claude Code अनुसंधान सत्रों को चुना, जिनमें मानव शोधकर्ता और Claude ने खुले अनुसंधान प्रश्नों को हल किया। Anthropic ने कुछ ऐसे बिंदुओं को चुना जहाँ मानव बाद में पाए गए कि वे अपने रास्ते में घूम गए, और फिर इन बिंदुओं से पहले के संदर्भ को विभिन्न संस्करणों के Claude को दिया, ताकि यह अगला कदम क्या होना चाहिए, इसकी सलाह दे सके। फिर एक अन्य Claude judge, जो पूरे सत्र के परिणाम को जानता है, यह निर्णय लेता है कि मॉडल की सलाह और मानव के मूल चयन में से कौन सा बेहतर है।

परिणाम यह दर्शाते हैं कि उन नोड्स पर जहाँ मानव शोधकर्ताओं को बाद में सुधार के लिए दिखाया गया है, क्लॉड अधिक बेहतर अगला कदम प्रस्तावित कर रहा है।

Claude

पिछले समय में, AI मॉडल के प्रगति को मुख्य रूप से मानव शोधकर्ताओं और इंजीनियरों द्वारा आगे बढ़ाया गया। मानव निर्णय लेते थे कि कौन से प्रयोग करें, कोड लिखें, मॉडल को प्रशिक्षित करें और AI के कार्यों को अपग्रेड करें।

अब, इस श्रृंखला के अधिकाधिक पहलू Claude द्वारा संभाले जा रहे हैं।

Anthropic ने एक बहुत स्पष्ट चरण तालिका प्रदान की है:

Claude

2021 से 2023 तक, Anthropic सामान्य टेक कंपनियों की तरह ही थी, जहाँ मनुष्य लैपटॉप पर कोड और दस्तावेज लिखते थे।

2023 से 2025 तक, चैटबॉट्स कार्यप्रवाह में प्रवेश करने लगे। इंजीनियर्स ने मॉडल को कोड टुकड़े जनरेट करने के लिए दिया, और फिर उन्हें एडिटर में कॉपी किया।

2025 से 2026 तक, प्रोग्रामिंग एजेंट्स दिखाई दिए, Claude अब स्वयं कोड लिखने और संशोधित करने में सक्षम हो गया, कभी-कभी पूरी फाइल को स्वतंत्र रूप से पूरा कर लेता है।

आज तक, एजेंट्स खुद कोड चला सकते हैं और घंटों के काम को अन्य एजेंट्स को सौंप सकते हैं।

आगे, एंथ्रोपिक का वास्तविक चिंता का चरण है: बंद लूप।

अगर यह दिन आता है, तो Claude के अगले संस्करण को Claude खुद द्वारा लगातार सुधारा जा सकता है—यही recursive self-improvement, आवर्ती स्व-सुधार है।

एंथ्रोपिक ने लिखा है कि हम अभी उस बिंदु तक नहीं पहुंचे हैं, और आपसी स्व-सुधार अनिवार्य रूप से नहीं होगा। लेकिन यह अभी भी जोर दे रहा है कि उस बिंदु तक पहुंचने का मार्ग अब दिखने लगा है।

इसलिए एंथ्रोपिक लेख के अंत में धीमा होने या रुकने की बात करता है। इसका मतलब यह नहीं है कि अभी सभी AI कंपनियाँ तुरंत काम बंद कर दें, बल्कि यह है कि अगर भविष्य में AI की स्वयं सुधार करने का खतरा बढ़ता रहा, तो अग्रणी प्रयोगशालाओं को एक समन्वित, सत्यापित धीमा होने की प्रक्रिया की आवश्यकता होगी।

दूसरे शब्दों में, "विलय" आ रहा है, और मानवता को इसे नियंत्रित करना होगा।

अवरोध नहीं हो सकने वाला Claude

सतही रूप से देखने पर, यह एक बहुत ही भविष्यदृष्टिपूर्ण सुरक्षा दस्तावेज़ है। एंथ्रोपिक आवर्ती स्व-सुधार, AI के अपने आप को तेजी से सुधारने की संभावना और मानव समाज को धीमा और रोकने के तंत्र की पहले से तैयारी करने की आवश्यकता पर बात कर रहा है।

लेकिन एंथ्रोपिक द्वारा आईपीओ की तैयारी के समय पर, इस लेख का एक अलग अर्थ हो जाता है।

किसी अर्थ में, A फैक्ट्री की हालिया गतिविधियाँ कक्षा के उस अच्छे छात्र जैसी हैं जो बहुत झूठा है—यह वास्तव में क्षमता रखता है, लेकिन वास्तव में बहुत नाटकीय भी है।

यह केवल “हमारे पास एक मजबूत Claude है” कहना नहीं चाहता, बल्कि इसका मतलब है “Claude हमारी मदद से एक और मजबूत Claude बना रहा है”。

अगर Anthropic केवल एक मॉडल या एक टूल बेचता है, तो यह क्षैतिज तुलना से पूरी तरह बाहर नहीं निकल सकता: Anthropic के पास Claude है, OpenAI के पास GPT है; Anthropic के पास Claude Code है, OpenAI के पास Codex है; Anthropic उद्यमगत ग्राहकों को अपनी ओर आकर्षित करता है, OpenAI भी उद्यमगत ग्राहकों को अपनी ओर आकर्षित करता है। दोनों कंपनियों के बीच प्रतिस्पर्धा बहुत तीव्र है, और यह देखा जाएगा कि कौन बाजार को अधिक बड़ी कहानी सुना सकता है।

ध्यान दें कि, ठीक 3 दिन पहले, OpenAI ने एक आगे की AI शासन पर दस्तावेज़ में लिखा था:

हमने आज के सिस्टम में रिकर्सिव सेल्फ-इम्प्रूवमेंट के प्रारंभिक संकेत भी देखे हैं: AI का विकास स्वयं AI द्वारा त्वरित हो रहा है।

यह विकासकर्ताओं और राष्ट्रों के बीच प्रतिस्पर्धा के दबाव को बढ़ाएगा और वर्तमान संस्थानों के लिए असहनीय शासन की चुनौतियाँ उत्पन्न करेगा।

3 दिन बाद, एंथ्रोपिक ने कहा: क्लॉड के लिए आवर्ती स्व-सुधार का मार्ग अब दिखने लगा है।

Claude

अगर क्लॉड वैसे ही विकसित होता है जैसा यह आशा करता है, तो यह सामान्य उत्पाद कहानी नहीं होगी, यह एक अनुसंधान और विकास फ्लायव्हील बन जाएगा।

क्लॉड कोड लिखता है, प्रयोग चलाता है, प्रशिक्षण प्रक्रिया को अनुकूलित करता है, और फिर एंथ्रोपिक के अपने उत्पादों में दुर्घटनाओं को कम करता है... जैसे ही यह प्रणाली चलने लगती है, क्लॉड केवल एंथ्रोपिक का एक उत्पाद नहीं रहता, बल्कि एंथ्रोपिक का एक महत्वपूर्ण उत्पादन उपकरण भी बन जाता है।

उपयोगकर्ता Claude नामक उत्पाद को देखते हैं, जबकि व्यावसायिक ग्राहक Claude की क्षमताएँ खरीदते हैं, लेकिन Anthropic वास्तव में बाजार के निवेशकों का ध्यान इस बात पर आकर्षित करना चाहता है कि Claude को अग्रणी मॉडल विकास की नींव की प्रक्रिया में एम्बेड कर दिया गया है, और इसे Anthropic के इंजन कमरे में रख दिया गया है।

बाजार को सबसे अधिक फ्लाइव्हील कहानियाँ पसंद हैं, जैसे एक जादुई भंडार जो धन का बहाव करता है: मजबूत Claude Anthropic के इंजीनियर्स को अधिक कोड मर्ज करने में सक्षम बनाता है, अधिक कोड से उत्पाद और बुनियादी ढांचा तेजी से अपडेट होता है, तेज़ अपडेट से शोधकर्ता अधिक प्रयोग कर सकते हैं, और अधिक प्रयोग वापस अगली पीढ़ी के Claude को मजबूत बनाने में मदद करते हैं। जब अगली पीढ़ी का Claude मजबूत हो जाता है, तो यह Anthropic के अनुसंधान को फिर से तेज़ करता है।

क्लॉड की इटरेशन रेट भी इस फ्लायव्हील को समर्थन दे रही है। सार्वजनिक लॉन्च के आधार पर, 2023 से 2025 की शुरुआत तक, क्लॉड के मुख्य मॉडल अपडेट आमतौर पर तीन या चार महीने के अंतराल पर हुए, लेकिन क्लॉड 4 के बाद, एंथ्रोपिक के मॉडल अपडेट स्पष्ट रूप से अधिक घने हो गए हैं।

Claude 4 का अप्रैल 2025 में लॉन्च हुआ, Opus 4.1 का अगस्त में, Sonnet 4.5 का सितंबर में, Haiku 4.5 का अक्टूबर में और Opus 4.5 का नवंबर में।

2026 तक, Opus 4.6 का लॉन्च 5 फरवरी को हुआ, Sonnet 4.6 का 17 फरवरी को, Opus 4.7 का 15 अप्रैल को और Opus 4.8 का 28 मई को। Opus 4.7 से Opus 4.8 तक केवल 42 दिनों का अंतर था।

एंथ्रोपिक सतही रूप से कह रहा है कि "यह बात खतरनाक हो सकती है, हमें ब्रेक तैयार रखना चाहिए," लेकिन यह एक साथ यह भी संकेत दे रहा है कि "हमने पहले ही देख लिया है कि जब गैस दबाई जाती है, तो क्या होता है।"

IPO की कहानी का सूक्ष्मता यही है। यह एक ओर जोखिम को बहुत गंभीर बताता है, और दूसरी ओर अपनी तकनीकी स्थिति को बहुत ऊँचा उठाता है।

सभी AI कंपनियाँ आत्म-पुनरावृत्ति की चर्चा के योग्य नहीं हैं; आपको पहले बाहरी दुनिया को यह विश्वास दिलाना होगा कि आपका AI AI अनुसंधान प्रक्रिया में प्रवेश कर चुका है, तभी आप कह सकते हैं कि इसके लिए वैश्विक समन्वय की आवश्यकता हो सकती है।

OpenAI: ऐसा कैसे हो सकता है?

पहले उल्लेख किया गया था कि एंथ्रोपिक इस लंबे लेख को प्रकाशित करने से ठीक पहले, OpenAI ने आवर्ती स्व-सुधार को मेज पर रख दिया था।

लेकिन दोनों कंपनियों का कहना बहुत अलग है।

OpenAI का पेपर "Democratic Governance of Frontier AI" वाशिंगटन के लिए एक नीतिगत रूपरेखा है, जो यह नहीं सोचती कि "मॉडल कैसे अधिक शक्तिशाली बनें", बल्कि यह सोचती है कि जब अग्रणी AI आगे बढ़ता रहे, तो उसे कैसे सीमित किया जाए।

उस रिपोर्ट में उल्लिखित अधिकांश विषय दोहराने के योग्य नहीं हैं, केवल एक वाक्य महत्वपूर्ण है: OpenAI कहता है कि आज के सिस्टम में पुनरावर्ती स्व-सुधार के प्रारंभिक संकेत दिखाई दे रहे हैं।

यह वाक्य और एंथ्रोपिक का यह लंबा लेख, वास्तव में एक ही दिशा की ओर इशारा करते हैं।

केवल ओपनएआई व्यवस्था के बारे में बात कर रहा है, एंथ्रोपिक अपने बारे में बात कर रहा है।

OpenAI का मतलब है: AI का विकास बहुत तेज़ हो रहा है, और मौजूदा शासन संरचनाएँ इसके साथ चल पाने में असमर्थ हो सकती हैं, इसलिए एक नई नियमावली की आवश्यकता है।

और एंथ्रोपिक ने सीधे उस सिस्टम को दिखाया और बाजार को बताया: क्लॉड हमारे अनुसंधान और विकास प्रक्रिया में शामिल हो चुका है, इसलिए हमने AI के स्वयं के त्वरण के मार्ग को देखा है।

यह बहुत हुनर से किया गया है, मुझे लगता है कि OpenAI के अंदर शायद पहले से ही झगड़ा शुरू हो चुका है—यह तो बिल्कुल विचार की चोरी है! हमने पहले ही किया था!

बस एक मजाक कर रहा हूँ, लेकिन OpenAI को वाकई थोड़ा और प्रयास करना चाहिए, GPT 5.6 जल्दी से लाएं।