एंथ्रोपिक और डीपमाइंड एआई स्व-सुधार त्वरण का संकेत देते हैं

4 मई 2026 को, Anthropic के सह-संस्थापक जैक क्लार्क ने सोशल मीडिया प्लेटफॉर्म X पर एक पोस्ट किया। उनकी मूल बात थी: "मैं अब मानता हूँ कि 2028 के अंत तक आत्म-सुधार की प्रक्रिया के होने की संभावना 60% है।"

पोस्ट डालने के कुछ ही मिनट बाद, AI सुरक्षा क्षेत्र के एक लंबे समय से सक्रिय शोधकर्ता एलिज़ेयर यूडकोव्स्की ने नीचे एक प्रतिक्रिया दी: "तो हम सब मिलकर मर जाएंगे।" उन्होंने तुरंत एक तुलना का उल्लेख किया, जो चेरनोबिल परमाणु रिएक्टर RBMK के डिज़ाइन दोष की ओर इशारा करती है, जिससे यह संकेत मिलता है कि इस सिस्टम को शुरू किया जा रहा है, और किसी को वास्तव में इसे बंद करने का तरीका नहीं पता।

इस बातचीत को कुछ ही सेकंड में पूरा किया गया, जिसने पहले तकनीकी पेपर और आंतरिक मूल्यांकनों में छिपे चर्चाओं को जला दिया। रिकर्सिव सेल्फ-इम्प्रूवमेंट (RSI), जिसमें AI सिस्टम केवल आउटपुट को ही नहीं, बल्कि खुद के सुधार प्रक्रिया को भी स्वतंत्र रूप से अनुकूलित करता है और अंततः अपने से अधिक शक्तिशाली उत्तराधिकारी सिस्टम का निर्माण करता है, यह अवधारणा जो लंबे समय तक सैद्धांतिक किनारे पर रखी गई थी, को Anthropic के सह-संस्थापक ने 2028 के अंत तक 60% संभावना के साथ गिनती में शामिल कर दिया।

एक महीने बाद, एंथ्रोपिक ने एक लंबा लेख जारी किया, जिसका शीर्षक था: "जब AI खुद को बनाता है।" यह लेख मारिना फावारो और जैक क्लार्क द्वारा संयुक्त रूप से लिखा गया था और मार्च में ही स्थापित एंथ्रोपिक इंस्टीट्यूट द्वारा प्रकाशित किया गया था। पहले कभी अनपब्लिश किए गए आंतरिक डेटा के सेट और एक सावधानी से समायोजित कथन संरचना के साथ, एंथ्रोपिक ने बाहरी दुनिया को एक सटीक कैलिब्रेटेड त्वरण संकेत कार्ड प्रस्तुत किया, जिस पर "हम अभी वहां नहीं पहुंचे हैं" और "लेकिन यह अधिकांश संस्थानों की तुलना में तेजी से आ सकता है" दोनों लिखा हुआ है।

उसी महीने, डीपमाइंड के सीईओ डेमिस हैसबिस ने Google I/O के स्टेज पर एक ऐसा शब्द प्रयोग किया जो कभी भी सार्वजनिक रूप से नहीं उपयोग किया गया था: मानवता “अद्वितीयता के पहाड़ी” पर खड़ी है। उन्होंने बाद के साक्षात्कार में सामान्य कृत्रिम बुद्धिमत्ता (AGI) के समयसीमा को “2030 के तुरंत बाद” से बदलकर “2029 एक वास्तविक संभावना है” कर दिया, और स्वीकार किया कि उनके द्वारा नाटकीय भाषा का प्रयोग “जानबूझकर चुनौतीपूर्ण” था, जिसका उद्देश्य सरकारों, अर्थशास्त्रियों और जनता के लिए तत्कालता पैदा करना था।

सुरक्षा पर आधारित और एआई उद्योग में लंबे समय तक नियंत्रण की भूमिका निभाने वाले दो प्रमुख संस्थानों ने लगभग एक ही समय पर अपनी बाहरी आवाज़ की तीव्रता और माप बदल दी। इस समयबिंदु को स्वतंत्र घटना के रूप में देखा जाना चाहिए।

एक सूक्ष्म रूप से समायोजित लंबा लेख

एंथ्रोपिक ने 4 जून को प्रकाशित लंबे लेख की शुरुआत में अपना कथानक लक्ष्य स्पष्ट कर दिया। इसका तर्क केवल एक तकनीकी प्रवृत्ति नहीं, बल्कि एक दिशा और त्वरित प्रक्रिया है। इसके लिए, इसने पहले कभी जारी नहीं किए गए आंतरिक डेटा का सेट प्रस्तुत किया।

चित्र

पहली संख्या एक संरचनात्मक परिवर्तन को दर्शाती है: 2026 में मई तक, Anthropic के कोडबेस में 80% से अधिक मर्ज किए गए कोड को Claude ने लिखा है। दो साल पहले, यह संख्या एक अंक थी। एक ही डेटा यह भी दर्शाता है कि 2026 के दूसरे तिमाही में, Anthropic के एक औसत इंजीनियर द्वारा दिनभर में मर्ज किए गए कोड की मात्रा 2024 की तुलना में 8 गुना थी।

किसी भी ऐसे व्यक्ति की प्रतिक्रिया की कल्पना करें जो AI उद्योग की गहराई का अनुसरण नहीं करता है और ये दो अंक पहली बार पढ़ता है। लेकिन Anthropic खुद टिप्पणी में कई महत्वपूर्ण सीमाओं को स्वीकार करता है: नेतृत्व ने पहले ही अनुमान लगाया था कि स्क्रिप्ट और प्रयोगात्मक कोड को शामिल करने पर, Claude द्वारा लिखा गया कोड 90% से अधिक है, जबकि 80% एक अधिक सावधानी से लिया गया संयुक्त कोड सांख्यिकी है; कोड पंक्तियों की संख्या "अपूर्ण माप" है, जो वास्तविक उत्पादकता में वृद्धि को अधिक माप सकती है; कोड का स्रोत निर्धारण प्रक्रिया स्वयं "अंतराल" रखती है।

इन टिप्पणियों का लेखन स्वयं विश्लेषण के योग्य है। उनका अस्तित्व सत्यता के लिए दिखाई देने वाली छूट है, लेकिन वास्तव में यह इस बात का प्रभाव डालता है कि मुख्य पाठ में दिए गए आंकड़े सावधानी से स्व-फिल्टर किए गए हैं, जिससे उनकी विश्वसनीयता बढ़ जाती है। यह एक कथन इंजीनियरिंग की दोहरी संरचना है: मुख्य पाठ में संकेत, टिप्पणियों में अपवाद।

दूसरा अंक गति से संबंधित है। कोड अनुकूलन कार्यों पर, क्लॉड ओपस 4 ने मई 2025 तक लगभग 3 गुना तेजी लाई, जबकि मानव अनुभवी शोधकर्ता को इस स्तर तक पहुँचने में 4 से 8 घंटे लगते हैं। अप्रैल 2026 तक, क्लॉड माइथोस प्रीव्यू ने इस संख्या को लगभग 52 गुना तक पहुँचा दिया। AI द्वारा स्वतंत्र रूप से कार्य पूरा किए जाने की अधिकतम अवधि 2024 मार्च में 4 मिनट से शुरू हुई, जो प्रति 4 महीने में दोगुनी होती रही और 2026 मार्च तक 12 घंटे हो गई। 4 महीने में दोगुना होने की इस गति से ही एक ऐसा स्मरणीय बिंदु बनता है, जो ज्यामितीय प्रगति की कल्पना के साथ आसानी से प्रसारित हो सकता है।

चित्र

एक अन्य सेट डेटा 2026 मार्च में 130 Anthropic रिसर्च टीम सदस्यों के एक आंतरिक सर्वेक्षण से आया। मध्यिका प्रतिभागी ने अनुमान लगाया कि Mythos Preview का उपयोग करने से उत्पादन लगभग AI के उपयोग के बिना की तुलना में 4 गुना हो जाता है। पादटिप्पणी में फिर से उल्लेख किया गया है कि METR के पिछले स्वतंत्र अध्ययनों ने यह दर्शाया है कि डेवलपर्स द्वारा AI की उत्पादकता में वृद्धि का अनुमान समग्र रूप से अधिक हो सकता है। यही दोहरी संरचना फिर से दिखाई देती है।

तीसरा अंक यह दर्शाता है कि AI मानव शोधकर्ताओं की निर्णय लेने की क्षमता की सीमा को पार कर रहा है। नवंबर 2025 में, Claude Opus 4.5 शोध दिशा चुनने में 51% मामलों में मानव शोधकर्ताओं के चयन से बेहतर रहा। अप्रैल 2026 तक, यह संख्या बढ़कर 64% हो गई। 129 मामलों के नमूने में, Anthropic ने पादटिप्पणी में स्पष्ट किया है कि ये मामले मानव द्वारा जानबूझकर चुने गए थे, जहाँ मानव चयन में सुधार की संभावना थी।

किसी भी एक संख्या को अलग करके विभिन्न व्याख्या के ढांचों में रखा जा सकता है। लेकिन एक साथ रखने पर, दिशा एक समान है: गति बढ़ रही है, अंतर संकुचित हो रहा है, और यह सब Anthropic के अपने कोडबेस और प्रयोगशालाओं के भीतर हो रहा है, किसी बाहरी बेंचमार्क पर सैद्धांतिक निष्कर्ष नहीं।

लंबे लेख में इन डेटा को सूचीबद्ध करने के बाद, तीन भविष्य के परिदृश्य प्रस्तुत किए गए।

पहला तरीका ट्रेंड का स्थिर होना है, जिससे S-वक्र के प्लेटो की ओर जाना है। एंथ्रोपिक का कहना है, "हम इसकी संभावना पर विश्वास नहीं करते।"

दूसरा जटिल दक्षता वृद्धि है, जहां AI अधिक व्यापक अनुसंधान और विकास चरणों में मानव की जगह लेता रहता है, लेकिन मानव अभी भी दिशा निर्धारित करते हैं और सफलता के मानदंड परिभाषित करते हैं। Anthropic ने इसे "साक्ष्य जो दर्शाता है कि हम संभवतः इस परिदृश्य की ओर बढ़ रहे हैं" के रूप में मूल्यांकन किया है।

तीसरा पूर्ण रूप से पुनरावर्ती स्व-सुधार है, जिसमें AI स्वयं अपेक्षाकृत अधिक शक्तिशाली उत्तराधिकारी प्रणालियों का डिज़ाइन, प्रशिक्षण और तैनाती करता है, और मानव चक्र से बाहर हो जाते हैं। इसे "संभव" के रूप में व्यक्त किया गया है।

इन तीन स्थितियों का क्रम और टोन एक पूर्ण कथात्मक आरोह का निर्माण करता है। पहली को हल्के ढंग से प्रस्तुत किया गया है, जो संदेहवादियों को समेटने का काम करता है; दूसरी को "साक्ष्य" पर आधारित किया गया है, जो लेख को तार्किक आवरण प्रदान करती है; तीसरी, "संभव है" और "अगर तकनीकी प्रवृत्ति जारी रही" के साथ, सबसे आक्रामक मान्यता को पाठक की कल्पना के किनारे तक पहुँचाती है, बिना उसके सबूत प्रस्तुत करने की जिम्मेदारी लिए।

चित्र

लेख के सबसे केंद्रीय बिंदु पर, एंथ्रोपिक का दृष्टिकोण एक वाक्य में संक्षिप्त किया गया है: "हम अभी तक वहां नहीं पहुंचे हैं, और आत्म-सुधार का पुनरावृत्ति चक्र अनिवार्य नहीं है। लेकिन यह अधिकांश संस्थानों की तुलना में तेजी से आ सकता है।"

"वो सस्पेंड करने की इच्छा" से "अकेले सस्पेंड करने से बस लापरवाह लोग पीछे छूट जाएंगे"

अगर 4 जून का लंबा लेख एक सावधानी से तैयार किए गए फोटो की तरह है, तो इस फोटो को समय रेखा में रखने से आप एक लंबी गति देख सकते हैं।

2023 में, Anthropic ने जिम्मेदार विस्तार नीति (RSP) जारी की। इस नीति दस्तावेज का केंद्रीय प्रतिबद्धता है: यदि मॉडल की क्षमता कंपनी की सुरक्षा नियंत्रण क्षमता से अधिक हो जाती है, तो कंपनी अधिक शक्तिशाली मॉडल के प्रशिक्षण को स्थगित कर देगी। यह केवल एक मौखिक घोषणा नहीं है, बल्कि एक मूल्यांकन ढांचे और ट्रिगर कंडीशन्स के साथ एक आंतरिक शासन दस्तावेज है। इस दस्तावेज को AI सुरक्षा समुदाय द्वारा "स्वैच्छिक नियामक" का एक कार्यान्वयन नमूना माना जाता रहा।

2024 में, सीईओ डैरियो अमोडेई ने एक व्यापक रूप से वायरल लेख प्रकाशित किया, जिसमें 2027 तक "शक्तिशाली AI" के आने की संभावना का प्रस्ताव रखा गया। उस समय, Anthropic अभी भी सुरक्षा-केंद्रित और स्वतंत्र दृष्टिकोण अपनाए हुए था, और बड़े पैमाने पर विस्तार और त्वरित कहानी के प्रति एक संयमित मुख बनाए हुए था।

26 जनवरी, 2026 को, एमोडेई ने अपनी व्यक्तिगत वेबसाइट पर 38 पृष्ठों का लेख "The Adolescence of Technology" प्रकाशित किया। इसमें उन्होंने एक ऐसा कथन लिखा जिसे बाद में बार-बार संदर्भित किया गया: "चूंकि AI अभी Anthropic के अधिकांश कोड को लिख रहा है, यह हमारे अगली पीढ़ी के AI सिस्टम बनाने की प्रगति को महत्वपूर्ण रूप से तेज कर रहा है। यह प्रतिक्रिया चक्र महीनों में ताकत जमा कर रहा है, और वर्तमान पीढ़ी के AI के अगली पीढ़ी के सिस्टम को स्वयं बनाने में केवल 1 से 2 साल का समय बचा हो सकता है।" इसी लेख में, उन्होंने आगामी "शक्तिशाली AI" को "डेटासेंटर में एक प्रतिभाशाली राष्ट्र" के रूप में वर्णित किया।

यह लगभग एंथ्रोपिक द्वारा “स्व-सुधार फीडबैक लूप चल रहा है” के संकेत को व्यवस्थित रूप से जारी करने की शुरुआत है। और इस ब्लॉग पोस्ट का प्रकाशन समय, कंपनी के 3500 अरब डॉलर के मूल्यांकन से उच्चतर मूल्यांकन श्रेणी की ओर बढ़ने के मार्ग पर सटीक रूप से आता है।

एक महीने से कम समय के बाद, मोड़ आ गया।

25 फरवरी, 2026 को, CNN ने रिपोर्ट किया कि Anthropic ने अपनी जिम्मेदार विस्तार नीति में संशोधन किया है, जिसमें "अगर क्षमता सुरक्षा नियंत्रणों की सीमा से आगे निकल जाए तो अधिक शक्तिशाली मॉडल के प्रशिक्षण को रोक दें" का मूल प्रतिबद्धता हटा दिया गया है, और इसके स्थान पर एक गैर-बाध्यकारी "फ्रंटियर सुरक्षा रोडमैप" रखा गया है। उसी सप्ताह, अमेरिकी रक्षा मंत्री पीट हेगसेथ ने डैरियो अमोडेई को अंतिम चेतावनी दी: सुरक्षा लाल रेखा हटाएं, या 200 मिलियन डॉलर के रक्षा विभाग के अनुबंध को खो दें।

रिपोर्ट ने एंथ्रोपिक के मुख्य वैज्ञानिक अधिकारी जैरेड कैप्लैन का टाइम्स मैगजीन को दिया गया जवाब उद्धृत किया: "हम मानते हैं कि मॉडल के प्रशिक्षण को रोकना वास्तव में किसी के लिए भी मददगार नहीं है... अगर प्रतिद्वंद्वी पूरी तेजी से आगे बढ़ रहे हैं।" इस जवाब में प्रयुक्त शब्दों का बहुत ध्यान से अध्ययन किया जाना चाहिए। "किसी के लिए भी मददगार नहीं" एक तकनीकी तर्क नहीं है, बल्कि हितधारकों के खेल का एक बयान है। "अगर प्रतिद्वंद्वी पूरी तेजी से आगे बढ़ रहे हैं" का संदेश संरचनात्मक रूप से "एकतरफा स्थगन केवल सबसे कम सावधान प्रतिभागियों को पीछे से पार करने देगा" के समान है: यह मूल रूप से अपनी सुरक्षा क्षमता के संदर्भ में स्थगन के तर्क को, प्रतिद्वंद्वी की क्रिया के संदर्भ में गति के तर्क से प्रतिस्थापित कर देता है।

एंथ्रोपिक ने सीएनएन की रिपोर्ट में अभी भी दो लाल रेखाओं को बनाए रखने पर जोर दिया है: एआई सिस्टम का उपयोग हथियार प्रणालीयों के नियंत्रण के लिए नहीं, और व्यापक आंतरिक निगरानी के लिए नहीं। यह महत्वपूर्ण है क्योंकि यह दर्शाता है कि एंथ्रोपिक पूरी तरह से सुरक्षा स्थिति को छोड़ रहा नहीं है, बल्कि विभिन्न सुरक्षा पहलुओं पर चयनात्मक रूप से समझौता कर रहा है और कुछ को बनाए रख रहा है। लेकिन इस चयनात्मकता के स्वभाव को ही साक्ष्य विश्लेषण में एक मुख्य संकेत के रूप में देखा जाता है: यह किन पहलुओं पर समझौता कर रहा है, किन पहलुओं पर स्थिर है—यह सीमा सुरक्षा के पुनः-समायोजन के मापदंड को प्रदर्शित करती है।

11 मार्च को, एंथ्रोपिक इंस्टीट्यूट की स्थापना जैक क्लार्क के नेतृत्व में "सार्वजनिक हित अनुसंधान संस्थान" के रूप में की गई। दो महीने से कम के समय के बाद, 4 मई को, क्लार्क ने उस "60%" पोस्ट को जारी किया।

जब इस समय श्रृंखला को एक साथ रखा जाता है, तो सिग्नल घनत्व और रिलीज की गति कोई यादृच्छिक नहीं है। जनवरी में व्यक्तिगत लेख की घोषणा से लेकर फरवरी में नीति संशोधन, मार्च में संस्थान की स्थापना, मई में संस्थापक की संभावना का अनुमान, और फिर जून में आधिकारिक लंबे लेख के प्रकाशन तक, यह एक स्पष्ट गति और क्रमिक रूप से बढ़ते शब्दों की कहानी है। इससे सीधे यह निष्कर्ष नहीं निकाला जा सकता कि "यह सब पहले से योजनाबद्ध था", लेकिन इस अनुक्रम ने एक विश्लेषक के सामने एक प्रश्न प्रस्तुत किया है: क्या इस गति से यह संकेत मिलता है कि Anthropic ने "त्वरित कहानी" को अपने सार्वजनिक संचार प्रबंधन के क्षेत्र में शामिल कर लिया है?

हासबिस की जानबूझकर चुनौती

यदि 2026 की पहली छमाही में केवल Anthropic ही अपनी दृष्टिकोण में बदलाव कर रही थी, तो विश्लेषकों के पास कंपनी के आंतरिक निर्णय तर्क पर ध्यान केंद्रित करने का पर्याप्त कारण होता। लेकिन DeepMind के CEO Demis Hassabis ने लगभग समान समय पर समान दिशा में बदलाव किया, जिससे "एकल कंपनी का मामला" का तर्क अस्वीकार्य हो गया।

20 जनवरी, दावोस फोरम। हस्साबिस अपने कई वर्षों के अनुमान को बरकरार रखते हैं: 2030 तक AGI के आने की संभावना 50% है। 3 सप्ताह बाद, 18 फरवरी को, भारतीय AI प्रभाव शिखर सम्मेलन में, उन्होंने कहा: "AGI पांच वर्षों के भीतर आ सकता है।"

20 मई से 22 मई तक, Google I/O। हस्साबिस ने प्रमुख सम्मेलन में कहा कि मानवता "अद्वितीयता के पहाड़ी तल पर" खड़ी है। इसी अवधि में, OpenAI ने GPT-5.3-Codex जारी किया, जिसमें दावा किया गया कि यह मॉडल "अपने निर्माण में महत्वपूर्ण भूमिका निभा रहा है", जिसमें प्रशिक्षण प्रक्रिया की त्रुटियों को ठीक करने, डिप्लॉयमेंट का प्रबंधन करने और मूल्यांकन परिणामों का विश्लेषण करना शामिल है। इस समय सीमा के दौरान तीन प्रमुख प्रयोगशालाओं के बीच का अंतर सप्ताहों में समायोजित हो गया है।

Google I/O के बाद, हस्साबिस ने एक्सियस के साथ साक्षात्कार दिया। इस साक्षात्कार को बाद में बहुत सारे स्रोतों द्वारा संदर्भित किया गया, जिसमें सबसे महत्वपूर्ण वाक्य यह था कि उन्होंने "सिंगुलैरिटी के तल" जैसे शब्दों का उपयोग "जानबूझकर चुनौतीपूर्ण" माना, जिसका उद्देश्य सरकारों, अर्थशास्त्रियों और जनता को AI के तेजी से विकास की आपातकालीन प्रासंगिकता के प्रति जागरूक करना था। उन्होंने AGI की समयरेखा को पहले के "2030 के बाद जल्द ही" से बदलकर "2029 एक वास्तविक संभावना है" कर दिया, हालाँकि 2030, एक वर्ष के अंतर के साथ, अभी भी व्यापक रूप से अपेक्षित है।

हस्साबिस ने सीएलई को और सीधे कहा: "पांच से दस साल बाद, जब हम 2026 और 2027 की वापसी करेंगे, तो हम कहेंगे कि 'वही हमारा AGI युग में प्रवेश का क्षण था।'"

“意圖挑釁”這個詞值得反覆思量。它是一種罕見的、由當事人親口說出的對敘事意圖的坦白。它承認，他所使用的至少一部分措辭，並非對技術事實的被動反映，而是主動選擇的傳播工具。這份坦白本身並未否認他可能確實看到了技術拐點，但它明確地將“敘事”從“事實”的陰影中拉了出來，使其成為一個可以單獨審視的客體。

हस्साबिस ने अपने शब्दों की अपनी ही व्याख्या करके इस सिग्नल सिंक्रोनाइजेशन की व्याख्या के लिए एक दरवाजा खोल दिया। उनका “जानबूझकर चुनौतीपूर्ण” और Anthropic के लंबे डेटा तर्क में “टिप्पणी के साथ छूट” एक ही द्विपादी मुद्रा को दर्शाते हैं: एक हाथ से वे ऐसा सिग्नल भेजते हैं जो सार्वजनिक राय को हिला सकता है, और दूसरे हाथ से “यह केवल एक संभावना है” में पीछे हटने का सुरक्षित स्थान बनाए रखते हैं।

एक ही डेटा सेट, पूरी तरह से अलग व्याख्या

जब एंथ्रोपिक और डीपमाइंड एक "AI स्वयं के विकास को तेज कर रहा है" की कहानी को बना रहे हैं, तो बाहरी स्वतंत्र शोधकर्ता उसी सेट के डेटा और घटनाओं की वैकल्पिक व्याख्या प्रस्तुत करते हैं। ये व्याख्याएँ इसलिए महत्वपूर्ण हैं क्योंकि इनसे पता चलता है कि आधिकारिक कहानी की व्याख्या की सीमा कितनी व्यापक है, न कि इसलिए कि कोई एक पक्ष अंतिम सत्य के पास है।

सबसे तीव्र प्रतिक्रिया एलिज़र यूडकोव्स्की से आई। उन्होंने न केवल जैक क्लार्क को जवाब दिया, बल्कि बाद में कई अवसरों पर लगातार अपनी बात रखी। माइंडस्टूडियो के ब्लॉग ने उनकी पूरी रुख को दर्ज किया: उन्होंने वर्तमान AI प्रणालियों के सुरक्षा डिज़ाइन की तुलना चेरनोबिल RBMK रिएक्टर से की। इस तुलना का मुख्य तर्क यह है कि यदि नियंत्रण बार और तेज़ी का एक ही प्रणाली में बंधा हो, तो जब आप धीमा होने की कोशिश करते हैं, तो प्रणाली वास्तव में और तेज़ी से अनियंत्रित हो जाती है।

एलन इंस्टीट्यूट फॉर एआई के नाथन लैम्बर्ट ने "लॉसी सेल्फ-इम्प्रूवमेंट" (Lossy Self-Improvement, LSI) की अवधारणा प्रस्तुत की है। उनका तर्क "एक्सेलरेटिंग फ्लाईव्हील" मॉडल की सीधी चुनौती है: जब प्रणाली अधिक जटिल होती जाती है, तो प्रत्येक पीढ़ी की सुधार प्रक्रिया में घर्षण और क्षय होता है, जैसे कि संकेत लंबी दूरी के प्रसारण में कमजोर हो जाता है। इस तर्क के अनुसार, जो सुधार 80% या 90% कोड को AI द्वारा लिखने में सक्षम बनाते हैं, वे अगली पीढ़ी की प्रणाली पर असीमित रूप से पुनर्निर्मित नहीं किए जा सकते, क्योंकि अगली पीढ़ी को अधिक जटिल समस्या स्थान का सामना करना पड़ता है, और AI के स्वयं के उत्पादन में शोर और त्रुटियाँ पीढ़ी-दर-पीढ़ी प्रसारित होकर बढ़ जाती हैं।

अमेरिकी नवाचार के लिए फाउंडेशन के सीनियर रिसर्चर डीन बॉल ने एंथ्रोपिक के डेटा को डाइमेंशनली रिड्यूस करने के लिए एक सीधा भाषाई ढांचा प्रस्तुत किया। उन्होंने IEEE Spectrum को बताया: "शायद अंततः वे प्रतिभा को स्वचालित कर देंगे, लेकिन अगले साल नहीं। अगले साल वे मजदूरी को स्वचालित करेंगे।" यह भेदभाव "80% कोड AI द्वारा लिखा गया है" की मूल अस्पष्टता को सटीक रूप से छूता है। यदि AI कोडबेस के स्थिर पैटर्न, पैरामीटर के बैच जेनरेशन, और एंड-टू-एंड पाइपलाइन कॉन्फ़िगरेशन जैसे कार्यों को स्वचालित करता है, तो सॉफ्टवेयर इंजीनियरिंग के संदर्भ में ये केवल "मजदूरी" के समकक्ष हैं। शेष 20% में, संरचना डिज़ाइन, दिशा निर्धारण, और अपूर्ण जानकारी पर आधारित संतुलन जैसे कार्य हो सकते हैं, जो ही प्रतिभा का हिस्सा हैं।

मॉन्ट्रियल विश्वविद्यालय के डेविड स्कॉट क्रूगर, जो AI सुरक्षा गैर-लाभकारी संगठन Evitable के संस्थापक हैं, उनका प्रस्तावित रेड लाइन पॉज़ करने का तर्क है "99% कोड AI द्वारा लिखा गया है"। उन्होंने IEEE Spectrum को बताया: "मुझे लगता है कि हम अभी इस रेखा को पार कर रहे हो सकते हैं।" उनका ढांचा और Anthropic द्वारा पहले ही ढीला किया गया पॉज़ करने का प्रतिबद्धता, इस कहानी में सबसे महत्वपूर्ण संरचनात्मक विरोधाभासों में से एक है।

UBC के कंप्यूटर वैज्ञानिक जेफ क्लून ने IEEE Spectrum के साक्षात्कार में दूसरी दिशा में बात की। उन्होंने कहा: "हम आत्म-पुनरावृत्ति प्रणालियों के मोड़ पर हैं।" अगर उनका यह कथन सच साबित होता है, तो इसका मतलब है कि यूडकोव्स्की की चेतावनी सही ताल पर बज रही है।

चार समूहों की आवाजें, जो अलग-अलग दिशाओं में हैं, और यहां तक कि एक ही दिशा में भी उग्रवादी आंतरिक तनाव है। लेकिन उनकी सामान्य बात यह है कि वे किसी भी औपचारिक कथानक पर निर्भर नहीं करते, बल्कि प्रत्येक स्वयं की पद्धति से एक ही सेट की घटनाओं के लिए स्वतंत्र निर्णय लेते हैं। और इन निर्णयों की विविधता और परस्पर टकराव स्वयं, "किसी भी एकल कथानक पर्याप्त है कि यह सभी सत्य को कवर करे" के विचार के लिए सबसे मजबूत प्रतिवाद है।

Valuation curve and narrative beat coupling

जनवरी 2026 में, Anthropic ने फंडिंग पूरी की, जिसका मूल्यांकन 3500 अरब डॉलर था। निवेशकों में माइक्रोसॉफ्ट और न्वीडिया शामिल थे। यह संख्या 2025 के अंत तक कुछ मीडिया द्वारा पहले से ही प्रचारित की जा चुकी थी, लेकिन आधिकारिक घोषणा का समय ठीक Amodei द्वारा The Adolescence of Technology प्रकाशित करने के बाद आया।

फरवरी में, 300 अरब डॉलर की एक और फंडिंग लहर पूरी हुई, जिससे मूल्यांकन लगभग 3500 अरब डॉलर के स्तर पर बना रहा। इसी महीने, सुरक्षा नीति में संशोधन किया गया और निलंबन के प्रतिबद्धता को हटा दिया गया। पेंटागन के 200 मिलियन डॉलर के अनुबंध का खतरा समाप्त हो गया।

मई में, रॉयटर्स, न्यूयॉर्क टाइम्स और टेकक्रंच ने लगभग एक साथ रिपोर्ट किया कि Anthropic ने 650 अरब डॉलर की फंडिंग राउंड पूरी की है, जिससे इसका मूल्यांकन 9650 अरब डॉलर हो गया। यह संख्या न केवल अपने दो महीने पहले के मूल्यांकन से अधिक है, बल्कि OpenAI के मार्च 2026 के 8520 अरब डॉलर के मूल्यांकन को भी पार कर गई है। न्यूयॉर्क टाइम्स ने डैरियो अमोडेई के डेवलपर कॉन्फ्रेंस में कहे गए कथन का हवाला देते हुए कहा कि कंपनी की वार्षिक आय 300 अरब डॉलर है, और उन्होंने मजाक में कहा कि "उम्मीद है कि इस साल 80 गुना की आय वृद्धि आगे नहीं होगी, क्योंकि ऐसा बहुत पागलपन होगा।"

4 जून को, एंथ्रोपिक संस्थान ने "जब AI खुद को बनाता है" शीर्षक की लंबी लेख प्रकाशित की।

इन समय बिंदुओं को एक पंक्ति में रखना यह संकेत नहीं देता कि किसी चार्ट पर सटीक तीर का संकेत है। यदि कोई कहता है कि इन चीजों के बीच कारण-परिणाम का संबंध है, तो उसे सीधे साक्ष्य प्रस्तुत करना चाहिए। आंतरिक निर्णय रिकॉर्ड के बिना, कोई भी विश्लेषक ऐसा दावा नहीं कर सकता और न ही करना चाहिए।

लेकिन दूसरी ओर, इन समय बिंदुओं के बीच के संबंधों को पूरी तरह से नजरअंदाज करना भी असमंजसपूर्ण है। एक कंपनी ने केवल 5 महीनों में 3500 अरब डॉलर के अनुमानित मूल्य से बढ़कर 9650 अरब डॉलर हो गई, जो लगभग तीन गुना की वृद्धि है, इसके साथ ही एक महत्वपूर्ण सुरक्षा नीति में परिवर्तन हुआ, एक स्वतंत्र शोध संस्थान द्वारा प्रमुखता से संचालित “त्वरित संकेत” कथानक का निर्माण किया गया, और इसके सह-संस्थापक ने 60% संभावना का अनुमान लगाया। जब ये सभी घटनाएँ 6 महीनों के भीतर सघन रूप से पूरी होती हैं, तो निवेशकों के पास कम से कम यह पूछने का अधिकार है: क्या ये संकेत, और किस मात्रा में, “हम त्वरण के सीमांत पर हैं” यह संदेश बाजार को पहुँचाने में सहायता करते हैं?

यह अतिरिक्त प्रश्न ही विश्लेषण का मूल्य है। उत्तर सदैव एक से अधिक हो सकते हैं। लेकिन जब प्रश्न स्पष्ट रूप से पूछा जाता है, तो उसे आसानी से वापस नहीं लिया जा सकता।

2026 पहली तिमाही में वैश्विक कृत्रिम बुद्धिमत्ता बाजार में फंडिंग 2970 अरब डॉलर तक पहुँच गई, जिसमें पाँच सबसे बड़े लेन-देन ने इस कुल राशि का एक महत्वपूर्ण हिस्सा अधिग्रहित किया। इस स्तर पर, सभी अग्रणी प्रयोगशालाओं को एक ही दबाव का सामना करना पड़ रहा है: आपको निवेशकों को यह समझाना होगा कि आपका तकनीकी वक्र प्रतिद्वंद्वी की तुलना में अधिक तीव्र होगा। आपकी जोखिम चेतावनियाँ इतनी स्पष्ट होनी चाहिए कि जब नियामक अंततः प्रणाली बनाने के लिए प्रवेश करें, तो आपकी आवाज़ पहले से ही नीति संरचना में समाहित हो। आपकी कथा एक साथ पर्याप्त आकर्षक होनी चाहिए ताकि शीर्ष शोधकर्ता आपकी प्रयोगशाला का चयन करें, और पर्याप्त सतर्कता पैदा करे ताकि सुरक्षा समुदाय में आपके पास अभी भी कुछ प्रभावशीलता बनी रहे।

इन आवश्यकताओं के बीच आंतरिक विरोधाभास है। 2026 की पहली छमाही में Anthropic के वार्तालाप में बदलाव को इन परस्पर विरोधी आवश्यकताओं के भाषाई संतुलन को पुनः कैलिब्रेट करने के रूप में देखा जा सकता है। सुरक्षा के प्रति प्रतिबद्धता का कमजोर होना, त्वरण संकेतों का प्रबल होना, और “हम अकेले रुक नहीं सकते” इस तर्क का बार-बार प्रयोग, एक ही दिशा की ओर इशारा करने वाले सदिशों का एक समूह बनाते हैं।

सिग्नल भेज दिया गया, फिर

सबसे मूल प्रश्न पर वापस आना आवश्यक है: ये संकेत, क्या अधिकतर तकनीकी मोड़ के प्रतिबिंब हैं, या पूंजी और नियामक के लिए एक रूपांतरण का उपयोग?

मौजूदा जनता के सामने उपलब्ध साक्ष्य दो विकल्पों के बीच एक सरल चिह्न लगाने की अनुमति नहीं देते। क्योंकि दोनों व्याख्याओं के लिए उपयोग किए गए साक्ष्य, वास्तव में एक ही सेट के डेटा हैं। 80% कोड का हिस्सा, 52 गुना की त्वरितता, और हर 4 महीने में दोगुना होने वाला कार्य समय, दोनों ही “एक मोड़ आने वाला है” के समर्थन में और “हम बाजार को एक ऐसी प्रवृत्ति की समझ प्रदान कर रहे हैं, जिसे हमारे स्वयं के तकनीकी कर्मचारियों ने व्यक्तिगत रूप से अनुभव किया है” की व्याख्या में प्रयोग किए जा सकते हैं—इन दोनों के बीच की सीमा अस्पष्ट है।

लेकिन कुछ तथ्य निश्चित हैं, और आपको दोनों व्याख्याओं में से किसी एक का समर्थन नहीं करना है।

पहला, 2026 की पहली छमाही में Anthropic द्वारा किया गया नैरेटिव शिफ्ट एक अकेला मामला नहीं है। DeepMind के Hassabis ने लगभग उसी क्वार्टर में समान दिशा में, हालांकि अलग डिग्री पर, लेकिन मूल रूप से समान समायोजन किया, और OpenAI के Sam Altman ने भारत शिखर सम्मेलन में कहा कि "दुनिया तैयार नहीं है", और 2026 के फरवरी में GPT-5.3-Codex जारी किया, जिसमें दावा किया गया कि इसने "अपने निर्माण में महत्वपूर्ण भूमिका निभाई है"। यदि केवल Anthropic ही संकेत दे रही हो, तो शायद इसे केवल कंपनी की रणनीति के दृष्टिकोण से विश्लेषित किया जा सकता है। लेकिन तीनों प्रमुख प्रयोगशालाओं द्वारा सघन महीनों में एक साथ आवाज़ बढ़ाना, यह उद्योग स्तर पर एक नैरेटिव शिफ्ट का निर्माण करता है।

दूसरा, इन संकेतों के रिलीज के रिदम और फाइनेंसिंग, नीति समायोजन और संस्थागत पुनर्गठन के रिदम के बीच एक सटीक रूप से ट्रैक किया जा सकने वाला समय सम्बन्ध होता है। इस सम्बन्ध को किसी भी बात को साबित करने की आवश्यकता नहीं है, इसे केवल ईमानदारी से प्रस्तुत किया जाना चाहिए। प्रस्तुति के बाद, प्रत्येक व्यक्ति की अपनी पद्धति तय करेगी कि वह आगे क्या सोचेगा।

तीसरा, एंथ्रोपिक ने तीसरे परिदृश्य, अर्थात् "पूर्ण आत्म-पुनरावृत्ति सुधार" के लिए अपने आप एक स्थिति के रूप में "संभव" का चिह्नन किया है, "अधिक संभावना" नहीं। इसका अर्थ है कि इस कंपनी के अपने आंतरिक निर्णय ढांचे में, उनकी त्वरण कहानी अभी पूरी तरह से समाप्त नहीं हुई है। उन शक्तियों, जो उन्हें शैक्षणिक पत्रों और ब्लॉग लेखन में सीमावधि शब्दों को शामिल करने की आदत देती हैं, अभी भी उनके सार्वजनिक शब्दों की सवारी पर काबू रख रही हैं।

चौथा, हसाबिस की "जानबूझकर चुनौती भरी" घोषणा, एक ऐसे तंत्र की पुष्टि करती है जिसके बारे में पहले से ही व्यापक रूप से संदेह किया जाता रहा है, लेकिन जिसके बारे में कभी-कभी ही प्रतिभागी स्वयं ने बात की है: कम से कम कुछ अग्रणी प्रयोगशालाओं के नेता, अपने शब्दों का चयन करते समय, स्पष्ट संचार उद्देश्य रखते हैं। इससे उनके बयानों की प्रत्येक व्याख्या को दो स्तरों के विश्लेषण की आवश्यकता होती है—उनके द्वारा दावा किए गए तथ्य, और उनके द्वारा इन दावों के चयन में अपनाई गई वाचिक रणनीति, जिसे एक क्रिया के रूप में समझा जाना चाहिए।

जिन लोगों ने एंथ्रोपिक के पूरे डेटा को ध्यान से पढ़ा, उन्हें और जिन लोगों ने केवल "80% कोड AI द्वारा लिखा गया" और "52 गुना त्वरित" इन दो संख्याओं को याद रखा, उन्हें प्राप्त संकेत की तीव्रता पूरी तरह से अलग है। लेकिन इस मामले में, "कैसे याद किया गया" को "वास्तव में क्या कहा गया" की तुलना में विश्लेषण का अधिक उपयुक्त विषय माना जाना चाहिए।

यह लंबा लेख स्वयं उसी घटना का एक सटीक नमूना है जिसका वह वर्णन कर रहा है। यह डेटा का उपयोग करके एक त्वरित गति का अनुभव बनाता है, और साथ ही टिप्पणियों और सीमाओं के माध्यम से पीछे हटने का रास्ता भी छोड़ता है; यह वैश्विक समन्वय और सत्यापित मंदी की आह्वान करता है, लेकिन पहले के नीति संशोधनों में ही रोक की प्रतिबद्धता को हटा दिया गया है। यह झूठा पन्ना या सिर्फ कथन और कार्य में अंतर नहीं है। यह एक संस्था है जो प्रौद्योगिकीय अनिश्चितता, व्यावसायिक दबाव और सार्वजनिक जिम्मेदारी के बीच कथानक का संतुलन कर रही है। और हैसबिस की “जानबूझकर चुनौती” की स्वीकृति, इस संतुलन को मुख्य प्रयोगशालाओं में एक सचेतन रूप से प्रयुक्त विधि के रूप में साबित करती है।