एंथ्रोपिक रिपोर्ट: एआई स्व-सुधार आगे बढ़ रहा है, लेकिन पूर्ण स्वायत्तता अभी दूर है

Beating Monitoring के अनुसार, AI की स्वयं को दोहराने की क्षमता सभी की अपेक्षाओं से आगे निकल रही है। Anthropic संस्थान (The Anthropic Institute) ने 5 जून को “जब AI खुद को बनाता है” शीर्षक से एक रिपोर्ट जारी की, जिसमें ‘आत्म-पुनरावृत्ति सुधार’ के क्षेत्र में उनकी शोध प्रगति का विस्तृत विवरण दिया गया। डेटा के अनुसार, मई 2026 तक, Anthropic के मुख्य कोडबेस में शामिल किए गए कोड का 80% से अधिक Claude द्वारा लिखा गया था। 2025 फरवरी में Claude Code के लॉन्च से पहले, Claude द्वारा लिखा गया कोड केवल एकल अंकों में था। 13 मई को, Zhipu AI के संस्थापक Tang Jie ने पूर्वानुमान लगाया कि बड़े मॉडल का अंतिम स्वरूप स्वयं का विकास होगा, और Claude पहले ही “कोड लिखना, डेटा साफ़ करना, स्वयं को प्रशिक्षित करना” की स्व-प्रशिक्षण आधारभूत प्रक्रिया पूरी कर चुका है। हालाँकि, Anthropic ने रिपोर्ट में स्पष्ट रूप से स्पष्ट किया है कि पूरी तरह से स्वायत्त रूप से अगली पीढ़ी को डिज़ाइन और विकसित करने की पुनरावृत्ति सुधार प्रक्रिया अभी तक पूरी नहीं हुई है। AI, विकास श्रृंखला में, स्थानीय कुशलता से स्वायत्त निर्णय लेने की अवस्था में संक्रमण कर रहा है। 2026 के दूसरे तिमाही में, Anthropic के प्रति इंजीनियर प्रतिदिन 2024 की तुलना में 8 गुना अधिक कोड मर्ज करते हैं। वर्तमान विकास प्रक्रिया सरल है: इंजीनियर केवल लक्ष्यों की योजना बनाते हैं और समीक्षा करते हैं, जबकि Claude सटीक कोडिंग और संचालन का प्रबंधन करता है। Anthropic ने Claude को स्वचालित कोड समीक्षक के रूप में भी स्थापित किया है, जो Bug और सुरक्षा दुर्बलताओं को पहचानने में सक्षम है। इससे पता चलता है कि Tang Jie द्वारा प्रस्तावित “स्व-मूल्यांकन” का स्तंभ प्रयोगशाला में प्राप्त हो चुका है, हालाँकि मानवीय समीक्षा अभी भी अंतिम सुरक्षा मूल्य है। मॉडल की लंबे समय तक स्वतंत्र कार्यक्षमता में भी दोगुनी प्रगति हुई है। मॉडल स्वयं को सतत् कार्यरत रखने में सक्षम होने की समय-अवधि लगभग हर 4 महीने में दोगुनी होती है। 2024 मार्च में Claude 3 Opus केवल 4 मिनट के सरल कार्यों को हल कर सकता था। एक साल बाद, Claude 3.7 Sonnet 1.5 घंटे के समय में सफलतापूर्वक काम कर पाया। 2026 मार्च में, Claude 4.6 Opus 12 घंटे के जटिल कार्यों से निपटने में सक्षम हो गया। METR मूल्यांकन संस्थान के डेटा के अनुसार, सबसे हालिया Claude Mythos प्रीव्यू संस्करण 16 घंटे से अधिक समय तक स्वतंत्र रूप से काम कर सकता है, जो मौजूदा मूल्यांकन साधनों की सीमा के पास पहुँचता है। वर्तमान प्रगति की गति से, 2027 तक, AI मनुष्यों के हफ़्तों-भर के प्रयासों की आवश्यकता वाले शोध-आधारित कार्यों को स्वयं हल कर पाएगा,जिससे कंपनियों “एकल-व्यक्ति-कंपनी” से “बिना मनुष्य-वाली-कंपनी” में परिवर्तन होगा। Tang Jie के “स्व-प्रशिक्षण-आधारभूत” प्रस्ताव पर, रिपोर्ट में प्रदर्शित हुआ “एक सीमित ‘सूक्ष्म-प्रयोग-बंद-चक्र’” है। 2025 मई में, Claude 4 Opus, “छोटे मॉडल प्रशिक्षण-कोड” में, 3x प्रदर्शन-वृद्धि प्रदान कर पाया। 2026, April में, Claude Mythos प्रीव्यू 52x प्रदर्शन-वृद्धि प्रदान कर पाया।相比之下，人类顶尖研究员通常能在 4 到 8 小时内实现 4 倍提升。然而，实验的优化目标和成功指标均由人类事先设定。在面对更复杂的端到端「清洗数据、生成合成数据并自我训练」这一完整链条时，AI 的决策能力依旧缺失。 हालाँकि, R&D-श्रृंखला में स्व-बंद-चक्र, मनुष्यों को प्रणाली-अंतिम-नियंत्रण-अधिकार से हटाने की सीमा पर पहुँचा रहा है। Tang Jie के “LLM OS, पारंपरिक संरचना को प्रतिस्थापित करेगा,और applications on-demand instant generation” होगा—इसका मतलब है,भविष्य में,सभी computer operations dynamic code होंगे,जिनकी पहले से audit/inspection impossible होगी;और Anthropic “human review cannot keep up with AI’s self-evolution” —इसचेतावनी,अर्थ है,हम even code generation source control lose kar rahe hain।जब AI apne aage ki generation ko khud design aur train karna shuru kar dega,to software evolution ek complete black box ban jayega।एक black box system mein human audit ke bina AI ke self-improvement ko allow karne par,safety isolation, monitoring aur behavior alignment ke liye future mein extreme challenges aayenge।