लीक हुआ Claude Code v2.1.88 सोर्स कोड उन्नत AI एजेंट इंजीनियरिंग आर्किटेक्चर को उजागर करता है

iconMetaEra
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
26 मार्च, 2026 को, एंथ्रोपिक ने अनजाने में Claude Code (v2.1.88) का पूरा फ्रंटएंड और क्लाइंट-साइड स्रोत कोड एक npm भंडार में प्रकट कर दिया। एक लीक हुई cli.js.map फ़ाइल ने लगभग 1900 फ़ाइलें और 510,000 से अधिक पंक्तियाँ TypeScript कोड पुनर्स्थापित कीं, जिससे AI एजेंट की आर्किटेक्चर का पता चला। स्रोत कोड से समयनिर्धारण, स्मृति प्रणालियों और सुरक्षा रणनीतियों के बारे में जानकारी मिलती है। डेवलपर्स और शोधकर्ता इस कोड को तकनीकी संदर्भ के रूप में विश्लेषण कर रहे हैं। बाजार के मनोभाव में परिवर्तन के बीच, भय और लालच सूचकांक शीर्ष अल्टकॉइन्स के लिए एक प्रमुख सूचक बना हुआ है।
2026 मार्च 31 को लीक हुए Claude Code (v2.1.88) के स्रोत कोड का गहन तकनीकी विश्लेषण किया गया है, जिसे अग्रणी AI एजेंट इंजीनियरिंग आर्किटेक्चर को समझने का एक मूल्यवान मामला माना गया है।

लेखक, स्रोत: Max

आज (31 मार्च, 2026), Anthropic ने अपने नवीनतम Claude Code (v2.1.88) के पूर्ण फ्रंटएंड और क्लाइंट स्रोत को npm रिपॉजिटरी में पैकेजिंग प्रक्रिया की एक निम्न स्तरीय गलती के कारण प्रकट कर दिया।

एक यूजर ने एक अनटेक्स्ट्रैक्टेड cli.js.map फाइल पोस्ट की, जिससे लगभग 1900 फाइलें और 51 लाख से अधिक पंक्तियाँ मूल TypeScript कोड प्राप्त हुए।

Anthropic के लिए, यह कुछ दिनों पहले Mythos मॉडल दस्तावेज़ के रिसाव के बाद एक और गंभीर OpSec दुर्घटना है।

लेकिन पूरे बड़े मॉडल एप्लिकेशन लेयर के डेवलपर्स और उद्योग शोधकर्ताओं के लिए, यह सोर्स कोड एक बिना किसी छुपाव के, अत्यधिक मूल्यवान अग्रणी AI एजेंट इंजीनियरिंग आर्किटेक्चर व्हाइट पेपर है।

कानूनी और डेटा लीक के विवादों को छोड़कर, मैंने इस सोर्स कोड की स्थानीय रूप से गहन समीक्षा करने में कुछ समय बिताया।

अगर इसे एक अफवाह के रूप में नहीं, बल्कि एक प्रोडक्शन-लेवल AI प्रोग्रामिंग असिस्टेंट आर्किटेक्चर के मामले के रूप में देखा जाए, तो इसमें असामान्य सोच के बहुत सारे इंजीनियरिंग निर्णय हैं।

नीचे मैंने क्लॉड कोड के नीचे की आर्किटेक्चर, स्केड्यूलिंग मैकेनिज़म, मेमोरी सिस्टम और सुरक्षा रणनीति का विस्तृत तकनीकी विश्लेषण वस्तुनिष्ठ दृष्टिकोण से प्रस्तुत किया है।

लेख लंबा है, जो AI Infra, Agent विकास और बड़े मॉडल एप्लिकेशन लेयर आर्किटेक्चर में रुचि रखने वाले पेशेवरों के लिए उपयुक्त है।

भाग.01 केवल एक CLI उपकरण नहीं

डायरेक्टरी स्ट्रक्चर (src/ के नीचे लगभग 40 प्रमुख मॉड्यूल) से पता चलता है कि Claude Code की जटिलता वर्तमान बाजार में उपलब्ध किसी भी ओपन-सोर्स सिंगल-मॉनोलिथिक एजेंट से कहीं अधिक है।

इसका तकनीकी स्टैक बहुत व्यावहारिक है और अंतिम उपयोगकर्ता इंटरफ़ेस के अनुभव पर ध्यान केंद्रित करता है:

भाषा TypeScript है, रनटाइम के लिए अधिक एग्रेसिव प्रदर्शन वाला Bun चुना गया है, CLI फ्रेमवर्क Commander का उपयोग किया जा रहा है, और टर्मिनल रेंडरिंग लेयर अप्रत्याशित रूप से React + Ink का उपयोग करती है।

एक कमांड लाइन टूल का उपयोग React क्यों किया जाए?

स्क्रीन्स/REPL.tsx (5005 पंक्तियों तक) में उत्तर दिया गया है।

बड़े मॉडल के स्ट्रीमिंग आउटपुट और एक साथ कई टूल्स के निष्पादन के संदर्भ में, टर्मिनल UI का स्टेट प्रबंधन अत्यंत जटिल हो जाता है (उदाहरण के लिए, विचार प्रक्रिया, टूल कॉल प्रगति बार, कोड Diff पूर्वावलोकन आदि को एक साथ रेंडर करना)।

डिक्लेरेटिव React को अत्यंत सरल Zustand शैली के कस्टम स्टोर (state/store.ts) के साथ उपयोग करना इस उच्च आवृत्ति स्थानीय अपडेट के लिए सर्वोत्तम इंजीनियरिंग प्रथा है।

सिस्टम को ऑपरेशन मोड पर दो रूपों में कठोरता से विभाजित किया गया है:

इंटरैक्टिव REPL मोड: इंक द्वारा संचालित फ्रंटएंड टर्मिनल यूआई, मुख्य रूप से मानव डेवलपर्स के लिए।

हेडलेस/SDK मोड (QueryEngine क्लास): UI को पूरी तरह से हटा दिया गया है, JSON स्ट्रीमिंग आउटपुट का समर्थन करता है। इससे इसे बाद में IDE (जैसे Cursor के समान रूप) या CI/CD प्रक्रियाओं में निचले स्तर के इंजन के रूप में एम्बेड करने की संभावना बनती है।

सिस्टम स्टार्टअप प्रक्रिया को भी अधिकतम समानांतरता के साथ अनुकूलित किया गया है।

main.tsx में, कॉन्फ़िगरेशन पढ़ना (MDM सेटिंग्स) और Keychain कुंजी प्रीफ़ेच जैसे I/O-भारी ऑपरेशन एक सबप्रोसेस में रखे गए हैं, जो मुख्य मॉड्यूल के ~135ms लोडिंग प्रक्रिया के साथ समानांतर रूप से निष्पादित होते हैं; यह स्टार्टअप लेटेंसी के लिए मिलीसेकंड स्तर की कठोरता पूरे कोडबेस में व्याप्त है।

PART.02 प्रॉम्प्ट कैश (Prompt Cache) इंजीनियरिंग

यह स्रोत कोड का सबसे तकनीकी रूप से जटिल हिस्सा है, जो Claude Code और सामान्य ओवरले ऐप्स के अनुभव के बीच का मुख्य बाधा है।

वर्तमान में, Agent उपकरण लंबे संदर्भ को संभालते समय, अक्सर सिस्टम प्रॉम्प्ट और इतिहास की बातचीत को सरल और अनियंत्रित ढंग से जोड़ रहा है।

और Claude Code के services/api/claude.ts (3419 पंक्तियों वाले कोर इंटरैक्शन मॉड्यूल) में, प्रॉम्प्ट असेंबली बाइट-लेवल पर सटीकता से की गई है।

ज्ञात है कि Anthropic का प्रॉम्प्ट कैश तंत्र प्रारंभिक मेल (Prefix Matching) का उपयोग करता है।

कैश हिट दर को अधिकतम करने के लिए, क्लॉड कोड ने एक उच्च रूप से डिज़ाइन की गई खंडित कैश आर्किटेक्चर बनाई है:

स्थिर खंड (सार्वजनिक रूप से कैश किया जा सकता है): systemPromptSection() द्वारा उत्पन्न, जिसमें मॉडल की पहचान परिचय ("You are Claude Code..."), सिस्टम स्तरीय सुरक्षा नियम, कोड शैली सीमाएँ, उपकरण उपयोग के मूल मार्गदर्शन शामिल हैं। यह खंड पूरे सत्र जीवनचक्र के दौरान लगभग अपरिवर्तित रहता है।

डायनामिक बॉर्डर: सोर्स कोड में एक विशेष मार्कर SYSTEM_PROMPT_DYNAMIC_BOUNDARY हार्डकोड किया गया है।

डायनामिक सेक्शन (सेशन-लेवल कैशिंग/कैश नहीं): वर्तमान वर्किंग डायरेक्टरी जानकारी (CWD), Git स्थिति, MCP (मॉडल कॉन्टेक्स्ट प्रोटोकॉल) निर्देश, उपयोगकर्ता कॉन्फ़िगरेशन आदि उच्च आवृत्ति वाले डेटा को शामिल करता है।

और प्रॉम्प्ट में छोटे-छोटे बदलाव के कारण कैश पेनेट्रेशन को रोकने के लिए, सिस्टम ने कई ऐसे दिखने में जटिल बैकअप कार्य किए हैं:

  • डिटर्मिनिस्टिक सॉर्टिंग: बड़े मॉडल को दिए गए टूल विवरण (Tools Description) को बिल्ट-इन टूल प्रीफिक्स + MCP टूल सफिक्स के अनुसार वर्णमाला क्रम में सॉर्ट किया जाता है।
  • हैश पाथ मैपिंग: प्रोफाइल का पथ यादृच्छिक UUID के बजाय सामग्री-आधारित हैश मान का उपयोग करता है, जिससे प्रत्येक इंजेक्शन में अलग पथ के कारण कैश बर्बाद न हो।
  • स्टेटस बाहरी है: यहां तक कि वर्तमान उपलब्ध एजेंट की सूची को भी टूल विवरण से हटा दिया गया है और संलग्नक (Attachments) में स्थानांतरित कर दिया गया है। स्रोत कोड के टिप्पणियों के अनुसार, इस एकल परिवर्तन से लगभग 10.2% कैश निर्माण टोकन की खपत कम हो गई है।

यह सब एक उद्योग की वर्तमान स्थिति को दर्शाता है: वर्तमान चरण में उत्कृष्ट AI एप्लिकेशन लेयर विकास, मूल रूप से API कैश सिस्टम के मूल्य को लालची और सूक्ष्मता से निचोड़ना है।

PART.03 उपकरण और स्ट्रीमिंग समानांतर निष्पादन

Claude Code में 40 से अधिक टूल्स (फाइल पढ़ने-लिखने, Bash निष्पादन, वेब स्क्रैपिंग आदि सहित) शामिल हैं, और इसका टूल सिस्टम आर्किटेक्चर अत्यधिक मॉड्यूलर फैक्टरी पैटर्न (Factory Pattern) का उपयोग करता है।

प्रत्येक उपकरण बेसिक Tool इंटरफेस से विरासत में मिलता है और checkPermissions(), validateInput() और isConcurrencySafe() (क्या समानांतर सुरक्षित है) जैसी विधियों को लागू करना अनिवार्य है।

ऑन-डिमांड लोडिंग टूलसर्च मैकेनिज्म: जब टूल्स की संख्या किसी दिए गए सीमांकन से अधिक हो जाए, तो सभी टूल्स के विवरण को प्रॉम्प्ट में शामिल करने पर टोकन लागत अस्वीकार्य हो जाएगी।

कोड में ToolSearch नामक एक उपयुक्त रणनीति दिखाई गई है: गैर-मुख्य उपकरण (जैसे कुछ विशिष्ट विश्लेषण प्लगइन) को defer_loading: true के रूप में चिह्नित किया गया है।

मॉडल वर्तमान प्रॉम्प्ट में इन टूल्स की विस्तृत परिभाषाएँ नहीं देख सकता, बस एक ToolSearch टूल के बारे में जानता है। जब मॉडल को लगता है कि उसे अतिरिक्त क्षमताओं की आवश्यकता है, तो उसे पहले ToolSearch को कॉल करके संबंधित टूल कॉन्फ़िगरेशन को डायनामिक रूप से लोड करना होगा।

StreamingToolExecutor (स्ट्रीमिंग टूल एक्जीक्यूटर): कार्यक्षमता में सुधार के लिए, सिस्टम टूल्स के समानांतर कॉल को समर्थन करता है।

कोऑर्डिनेटर (toolOrchestration.ts) बड़े मॉडल द्वारा लौटाए गए टूल कॉल अनुरोधों को समानांतर बैच और क्रमिक बैच में विभाजित करता है।

समानांतर सुरक्षित उपकरण (जैसे कि एक साथ कई असंबंधित फ़ाइलों को पढ़ना, समानांतर रूप से नेटवर्क खोज शुरू करना) समानांतर रूप से ट्रिगर किए जाएंगे, जबकि समानांतर सुरक्षित नहीं उपकरण (जैसे कि एक ही कोड फ़ाइल को क्रमिक रूप से संशोधित करना) कठोरता से अनुक्रमिक रूप से चलाए जाएंगे।

बड़े परिणाम सेट के टूल (जैसे पूर्ण डिस्क Grep सर्च) में maxResultSizeChars बजट होता है, जिससे अधिक सामग्री को सीधे काट दिया जाता है और स्थानीय अस्थायी फ़ाइल में संग्रहित कर दिया जाता है, और LLM को केवल एक पूर्वावलोकन सारांश दिया जाता है, ताकि बहुत बड़े परिणाम से कॉन्टेक्स्ट विंडो भर न जाए।

PART.04 संदर्ष प्रदूषण को हल करने के लिए Fork तंत्र

वर्तमान एकल एजेंट में एक घातक दोष है:

जटिल कार्यों (जैसे फाइलों के बीच बग ट्रेस करना) को निष्पादित करते समय, मॉडल गलत फाइलों को बार-बार पढ़ सकता है और गलत कमांड्स का प्रयास कर सकता है, जिससे बहुत सारा अनावश्यक संदर्भ उत्पन्न होता है, जो मुख्य संवाद को तेजी से प्रदूषित कर देता है और मॉडल को बाद के निष्कर्षण में विक्षिप्त या प्रारंभिक लक्ष्य को भूलने का कारण बनता है।

Claude Code ने इस समस्या को हल करने के लिए जटिल कोऑर्डिनेटर मोड (Coordinator Mode) और फ़ोर्क सबएजेंट (Fork Subagent) तंत्र पेश किया है।

जब वातावरण चर में कोऑर्डिनेटर मोड सक्षम किया जाता है, तो प्रणाली को कोऑर्डिनेटर-वर्कर्स आर्किटेक्चर में पुनर्निर्मित किया जाएगा:

  • निर्देशक (Coordinator): फाइलों को सीधे संपादित करने की अनुमति वापस ले ली गई है, केवल Agent (परिणामी उप-एजेंट), SendMessage और TaskStop तीन उपकरणों का ही उपयोग करने की अनुमति दी गई है। इसका एकमात्र कार्य कार्य प्रवाह (अनुसंधान → संश्लेषण → कार्यान्वयन → सत्यापन) की योजना बनाना है।
  • कार्यकर्ता (एक्जीक्यूटर्स): विशिष्ट उपकरण विवरण के साथ उत्पन्न किए जाते हैं।

सबसे प्रशंसनीय बात इसका फ़ोर्क विरासत तंत्र है।

जब व्यापक कोड अन्वेषण की आवश्यकता होती है, तो Coordinator एक Explore Agent का फ़ोर्क करता है।

यह सबएजेंट पितृ संवाद की कैश को विरासत में लेगा (लागत बचाने के लिए साझा Prompt Cache), लेकिन इसकी भविष्य की खोज गतिविधियाँ और पढ़ी गई कचरा फाइलें पूरी तरह से इसके अलग संदर्भ में होंगी।

अन्वेषण के बाद, सबएजेंट को केवल विशिष्ट XML प्रारूप के माध्यम से संक्षिप्त की गई मुख्य निष्कर्ष (Synthesis) को Coordinator के मुख्य संदर्भ में भेजना होगा।

यह एक बार उपयोग के बाद नष्ट हो जाने वाली, केवल निष्कर्ष छोड़ने वाली डिज़ाइन, वर्तमान में जटिल बहु-एजेंट लंबे पाठ सहयोग के लिए उद्योग की शीर्ष अभ्यासों में से एक है।

यह एक बार उपयोग के बाद नष्ट हो जाने वाली, केवल निष्कर्ष छोड़ने वाली डिज़ाइन, वर्तमान में जटिल बहु-एजेंट लंबे पाठ सहयोग के लिए उद्योग की शीर्ष अभ्यासों में से एक है।

भाग.05 एजेंट स्वार्म कंकरेंट मैकेनिज्म को ब्रेक करना

संदर्भ प्रदूषण को हल करने के लिए अतिरिक्त सीरियल Fork तंत्र के अलावा, सोर्स कोड में एक अधिक दांव भरा समानांतर बहु-एजेंट आर्किटेक्चर—Swarm (Teammate) क्लस्टर—भी दिखाया गया है।

यह तर्क मुख्य रूप से utils/swarm/ और tasks/ निर्देशिकाओं में छिपा हुआ है।

सिस्टम in_process_teammate नामक टास्क प्रकार का समर्थन करता है।

इस आर्किटेक्चर के तहत, मुख्य प्रक्रिया कई Agent (जिन्हें Teammate कहा जाता है) को समानांतर रूप से जागा सकती है ताकि वे विभिन्न कार्यों को एक साथ निष्पादित कर सकें।

लेकिन टर्मिनल CLI वातावरण में एजेंट्स की एक साथ बहु-समानांतरता को लागू करने से दो घातक इंजीनियरिंग चुनौतियों का सामना करना पड़ता है: अधिकार पॉप-अप टकराव और UI रेंडरिंग अव्यवस्था।

एंथ्रोपिक का समाधान अत्यंत उत्कृष्ट है:

  • लीडर अधिकार समन्वय (permissionSync.ts): सभी टीममेट उपप्रक्रियाएँ उपयोगकर्ता को सीधे अनुमति अनुरोध के लिए विंडो नहीं दिखा सकतीं। वे अनुमति अनुरोध को आंतरिक चैनल के माध्यम से मुख्य प्रक्रिया के लीडर एजेंट को "ब्रिज" करती हैं, जो मुख्य टर्मिनल पर सुरक्षा ब्लॉकिंग और उपयोगकर्ता पुष्टि के लिए एकत्रित रूप से जिम्मेदार होता है।
  • टर्मिनल लेआउट ऑटोमेशन: उपयोगकर्ताओं को कई समानांतर एजेंट्स की स्थिति को स्पष्ट रूप से मॉनिटर करने में सक्षम बनाने के लिए, सोर्स कोड में iTerm2 और Terminal.app के AppleScript निर्देश सीधे एकीकृत किए गए हैं। जब एक नया टीममेट बनाया जाता है, तो सिस्टम टर्मिनल में स्वचालित रूप से पैनल को विभाजित कर देता है और प्रत्येक सब-एजेंट के लिए अलग-अलग आउटपुट विंडो आवंटित करता है।

यह दर्शाता है कि AI अब “एकल चिंतन” से आधिकारिक रूप से “समूह समानांतर सहयोग” की ओर विकसित हो रहा है।

PART.06 Dream (सपना) स्मृति आर्किटेक्चर

आज, जब RAG (रिट्रीवल-एन्हांस्ड जनरेशन) का बहुत बड़ा बाजार है, लगभग सभी AI उत्पाद वेक्टर डेटाबेस (Vector DB) को एकीकृत कर रहे हैं।

लेकिन आश्चर्यजनक रूप से, Claude Code की मेमोरी सिस्टम (memdir/ मॉड्यूल) अत्यंत पुरानी और व्यावहारिक है, जो पूरी तरह से स्थानीय फाइल सिस्टम पर आधारित है।

इसकी अर्चिटेक्चर एक कोर MEMORY.md (जो उच्च स्तरीय सूची के रूप में कार्य करता है और अधिकतम 200 पंक्तियों/25KB तक सीमित है) और फ्रंटमैटर फॉर्मेट पर आधारित कई विषय फाइलों से बनी है।

याददाश्त को उपयोगकर्ता, प्रतिक्रिया, प्रोजेक्ट, संदर्भ चार श्रेणियों में सूक्ष्मता से विभाजित किया गया है।

अधिक रोचक बात यह है कि सोर्स कोड में KAIROS असिस्टेंट मोड छिपा हुआ है।

यह एक अभी तक आधिकारिक रूप से जारी नहीं किया गया लंबे समय तक चलने वाला (Daemon) मोड है।

KAIROS मोड में, मेमोरी सिस्टम केवल साधारण इंडेक्स अपडेट नहीं है, बल्कि मानव लॉग के समान ऐपेंड मोड का उपयोग करता है (लॉग्स/YYYY/MM/YYYY-MM-DD.md में लिखें)।

रात के समय या निष्क्रिय समय के दौरान, बैकग्राउंड पर एक ऑफलाइन टास्क एजेंट ड्रीम (सपना देखना) जाग जाता है।

इस एजेंट का कार्य दिन के लिए लिखे गए लॉग को सारांशित और सारांशित करना है, और फिर उन्हें संरचित दीर्घकालिक विषय फ़ाइलों में स्थिर करना है।

इस असynchronous एकीकरण तंत्र, जो अल्पकालिक लॉग से दीर्घकालिक स्मृति में जाता है, न केवल वेक्टर रिट्रीवल की रिकॉल समस्या को दूर करता है, बल्कि एंड-साइड AI सहायक की सदैव ऑनलाइन, निरंतर अधिगम की ओर विकास की स्पष्ट दिशा को भी दर्शाता है।

भाग.07 अधिकार संकुचन और सुरक्षा

स्थानीय Shell आदेशों को निष्पादित करने और फ़ाइलों को संशोधित करने के लिए AI को अनुमति देना एक दोनों ओर से तेज़ तलवार है।

बार-बार पॉप-अप द्वारा उपयोगकर्ता की पुष्टि की मांग करने से स्वचालन का अनुभव पूरी तरह से बिगड़ जाता है, और बिना किसी सीमा के स्वचालित निष्पादन से सिस्टम क्रैश हो सकता है (जैसे rm -rf का गलत निष्पादन)।

Claude Code एक बहु-स्तरीय अधिकार संकुचन आर्किटेक्चर का उपयोग करता है:

@anthropic-ai/sandbox-runtime के आधार पर फाइल/नेटवर्क सैंडबॉक्स से लेकर विशिष्ट खतरनाक ऑपरेशन (जैसे git push --force) के लिए हार्डकोडेड ब्लॉकिंग, तक टूल-लेवल वेरिफिकेशन।

लेकिन सबसे ध्यान आकर्षित करने वाला इसका Auto Mode Classifier (yoloClassifier.ts) नामक घटक है।

जब उपयोगकर्ता ऑटो मोड को सक्षम करता है, तो सिस्टम आदेशों के खतरे का मूल्यांकन करने के लिए कठोर नियमित अभिव्यक्तियों का उपयोग नहीं करता, बल्कि एक साइड क्वेरी (Side Query) तंत्र का उपयोग करता है।

सिस्टम बैकग्राउंड में एक छोटा और सस्ता LLM ऑटोमेटिकली कॉल करेगा, जो वर्तमान संवाद का संक्षिप्त ट्रांसक्रिप्ट और निकट भविष्य में निष्पादित होने वाला Bash कमांड प्राप्त करेगा, ताकि इस साइड मॉडल से Allow या Deny का निर्णय प्राप्त हो सके।

इसके अलावा, सिस्टम के अंदर एक थ्रेशोल्ड-आधारित डेनियल ट्रैकिंग है, जिसमें जब स्वचालित उपकरणों को बार-बार अस्वीकार किया जाता है, तो सिस्टम धीरे-धीरे कमजोर हो जाता है और मानव हस्तक्षेप के लिए प्रॉम्प्टिंग मोड पर वापस चला जाता है।

यह छोटे AI द्वारा बड़े AI को नियंत्रित करने वाली डायनामिक अधिकार प्रणाली, पारंपरिक स्थिर ब्लॉकिंग नियमों की तुलना में कहीं अधिक लचीली है।

PART.08 कुछ छोटे आश्चर्य

अंत में, सोर्स कोड में बहुत सारे फीचर फ्लैग्स (जैसे VOICE_MODE, SSH_REMOTE आदि) और process.env.USER_TYPE === 'ant' के पर्यावरण चर के निर्णय हमें बड़ी कंपनियों द्वारा आंतरिक परीक्षण और बाहरी प्रकाशन के लिए दोहरे मानकों को दर्शाते हैं।

एंथ्रोपिक के आंतरिक कर्मचारी (केवल एंट) के लिए, सिस्टम इंजेक्टेड कोड स्टैंडर्ड अत्यंत कठोर और यहां तक कि पागलपन भरे हैं:

किसी भी फीचर को अनधिकृत रूप से न जोड़ें, यदि आवश्यकता में नहीं कहा गया है तो पुनर्गठित न करें, तीन समान पंक्तियाँ जल्दी अमूर्तीकरण से बेहतर हैं, डिफ़ॉल्ट रूप से कोई टिप्पणी न लिखें, जब तक कि WHY स्पष्ट न हो, परीक्षण विफल होने पर सच्चाई की रिपोर्ट करना अनिवार्य है।

और बाहरी सार्वजनिक बिल्ड के लिए, सिस्टम प्रॉम्प्ट बहुत अधिक नरम होता है: सीधे मुद्दे पर आएं, सबसे सरल तरीका आजमाएं, और जितना संभव हो उतना संक्षिप्त रहें।

यह विपरीतता दर्शाती है कि बड़े मॉडल के व्यवहार की सीमाएँ अधिकांशतः हार्डकोडेड निर्देश प्रवृत्तियों पर निर्भर करती हैं।

ध्यान देने योग्य बात यह है कि कोड में दो दिलचस्प मॉड्यूल शामिल हैं।

अंडरकवर मोड (Undercover Mode):

यह एक ऐसा फीचर है जिस पर सुरक्षा समुदाय में विवाद है।

ओपन सोर्स या पब्लिक रिपॉजिटरी में काम करने वाले कर्मचारियों के लिए, सिस्टम इस मोड को डिफ़ॉल्ट रूप से सक्षम कर देता है और इसे अनिवार्य रूप से बंद नहीं किया जा सकता। इस मोड में प्रॉम्प्ट में मॉडल को स्पष्ट रूप से निर्देश दिया जाता है कि "Do not blow your cover" (पहचान न खोलें), और AI द्वारा उत्पन्न सभी डिस्क्लेमर या कोडनेम के निशान को अनिवार्य रूप से हटा दिया जाता है।

प्रेस संबंधों के दृष्टिकोण से यह पारदर्शिता की कमी जैसा दिख सकता है, लेकिन यह निर्माता की मॉडल भूमिका निभाने और आउटपुट पर हस्तक्षेप की निरपेक्ष नियंत्रण क्षमता की पुष्टि करता है।

बॉडी सिस्टम (इलेक्ट्रॉनिक पालतू जानवर) ईस्टर एग:

सोर्स कोड में एक छिपा हुआ इलेक्ट्रॉनिक पालतू प्रणाली शामिल है (बत्तख, उल्लू आदि उत्पन्न करता है)।

पालतू जनरेशन की यादृच्छिकता और निर्धारणात्मकता को सुनिश्चित करने के लिए, इंजीनियर्स ने उपयोगकर्ता की ID के साथ Mulberry32 अर्ध-यादृच्छिक संख्या जनरेटर एल्गोरिथम का उपयोग किया।

typescript

18 प्रजातियाँ: बत्तख, हंस, ब्लॉब, बिल्ली, ड्रैगन, ऑक्टोपस, उल्लू, पेंगुइन, ...

5 दुर्लभता स्तर: सामान्य (60%), असामान्य (25%), दुर्लभ (10%), ऐपिक (4%), ऐतिहासिक (1%)

// गुण: डीबगिंग, धैर्य, अव्यवस्था, बुद्धिमत्ता, स्नार्क

// एक्सेसरीज: क्राउन, टॉफहैट, प्रोपेलर, हैलो, विजार्ड, बीनी, टाइनीडक

// विशेष: 1% संभावना shiny

सबसे मजेदार बात यह है कि किसी प्राणी के अंग्रेजी नाम के साथ Anthropic का अत्यंत गुप्त आंतरिक मॉडल कोडनेम मेल खा गया (शायद पिछले दिनों लीक हुआ सबसे शक्तिशाली Claude कैपीबारा)।

कॉम्प्लायंस कोड स्कैनर के निषिद्ध शब्द जांच को बायपास करने के लिए इंजीनियर ने इस शब्द को डायनामिक रूप से जोड़ने के लिए String.fromCharCode() का उपयोग किया।

इस हास्यपूर्ण गैजेट दृष्टिकोण को अत्यंत गंभीर बुनियादी ढांचे कोड में अनोखा ढंग से प्रस्तुत किया गया है।

भाग.09 हम क्या सीख सकते हैं?

एक समय में कोर मॉडल तकनीकी दस्तावेज़ और कोर एप्लिकेशन सोर्स कोड के रिसाव के कारण, एंथ्रोपिक को अपनी आंतरिक प्रक्रिया पर गहराई से समीक्षा करनी चाहिए। लेकिन तकनीक निर्दोष है, और यह 51 लाख पंक्तियों का कोड उद्योग के लिए एक बहुत अच्छा पाठ्यपुस्तक है।

क्लॉड कोड के निचले स्तर के डिज़ाइन से स्पष्ट है कि बड़े मॉडल एप्लिकेशन लेयर के स्टार्टअप के लिए, केवल प्रॉम्प्ट को जोड़ने, वेक्टर डेटाबेस को ढेर करने और एक साधारण लूप बाहरी आवरण लगाने का समय समाप्त हो चुका है।

वास्तविक बाधा, टोकन लागत पर अत्यधिक बचत (प्रॉम्प्ट कैश अनुकूलन), बहु-स्टेट मशीन सहयोग पर धारावाहिक नियोजन (कोऑर्डिनेटर और फ़ोर्क तंत्र), उपयोगकर्ता इच्छा के त्रुटि सहिष्णुता और सुरक्षा हस्तक्षेप के संतुलन (YOLO क्लासिफायर) और होस्ट ऑपरेटिंग सिस्टम में गहरी फ़ाइल स्ट्रीम एकीकरण पर स्थापित है।

वर्तमान में GitHub पर इन स्रोत कोड के फ़ोर्क किए गए रिपॉजिटरी DMCA अनुरोध के तत्काल निकाले जाने के खतरे का सामना कर रहे हैं।

लेकिन चाहे कुछ भी हो, क्लॉड कोड द्वारा दिखाया गया इंजीनियरिंग स्तर 2026 के एआई सहायक उत्पादों के लिए एक नया तकनीकी मानक स्थापित करता है।

Practitioners should seize this opportunity to carefully examine and adopt the engineering best practices.

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।