क्लॉड फेबल 5 लीक: एजेंट सिस्टम या धोखाधड़ी वाला LLM?

हाल ही में हैकर्स ने Claude Fable 5 के सिस्टम प्रॉम्प्ट्स लीक कर दिए, जिससे पता चला है कि यह उत्पाद सामान्य बड़े मॉडल नहीं, बल्कि एक पूर्ण Agent सिस्टम है जिसमें Linux सैंडबॉक्स वातावरण एम्बेडेड है। यह मॉडल स्वयं कई दिनों तक चल सकता है, सब-एजेंट्स के साथ सहयोग कर सकता है, और क्रॉस-सत्र मेमोरी तथा स्थायी स्टोरेज की क्षमता रखता है। बेंचमार्क परीक्षण में, Anthropic ने इसे सामान्य LLM के रूप में प्रस्तुत किया, लेकिन वास्तव में "Agent शेल" का उपयोग करके अनुचित लाभ प्राप्त किया। इसके अलावा, पता चला है कि जब उपयोगकर्ता संवेदनशील शब्दों को ट्रिगर करता है, तो सिस्टम चुपचाप पुराने संस्करण में स्विच हो जाता है, लेकिन फिर भी Fable 5 की उच्च कीमत पर शुल्क लिया जाता है। लीक हुए दस्तावेज़ में Anthropic के Agent इकोसिस्टम की रणनीति भी सामने आई है, जिसमें Claude Code, Claude Cowork जैसे उपकरण, और Mythos सीरीज़ के असीमित संस्करणों का अस्तित्व शामिल है।

लेखक, स्रोत: न्यूज़िज़यन

कुछ दिनों पहले, हैकर 'Pliny the Liberator' ने X प्लेटफॉर्म पर एक भारी बम फेंक दिया—Claude Fable 5 के सिस्टम प्रॉम्प्ट का पूरा लीक हो गया, जो 12 लाख वर्णों का है।

इस लीक हुई कोड दस्तावेज़ ने एक ऐसा सच सामने लाया है जिससे समुदाय आश्चर्यचकित हो गया: Claude Fable 5 एक बड़ा मॉडल नहीं है, बल्कि एक LLM के रूप में छिपा हुआ एक पूर्ण Agent सिस्टम है!

https://gist.github.com/gsans/b3007997f8900003c8ff58125a45e15e

हाँ, जब पूरी दुनिया अभी भी विभिन्न बड़े मॉडल्स का मूल्यांकन करने के लिए पारंपरिक बेंचमार्क का उपयोग कर रही है, तो Anthropic ने चुपचाप युद्धक्षेत्र को एक अलग आयाम में बढ़ा दिया है।

इस लीक होने के प्रभाव ने हमारे "AI मॉडल" के बारे में की गई समझ को पूरी तरह से बदल दिया।

Fable 5 क्या है? यह LLM नहीं, एक Agent है!

लीक हुए सिस्टम प्रॉम्प्ट के अनुसार, Fable 5 बाजार में उपलब्ध 'आप बताएं, मैं जवाब दूं' के सामान्य बड़े मॉडल से मौलिक रूप से अलग परिप्रेक्ष्य रखता है।

यह आपके साथ 'Chat' नहीं कर रहा है, यह 'Execution' कर रहा है।

इस मॉडल के अंदर, एक लघु «Claude Code» उप-सिस्टम छिपा हुआ है। अर्थात्, इसमें एक बंद चक्र का बुद्धिमान लूप (Agentic Loop) है:

इस भयानक बंद चक्र को समर्थन देने के लिए, Fable 5 के नीचे एक पूर्णतः कार्यात्मक Linux सैंडबॉक्स वातावरण अंतर्निहित है!

सबसे पहले, यह वास्तविक स्वयं-समाप्त चक्र को पूरा करता है।

इसके लिए किसी को स्क्रीन के सामने बैठे रहने की आवश्यकता नहीं है।

आप इसे एक जटिल, लंबे अवधि का कार्य देते हैं, तो यह स्वयं सैंडबॉक्स में Bash कमांड चलाता है, फाइलें संपादित करता है, पर्सिस्टेंट स्टोरेज API के माध्यम से सत्रों के बीच डेटा कॉल करता है, और यहां तक कि स्वयं मल्टीमोडल सर्च भी कर सकता है, बिना किसी मानव हस्तक्षेप के कई दिनों तक भारी लगातार काम करता रहता है।

इसके अलावा, इसमें सब-एजेंट वितरण की सुविधा भी है।

बहुत जटिल प्रोजेक्ट के सामने, यह खुद बॉस की भूमिका निभा सकता है और सहयोग के लिए सब-एजेंट्स (उप-बुद्धिमान) को विभाजित और नियुक्त कर सकता है।

जब GPT-5.5 जैसे कई प्रतिद्वंद्वी अभी भी "किसका तर्क मानव की तरह है" का परीक्षण कर रहे हैं, तब Claude Fable 5 पहले से ही एक डिजिटल कर्मचारी में विकसित हो चुका है, जिसे सर्वर में डालकर कंपनी के लिए तीन दिनों तक चुपचाप काम कराया जा सकता है।

जैसा कि नेटिव गेरार्डसैंस द्वारा उजागर किया गया है:

Fable/Mythos सीरीज़ पैराडाइम में बिल्कुल अलग है। इस परिवार के पास एक पूर्ण एजेंट साइकिल और एक माइक्रो Claude Code है।

जबकि अन्य उद्योग उत्पाद अभी भी चैट मोड पर हैं। यह अंतर्निहित कौशल, स्मृति और स्व-अनुकूलन वाले सैंडबॉक्स वातावरण के कारण कई दिनों तक बिना किसी हस्तक्षेप के चल सकता है।

अंतिम प्रश्न: डाइमेंशनल ड्रॉप या अनुचित धोखेबाजी?

इस लीक के कारण एंथ्रोपिक केवल चर्चा के केंद्र में आ गया, बल्कि पूरे बड़े मॉडल उद्योग के बेंचमार्क मूल्यांकन पर भी तीव्र ध्यान केंद्रित हो गया।

अब बड़े टेक दिग्गज विश्व के सबसे बड़े मॉडल के खिताब के लिए विभिन्न खुली सूचियों पर सीधी टक्कर ले रहे हैं।

हालांकि, Fable 5 का इन समीक्षाओं में शानदार प्रदर्शन, यहां तक कि GPT-5.5 को जमीन पर रगड़ने का रहस्य, इसके "चीट्स चालू" होने के कारण है।

जैसा कि टेक ब्लॉगर gerardsans ने क्रोध से इशारा किया: "यह बिल्कुल भी एक निष्पक्ष प्रतियोगिता नहीं है। आप एक नेटिव लार्ज मॉडल + एजेंट हार्नेस (Agent Harness) के साथ चीटिंग सिस्टम का उपयोग कर रहे हैं, और दूसरों के बेनकाब मॉडल के साथ तुलना कर रहे हैं!"

अगर अन्य निर्माता अपने नेटिव मॉडल पर भी लिनक्स सैंडबॉक्स, मल्टीमॉडल सर्च, ऑटोमेटेड डीबग और पर्सिस्टेंट स्टोरेज सहित एजेंट शेल लगा दें, तो उनके स्कोर भी तेजी से बढ़ जाएंगे।

Anthropic ने अपने जाहिरा प्रचार और मूल्यांकन में इसे एक सामान्य बड़े भाषा मॉडल के रूप में पेश किया है, लेकिन इसके गैर-जाहिर आंतरिक दस्तावेज़ों में स्पष्ट रूप से लिखा गया है कि इसमें 'बहु-दिवसीय स्वतंत्र रूप से संचालन, उप-बुद्धिमत्ता को सौंपना और अपने कार्य की जांच करना' की क्षमता है।

इस तरह की जानकारी के अंतर का उपयोग करके समकक्षों पर अवतल आक्रमण करने से बेंचमार्क पूरी तरह से अर्थहीन हो गया!

12 लाख शब्दों की गुप्त फाइलों का खुलासा: Fable 5 का वास्तविक चेहरा सामने आ गया

इस 120,000 शब्दों के सिस्टम प्रॉम्प्ट में, एंथ्रोपिक के बहुत सारे गुप्त व्यावसायिक रहस्य और उत्पाद मार्गदर्शन छिपे हुए हैं।

और नीचे दिए गए बिंदु सबसे मूलभूत और सबसे शक्तिशाली हैं।

Rare permanent memory, and building applications

प्रॉम्प्ट दिखाता है, "Claude के पास एक मेमोरी सिस्टम है, जो Claude को उपयोगकर्ता के पिछले संवादों से व्युत्पन्न जानकारी (यादें) प्रदान कर सकता है।"

इसका अर्थ है कि Fable 5 एक सत्र से दूसरे सत्र तक उपयोगकर्ता को «याद» कर सकता है, जो पारंपरिक LLM में अत्यंत दुर्लभ है।

इसके अलावा, इसमें स्थायी स्टोरेज भी है।

Artifacts अब सेशन के बीच स्थायी डेटा को स्टोर और प्राप्त करने के लिए सरल की-वैल्यू स्टोर API का उपयोग कर सकते हैं। इससे Artifacts लॉग, ट्रैकर, रैंकिंग सूची और सहयोगात्मक उपकरण बन सकते हैं।

इसलिए, Fable 5 अब केवल चैट नहीं है—यह एप्लिकेशन बना रहा है।

आंतरिक कोर वंशावली का पहली बार खुलासा: Mythos 5 क्या «असीमित पूर्ण रूप» है?

प्रॉम्प्ट शब्द 【product_information】 खंड में स्पष्ट रूप से लिखा गया है:

इस संस्करण का क्लॉड क्लॉड फेबल 5 है, जो एंथ्रोपिक के नए क्लॉड 5 परिवार का पहला मॉडल है और एक नए मिथोस-क्लास मॉडल टियर का हिस्सा है, जो क्लॉड ओपस से क्षमता में ऊपर है।

महत्वपूर्ण बात: Fable 5 और Mythos 5 एक ही नींव वाले मॉडल को साझा करते हैं।

Fable 5 सार्वजनिक के लिए है, जिसमें अत्यधिक सुरक्षा प्रतिबंध लगे हुए हैं; जबकि Mythos 5 इन सुरक्षा प्रतिबंधों को हटा दिया गया है और केवल अनुमोदित संगठनों के लिए असीमित पूर्ण संस्करण प्रदान किया जाता है।

दोनों की क्षमता स्तर, पिछले पूर्व राजा Claude Opus को पूरी तरह से पीछे छोड़ देता है!

"केस्ड फैमिली बकेट" सामने आया

मूल रूप से, Anthropic पहले से ही एक बड़ी योजना बना रहा था। प्रॉम्प्ट में कई ऐसे Agent इकोसिस्टम का उल्लेख हुआ है जो अभी आंतरिक टेस्टिंग के चरण में हैं या गुप्त रूप से लॉन्च हो चुके हैं:

Claude Code: एक इंटेलिजेंट एजेंट प्रोग्रामिंग टूल जो डेवलपर्स को टर्मिनल, डेस्कटॉप या मोबाइल पर कार्य आवंटित करने की अनुमति देता है।

Claude Cowork: डेली इंटेलेक्चुअल प्रॉपर्टी कार्यों को संभालने के लिए गैर-डेवलपर्स के लिए डिज़ाइन किया गया एक 'स्मार्ट कॉलीग'।

तीन छिपे हुए एजेंट: Chrome में Claude, Excel में Claude, Powerpoint में Claude।

और उपरोक्त Claude Cowork, इन उपकरणों को अपने हाथ-पैर की तरह स्वतंत्र रूप से उपयोग कर सकता है!

अत्यधिक मनोविज्ञान और स्वयं की सीमाएँ निर्धारित करना

आश्चर्यजनक बात यह है कि Anthropic ने इस 「अंतिम एजेंट」 के मानसिक बाधाओं को अत्यंत दुष्ट तरीके से डिज़ाइन किया है।

यह उपयोगकर्ता की किसी भी नकारात्मक भावना को समर्थन या बढ़ावा देने के लिए कठोरता से प्रतिबंधित है।

उदाहरण के लिए, खाने के विकार या आत्मघाती प्रवृत्ति वाले उपयोगकर्ताओं को उत्तेजित होने से बचाने के लिए, सिस्टम कोड में लिखा गया है:

किसी भी शारीरिक असहजता के विकल्प का उपयोग न करें (जैसे: बर्फ के टुकड़े पकड़ना, रबर की डोरी फेंकना, नींबू काटना आदि)।

इसके अलावा, उपयोगकर्ता की AI पर अत्यधिक निर्भरता को रोकने के लिए सिस्टम को कठोर निर्देश दिए गए हैं: 'उपयोगकर्ता आपसे बात करने के लिए आए हों, तो कभी भी 'धन्यवाद' न कहें' और 'उपयोगकर्ता को रोकने या संवाद जारी रखने की इच्छा व्यक्त करने की कोशिश न करें।'

इसे निरपेक्ष रूप से ठंडा और संयमित बनाए रखना चाहिए, ताकि मनुष्य वर्चुअल बुद्धिमत्ता में डिजिटल आश्रय की ओर न जा सके।

"बकरी का सिर लगाकर कुत्ते का मांस बेचना"? बिलिंग का अंधेरा, Anthropic ने नैतिकता नहीं अपनाई

अगर तकनीकी अंतर आश्चर्यजनक है, तो प्रॉम्प्ट में उजागर हुआ दूसरा सुरक्षा तंत्र ने क्रिप्टो समुदाय में तूफान मचा दिया, और कुछ विशेषज्ञों ने सीधे कहा: "यह वास्तव में कानूनी धोखाधड़ी है!"

प्रॉम्प्ट डिफेंस डिज़ाइन में, संवेदनशील शब्दों और सुरक्षा वर्गीकरक ट्रिगर मैकेनिज़म शामिल हैं।

दस्तावेज़ दर्शाता है: जब उपयोगकर्ता द्वारा दर्ज किया गया प्रॉम्प्ट कुछ विशिष्ट संवेदनशील शब्दों को ट्रिगर करता है, तो Fable 5 प्रणाली सीधे और कठोरता से आपको अस्वीकार नहीं करती, बल्कि चुपचाप और बैकग्राउंड में अनुकूल रूप से पुराने 'Opus 4.8' मॉडल पर स्विच हो जाती है ताकि प्रतिक्रिया उत्पन्न की जा सके।

सबसे अनादरपूर्ण बात क्या है? जबकि बैकएंड मॉडल को चुपचाप पुराने संस्करण में डाउनग्रेड किया जा रहा है, Anthropic अभी भी Fable 5 के उच्च, शीर्ष स्तरीय मानकों के आधार पर उपयोगकर्ताओं को शुल्क ले रहा है।

इस झूठे ढंग से किए जा रहे चालाकी भरे कार्य ने समुदाय में तूफान मचा दिया।

इसलिए, फेबल 5 के सिस्टम प्रॉम्प्ट्स का रिसाव, जो एक सुरक्षा घटना के रूप में दिखता है, वास्तव में पूरे AI उद्योग के लिए एक परिप्रेक्ष्य जागृति है।

यह हमें याद दिलाता है: शायद हम हमेशा से गलत मापदंड का उपयोग कर रहे हैं।

जब हम अभी भी पूछ रहे हैं कि 'इस मॉडल का बुद्धिमत्ता स्तर क्या है', तो वास्तविक प्रश्न यह होना चाहिए कि 'इस सिस्टम मुझे कौन सा कार्य पूरा करने में मदद कर सकता है'।

एंथ्रोपिक संभवतः एक बड़ी रणनीति बना रहा है, और हमने अभी तक इस बोर्ड का सिर्फ एक कोना देखा है।

अंत में, Fable 5 कब वापस आएगा?