AI टोकन बिल्स विस्फोट: एक रात में 500M, 1.3M और 18K

1 महीने में 5 अरब डॉलर का बिल जलाया गया!

हाल ही में, प्रौद्योगिकी क्षेत्र में एक भयानक गलती सामने आई। Axios के अनुसार, एक कंपनी ने केवल एक महीने में Claude पर 5 अरब डॉलर का खर्च कर दिया!

कारण हैरानी वाला: प्रबंधन ने कर्मचारियों को क्लॉड अकाउंट एक्सेस देते समय उपयोग सीमा की सीमा निर्धारित नहीं की।

GitHub

वास्तव में, AI बिल के बारे में यह एकमात्र कंपनी नहीं है जिसका बाजार से निकाल दिया गया है।

इस साल अप्रैल में, एक गूगल क्लाउड उपयोगकर्ता को उनके खुली सेवा में छूटे API कुंजी के दुरुपयोग के कारण, जिसका मूल बजट केवल 7 डॉलर था, एक रात में 18,000 डॉलर का बिल मिला।

GitHub

यह बदशगुल यूजरनेम Jesse Davies है, एक ऑस्ट्रेलियाई AI सलाहकार और Agentic Labs के संस्थापक। उन्होंने अपने Google Cloud खाते के लिए दो सुरक्षा उपाय रखे: एक 10 ऑस्ट्रेलियाई डॉलर (लगभग 7 डॉलर) की बजट चेतावनी और एक 1400 डॉलर की कठोर खर्च सीमा।

टॉम्स हार्डवेयर के अनुसार, हमलावर ने कुछ महीनों पहले AI Studio से प्रकाशित एक Cloud Run सेवा का पता लगाया और 60,000 से अधिक अनुरोध भेजे, जिससे दोनों सुरक्षा उपाय विफल रहे: बिलिंग की गणना में देरी हुई, और जब प्रणाली ने प्रतिक्रिया दी, तो राशि 18,000 डॉलर तक पहुंच चुकी थी।

मई के मध्य में, ओपन सोर्स प्रोजेक्ट OpenClaw के संस्थापक पीटर श्टाइनबर्गर ने X पर एक स्क्रीनशॉट पोस्ट किया: 30 दिनों में, OpenAI API का बिल 130 डॉलर।

GitHub

उसकी टीम में केवल तीन लोग हैं, लेकिन वे 100 कोडेक्स एजेंट्स को समानांतर चला रहे हैं: 30 दिनों में 6030 अरब टोकन जलाए गए और 76 लाख अनुरोध भेजे गए। खुशी की बात है कि यह 130 डॉलर उसकी अपनी जेब से नहीं निकला।

स्टाइनबर्गर ने इस साल फरवरी में OpenAI में प्रवेश किया, और यह 130 डॉलर की राशि एक आंतरिक प्रयोग के रूप में दी गई:

यदि टोकन लागत को ध्यान में नहीं लिया जाए, तो AI प्रोग्रामिंग कितनी सीमा तक पहुँच सकती है। उन्होंने यह भी कहा कि यह Codex के 'Fast Mode' (फास्ट मोड बिलिंग) का परिणाम है, जिसे बंद करने के बाद लगभग 300,000 डॉलर होता है।

पहले ही, यूबर के सीटीओ प्रवीण नेपल्ली नागा ने The Information को बताया कि कंपनी ने अप्रैल में पूरे वर्ष का Claude Code बजट खत्म कर दिया था, और उनके सीओओ ने भी सार्वजनिक रूप से कहा कि AI लागत हर दिन और अधिक "तर्कसंगत नहीं" होती जा रही है।

5 करोड़, 130 लाख, 1.8 लाख, राशि कितनी ही अलग क्यों न हो, वह एक ही तथ्य की ओर इशारा करती है:

स्मार्ट एजेंट के युग में, अनियंत्रित कुंजियाँ, दिन-रात निरंतर काम करने वाले स्मार्ट एजेंट सेना, और सीमा न लगाए गए खाते: इनमें से कोई भी एक, आपके टोकन का बिल एक रात में बढ़ा सकता है।

AI बिल क्यों बंद हो जाता है?

उत्तर मुख्य रूप से बिलिंग तरीके में परिवर्तन में छिपा है।

अप्रैल 2024 से, OpenAI की मासिक सदस्यता योजना Token उपयोग पर आधारित हो गई है।

2 अप्रैल को, Codex बिलिंग को संदेश आधारित अनुमान से टोकन उपयोग पर अनुकूलित कर दिया गया: इनपुट, कैश्ड इनपुट और आउटपुट के तीन प्रकार के टोकन को अलग-अलग गिना जाएगा। 23 अप्रैल को, यह नियम सभी Enterprise, Edu, Health और Gov योजनाओं में लागू किया गया: मासिक शुल्क में छिपी हुई छूट हटा दी गई।

GitHub ने भी इसके बाद कदम रखा है और अभी-अभी घोषणा की है: 1 जून, 2026 से, सभी Copilot पैकेज उपयोग के आधार पर शुल्क लेने की ओर जा रहे हैं। पुरानी उन्नत अनुरोध तर्क को रद्द कर दिया गया है, और AI क्रेडिट के साथ प्रतिस्थापित किया गया है, जहां प्रवेश Token, आउटपुट Token, और कैशेड Token के वास्तविक उपयोग के आधार पर प्रत्येक मॉडल की API दरों के अनुसार निपटान किया जाएगा।

GitHub

GitHub ने इसका कारण स्पष्ट किया है:

अब एक त्वरित चैट प्रश्न और कई घंटों तक चलने वाली स्वायत्त कोडिंग कार्य के लिए उपयोगकर्ता समान राशि खर्च करते हैं। GitHub लंबे समय तक भारी कार्य चलाने वाले उपयोगकर्ताओं के लिए खर्च वहन कर रहा है, लेकिन यह मॉडल अब स्थायी नहीं रह सकता।

AI एजेंट्स के उभार से पहले, चैट और पूर्ति की लागत लगभग समान थी, मासिक शुल्क संभाला जा सकता था।

एजेंट्स के उभार के बाद, एक कार्य कई घंटों तक चल सकता है और पूरे कोडबेस को बदल सकता है, जिससे भारी उपयोगकर्ता और हल्के उपयोगकर्ता के बीच लागत का अंतर कई क्रमों तक पहुंच सकता है। इस अंतर के सामने मासिक शुल्क प्रणाली पूरी तरह से टूट जाती है।

समाचार जारी होते ही, Reddit और X पर शोर मच गया।

एक ID JBusu वाले डेवलपर ने बिल की स्क्रीनशॉट शेयर की और सीधे कहा कि नया मूल्यांकन "बस हंसी की बात है"। पहले 28.12 डॉलर/महीने का खर्च अब 746.01 डॉलर हो गया है, और उन्होंने सदस्यता रद्द करने का फैसला किया है, "इस कीमत पर मैं अपना क्लाउड सर्वर किराए पर लेना अभी भी सस्ता पाऊंगा"।

GitHub

एक अन्य उपयोगकर्ता ने एक और स्क्रीनशॉट शेयर किया, जिसमें शुल्क 50 डॉलर से बढ़कर 3000 डॉलर हो गया, उन्होंने कहा कि उन्हें नहीं पता था कि मूल्य इतना अतिरिक्त होगा, "क्या अभी भी कोई सदस्यता ले रहा है?"

GitHub

हालांकि, कुछ कोपिलट पुराने उपयोगकर्ता ने इसका खंडन किया: ये चरम बिल अधिकांशतः vibe-coder (भावनाओं से कोडिंग करने वाले) द्वारा टोकन जलाने को नज़रअंदाज़ करने के कारण उत्पन्न हुए हैं, और यह सामान्य उपयोग का प्रतिनिधित्व नहीं करता है।

एक पुराने उपयोगकर्ता ने कमेंट सेक्शन में लिखा: "मैं पूरा दिन इसका उपयोग करता हूँ, महीने के अंत में मुझे अतिरिक्त शुल्क नहीं देना पड़ता, यह विश्वास करना मुश्किल है कि यह कार्य की जटिलता का अंतर है।" दूसरा और अधिक सीधा था: "कुछ लोगों को पूरी तरह से स्वचालित YOLO मोड विकास चाहिए, जहाँ AI को कुछ भी करने दिया जाए। ऐसी बर्बादी को हटाने से दूसरों के लिए फायदा होता है।"

एक बात स्पष्ट होनी चाहिए: GitHub ने मासिक शुल्क को समाप्त नहीं किया है, बुनियादी सदस्यता मूल्य अपरिवर्तित रहा है। वास्तविक परिवर्तन अतिरिक्त उपयोग, एजेंट कार्यों और महंगे मॉडल कॉल में है, जिससे अब उपयोग-आधारित बिलिंग शुरू हो गई है।

सबसे अधिक प्रभावित वे भारी एजेंट उपयोगकर्ता हैं जो Copilot का उपयोग लंबी चेन कार्यों के लिए करते हैं।

अपने ही लोगों द्वारा खराब किया गया रैंकिंग

मासिक शुल्क टूट गया, एक ओर प्लेटफॉर्म ने बिलिंग नियम बदल दिए, दूसरी ओर AI का उपयोग करने वाले खुद ही जोरदार खर्च कर रहे हैं।

मई में, बिजनेस इंसाइडर ने रिपोर्ट किया कि अमेज़न ने एक आंतरिक AI उपयोग रैंकिंग, किरोरैंक को हटा दिया।

इस रिपोर्ट में जानकारों के संदर्भ देते हुए कहा गया है कि इस सूची ने एक अजीब कार्य शैली को जन्म दिया है: कुछ कर्मचारी अपनी सूची में स्थिति बढ़ाने के लिए, वास्तविक समस्याओं को हल न करते हुए, केवल रैंकिंग के लिए Token का उपयोग करते हैं।

GitHub

जब यह मामला सामने आया, तो Amazon के सीनियर वाइस प्रेसिडेंट डेव ट्रेडवेल ने सभी को सीधे संबोधित किया: 'AI का उपयोग AI के लिए न करें। इसका उपयोग ग्राहक समस्याओं, व्यापार समस्याओं और नवाचार को हल करने के लिए करें।'

यह थोड़ा अजीब तो है, लेकिन आश्चर्यजनक नहीं है। जब 'टोकन जलाना' लिस्ट में आ जाए, तो कर्मचारी स्वाभाविक रूप से टोकन जलाने लगेंगे।

सिलिकॉन वैली ने इस घटना के लिए एक विशिष्ट नाम दिया है: Tokenmaxxing (टोकन की अधिकतम खपत), जहाँ खपत को उत्पादकता के रूप में माना जाता है।

एक्सियोस की रिपोर्ट में भी उल्लेख किया गया है कि एक सीटीओ ने पाया कि कर्मचारी एआई मॉडल का उपयोग मौसम जानने और दैनिक ईमेल लिखने के लिए कर रहे हैं—ऐसे सरल कार्यों के लिए सबसे महंगे अग्रणी मॉडल का उपयोग करने से बिल चुपचाप बढ़ जाता है।

KiroRank Amazon की औपचारिक मूल्यांकन प्रणाली नहीं है, बल्कि कर्मचारियों द्वारा स्वयं बनाया गया एक अनौपचारिक उपकरण है। लेकिन यह एक पारंपरिक प्रबंधन के नियम को स्पष्ट रूप से उजागर करता है: जब KPI गलत तरीके से सेट किए जाते हैं, तो लोग सबसे बुद्धिमानी से खाई का फायदा उठाने लगते हैं।

"कितना इस्तेमाल किया गया" को "कितना अच्छा किया गया" के बराबर मानना — यही इस चक्र के AI व्यर्थ खर्च का संस्थागत मूल कारण है।

टोकन की गणना करने वाले लोग पहले से ही कमा रहे हैं

टोकन बिल के तनाव के दूसरे पहलू में, कुछ लोग इसे एक व्यवसाय बना रहे हैं।

First path: Feed the AI with context.

Glean अरविंद की अपनी कंपनी है। यह एक उद्योग-आधारित AI सहायक है: यह कंपनी के विभिन्न स्थानों पर बिखरे हुए ज्ञान को एकीकृत करता है, ताकि कर्मचारियों के AI को सीधे संदर्भ मिल सके और उन्हें बिखरे हुए डेटा की तलाश में भटकने की आवश्यकता न हो। AI कम रास्ता तय करता है, इसलिए इसके द्वारा खर्च होने वाले Token भी कम होते हैं।

इस तंत्र के कारण ग्लीन की वार्षिक आय 15 महीनों में तीन गुना हो गई और 3 बिलियन डॉलर का लक्ष्य पार कर गई, जिसमें Databricks, Reddit, Samsung शामिल हैं।

दूसरा रास्ता: काम को सही मॉडल को सौंपें।

मॉडल रूटिंग स्टार्टअप Factory AI यही काम करता है: प्रत्येक कार्य को स्वचालित रूप से सबसे उपयुक्त मॉडल को आवंटित करता है, सरल कार्यों के लिए सस्ते स्तर और जटिल कार्यों के लिए शीर्ष स्तर। अरविंद ने भी कहा था: अगर रूटिंग सही तरीके से की जाए, तो 10 गुना बचत हो सकती है।

दोनों रास्ते एक ही निष्कर्ष पर पहुँचते हैं: AI को काम करने दें, लेकिन इसे बेकार खर्च न करने दें।

Academic research is also laying the foundation for this shift.

GitHub

https://arxiv.org/pdf/2604.22750

2026 की अप्रैल की एक arXiv पेपर ने सिस्टमैटिक रूप से एजेंट कोडिंग टास्क को कैसे पैसा खर्च करता है, इसे पहली बार विघटित किया।

निष्कर्ष 1: एजेंट कार्य के लिए टोकन उपयोग, सामान्य कोड तर्क और कोड डायलॉग की तुलना में हजारों गुना तक पहुँच सकता है, और लागत बढ़ाने का मुख्य कारण इनपुट टोकन है।

निष्कर्ष 2: एक ही कार्य को कई बार चलाने पर, टोकन खपत 30 गुना अंतर हो सकती है।

निष्कर्ष 3: अधिक टोकन खपत आवश्यक रूप से अधिक सटीकता का अर्थ नहीं है। सटीकता अक्सर मध्यम लागत पर शीर्ष पर पहुँचती है—इससे आगे खर्च करने से पैसा बर्बाद होता है और प्रभाव संतृप्त हो जाता है।

अध्ययन ने यह भी पाया कि अग्रणी मॉडल अपने द्वारा खपत किए जाने वाले टोकन की भविष्यवाणी भी नहीं कर पा रहे हैं, और वे सामान्यतः वास्तविक लागत को कम आंक रहे हैं।

आप सोचते हैं कि अधिक पैसा खर्च करने से अधिक काम हो जाएगा। वास्तव में, पैसा खर्च हो जाता है, लेकिन काम बेहतर नहीं होता, और बजट भी सही ढंग से नहीं बनाया जा सकता।

जब AI बिल मानव लागत को पीछे छोड़ने लगे

यह मेरी यादों में पहली बार है कि तकनीकी लागत शुरू हो रही है और मानव संसाधन लागत के बराबर हो रही है।

29 मई को, ग्लीन के सीईओ अरविंद जैन ने CNBC के पत्रकार डीर्ड्रे बोसा के साक्षात्कार में यह कहा।

GitHub

निवेडिया के डीप लर्निंग के वाइस प्रेसिडेंट ब्रायन कैटान्जारो के अवलोकन भी इस बात की पुष्टि करते हैं।

उसने Axios के साक्षात्कार में कहा: उसकी टीम के लिए, हैशरेट लागत पहले से ही कर्मचारी वेतन से कहीं अधिक है।

इसी तरह की घटनाएँ कई कंपनियों में दिख रही हैं: एआई के लिए Glean से लेकर एआई कैलकुलेशन क्षमता बेचने वाली NVIDIA और एआई का उपयोग करने वाली Uber तक, सभी इस खाते को फिर से देख रही हैं।

अरविंद के अनुसार, इतिहास में तकनीक केवल व्यवसाय की कुल लागत का एक छोटा हिस्सा थी, लेकिन अब AI की लागत वेतन पट्टी के बराबर हो गई है, और कई व्यवसायों का वार्षिक AI बजट आमतौर पर एक से दो महीनों में ही समाप्त हो जाता है।

GitHub

पिछले वर्ष, AI के उपयोग की दर एक पूज्य सूचक थी: जितना अधिक उपयोग, उतना ही उन्नत, जितने अधिक टोकन खर्च, उतना ही भविष्य को स्वीकार करना। अब, कई कंपनियाँ उस सरल कथन पर पुनर्विचार कर रही हैं: इन खर्च किए गए टोकन से वास्तव में क्या प्राप्त हुआ?

अभी ठीक इस समय निःशुल्क मासिक उपयोग की अवधि समाप्त हो रही है।

अगला प्रश्न सभी डेवलपर्स के सामने यह है कि कैसे प्रत्येक टोकन का अधिकतम मूल्य निकाला जाए।

भविष्य के वास्तविक विजेता, निश्चित रूप से, वह होगा जो पहले टोकन की गणना सीख लेगा।

संदर्भ:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

यह लेख वेचेन ग्रुप "न्यूज़िज़यन" से आया है, लेखक: ASI उपदेश