बढ़ते AI टोकन की लागत के कारण कंपनियाँ लागत नियंत्रण पर ध्यान केंद्रित कर रही हैं

CoinDesk द्वारा रिपोर्ट किया गया:

एआई उपकरणों के व्यापक रूप से अपनाए जाने के बाद, नए समस्याएँ सामने आने लगी हैं: मॉडल पर्याप्त शक्तिशाली नहीं हैं, बल्कि बिल बहुत तेजी से बढ़ रहे हैं। कई प्रौद्योगिकी और इंटरनेट कंपनियों ने पाया कि, हालाँकि प्रति टोकन की कीमत में कमी आई है, लेकिन एआई कोडिंग, स्वचालित सहायक और स्मार्ट एजेंट उपकरणों के प्रसार के कारण कुल खपत तेजी से बढ़ रही है।

कई कंपनियों के बजट का पहले से ही उपयोग किया जा चुका है

टेकक्रंच के अनुसार, कुछ कंपनियाँ 2026 के AI बजट वर्ष में जल्दी ही अपना बजट खत्म कर चुकी हैं। यूबर ने अप्रैल तक पूरे वर्ष का AI कोडिंग बजट खर्च कर लिया; माइक्रोसॉफ्ट ने कुछ डेवलपर्स के Claude Code उपयोग की अनुमति को कुछ महीनों बाद रद्द कर दिया; प्राइसलाइन के एक कर्मचारी के अनुसार, Cursor की नियमित नवीनीकरण पेशकश पहले से 4 से 5 गुना अधिक है।

यह परिवर्तन पिछले कुछ महीनों में अधिक शक्तिशाली मॉडल के लॉन्च से संबंधित है। एंथ्रोपिक, ओपनएआई और गूगल ने पिछले नवंबर के बाद एजेंट स्थितियों के लिए अधिक उपयुक्त नए मॉडल लॉन्च किए, जिससे उपयोग की मात्रा आगे बढ़ी। एक कंपनी ने अपने कर्मचारियों के उपयोग के लिए कोई सीमा नहीं रखी, जिसके कारण क्लॉड का 5 अरब डॉलर का बिल आया।

Productivity gains may not cover costs

OpenAI के उद्योग व्यवसाय के प्रमुख एलेक्सेंडर एम्ब्र ने कहा कि छह महीने पहले ग्राहक अधिक चिंतित थे कि मॉडल क्षमता पर्याप्त है या नहीं, अब चर्चा का केंद्र व्यय की दृश्यता, ऑडिट क्षमता, टोकन नियंत्रण और मॉडल की दक्षता पर स्थानांतरित हो गया है। उद्योगों द्वारा AI की खरीद की समस्या, "यह क्या कर सकता है" से "कितना खर्च हुआ, क्या यह मूल्यवान है" में बदल रही है।

AI कोडिंग टूल्स के रिटर्न ऑन इन्वेस्टमेंट के चारों ओर, उद्योग फिर से गणना कर रहा है। मार्च में Faros AI द्वारा 20,000 डेवलपर्स पर किए गए सर्वेक्षण में पाया गया कि डेवलपमेंट आउटपुट बढ़ रहा है, लेकिन बग और पुनर्निर्माण भी बढ़ रहे हैं। इंजीनियरिंग मैनेजमेंट प्लेटफॉर्म Jellyfish के अध्ययन से पता चलता है कि AI का भारी उपयोग करने वाले इंजीनियरों की उत्पादकता निम्न उपयोगकर्ताओं की तुलना में लगभग दोगुनी है, लेकिन Token की खपत 10 गुना अधिक है।

भारी AI उपयोगकर्ताओं की उत्पादकता निम्न उपयोगकर्ताओं की तुलना में लगभग दोगुनी होती है
Corresponding token consumption is approximately 10 times higher
एकल डेवलपर ने 9 महीनों में उपभोग में लगभग 18.6 गुना की वृद्धि की

कॉस्ट मैनेजमेंट टूल तेजी से आकार ले रहे हैं

बिल समस्याओं के विस्तार के साथ, AI लागत प्रबंधन के लिए उपकरणों के बाजार में भी गर्मी आ रही है। लिनक्स फाउंडेशन ने इस सप्ताह Tokenomics Foundation की स्थापना की तैयारी शुरू करने की घोषणा की है, जो बाद में FinOps की तरह, AI Token खर्चों के लिए एक समान भाषा और प्रबंधन मानक स्थापित करना चाहता है।

इस संगठन की योजना है कि टोकन उपयोग और बिलिंग के लिए खुले मानक, एकीकृत सूचकांक, और लागत कुशलता से संबंधित नए मापदंड जैसे “प्रति इकाई स्मार्ट लागत” या “प्रति वाट टोकन” विकसित करे। आधिकारिक शुरुआत का अनुमान जुलाई में है, और अगले सप्ताह के FinOps X सम्मेलन में अधिक सदस्यों की घोषणा की जाएगी।

इसी बीच, स्टार्टअप और परिपक्व निर्माता दोनों अपनी निवेश रणनीति को तेज कर रहे हैं। Pay-i, Paid जैसी कंपनियाँ AI लागत ट्रैकिंग, मापन और अनुकूलन पर ध्यान केंद्रित कर रही हैं; Jellyfish, Waydev, Faros AI AI स्मार्ट एजेंट मॉनिटरिंग सेवाएँ प्रदान करती हैं; Ramp, Datadog और New Relic भी AI खर्च प्रबंधन, टोकन-स्तरीय दृश्यता और GPU मॉनिटरिंग क्षमताओं को बढ़ा रहे हैं।

मॉडल रूटिंग लागत कम करने की दिशा बन गया है

कुछ निवेशक और व्यवसाय अधिकारी मानते हैं कि भविष्य में ऐसी क्षमताएँ अधिकतर एप्लिकेशन लेयर या मॉडल राउटिंग लेयर पर दिखाई देंगी। उदाहरण के लिए, इस हफ्ते व्यवसाय AI स्टार्टअप Factory ने मॉडल राउटर लॉन्च किया, जो कार्य के आधार पर स्वचालित रूप से अधिक उपयुक्त मॉडल का चयन करता है, ताकि कॉल लागत कम हो सके। कुछ व्यवसायों के बिलों में पहले से ही ऐसी प्रक्रिया शामिल है, जहाँ उच्च-स्तरीय मॉडल को कॉल करने पर भी सिस्टम कुछ अनुरोधों को सस्ते मॉडल पर सौंप देता है।

अतिरिक्त जानकारी: गोल्डमैन सैक्स का अनुमान है कि 2030 तक वैश्विक टोकन उपयोग 24 गुना बढ़ जाएगा। उच्च निवेश चरण में प्रवेश कर चुके उद्यमों के लिए, AI के उपयोग को बढ़ाते हुए लागत को कैसे नियंत्रित किया जाए, अगले चरण के लिए एक वास्तविक समस्या बन गया है।