विदेशी मीडिया फॉर्च्यून ने टिप्पणी की कि कंपनियों में एक समय पर लोकप्रिय "tokenmaxxing" का रुझान शांत हो रहा है। tokenmaxxing का अर्थ है कि कर्मचारियों या टीम द्वारा AI मॉडल को कॉल किए जाने वाले टोकन की संख्या को नवाचार के स्तर और कार्यक्षमता का अनुमानित सूचक माना जाता है। हालाँकि, बिल बढ़ने और अनावश्यक कॉल्स में वृद्धि के साथ, इस प्रथा को बढ़ती संख्या में कंपनियाँ सख्त कर रही हैं।
लेख में उल्लेख किया गया है कि पहले मेटा, अमेज़न, ओपनएआई जैसी कंपनियों ने आधिकारिक या अनौपचारिक तरीके से टोकन रैंकिंग की प्रथा अपनाई थी, जिससे इंजीनियर्स को मॉडल के उपयोग की मात्रा के आधार पर प्रतिस्पर्धा करने के लिए प्रोत्साहित किया जाता था। समस्या यह है कि जब मापदंड स्वयं आकलन का लक्ष्य बन जाता है, तो यह मूल उद्देश्य से भटक जाता है। ब्रिटिश फाइनेंशियल टाइम्स ने पहले रिपोर्ट किया था कि अमेज़न के कुछ कर्मचारियों ने AI एजेंट्स को ऐसे कार्य करवाए थे, जिनका वास्तविक अर्थ नहीं था, केवल उपयोग के डेटा के प्रदर्शन को बनाए रखने के लिए।
लागत का दबाव दिखने लगा है
जब जनरेटिव AI का उपयोग उद्यमों में व्यापक रूप से फैल रहा है, तो मॉडल कॉल की लागत तेजी से बढ़ रही है। लेख में कहा गया है कि कुछ कंपनियाँ अपने कर्मचारियों के तीसरे पक्ष के AI एजेंट्स के उपयोग पर प्रतिबंध लगाना शुरू कर चुकी हैं, विशेष रूप से उच्च-अंत मॉडल पर निर्भर टूल्स। मेटा ने कर्मचारियों द्वारा स्वयं बनाए गए Token रैंकिंग को हटा दिया है; The Verge की रिपोर्ट के अनुसार, माइक्रोसॉफ्ट ने कई महत्वपूर्ण उत्पाद विभागों के कर्मचारियों के Claude Code सब्सक्रिप्शन को रद्द कर दिया है।
यूबर ने भी उजागर किया कि कंपनी ने 2026 के पहले चार महीनों में ही पूरे वर्ष का टोकन बजट खत्म कर दिया, जिसमें से कुछ खर्च Claude Code के उच्च आवृत्ति उपयोग से आया। सेल्सफोर्स के सीईओ मार्क बेनिऑफ ने कहा कि कंपनी इस वर्ष एंथ्रोपिक को लगभग 3 अरब डॉलर का भुगतान करेगी और भविष्य में अधिक बुद्धिमान रूटिंग प्रणाली की इच्छा रखती है, जो विभिन्न अनुरोधों को लागत के अनुकूल मॉडल पर वितरित कर सके।
बिजनेस रिजल्ट्स पर अधिक ध्यान दिया जाता है
लेख के अनुसार, कंपनियों द्वारा टोकन सूचकांकों को संकुचित करने का मुख्य कारण केवल खर्च कम करना नहीं है, बल्कि निवेश और लाभ के बीच का अंतर है। यूबर के मुख्य संचालन अधिकारी एंड्रू मैकडॉनल्ड ने हाल ही में कहा कि कंपनी के लिए कुछ कर्मचारियों की दक्षता में सुधार को प्रत्यक्ष रूप से उपयोगकर्ताओं के लिए नए फीचर्स के वितरण या समग्र व्यापार परिणामों से जोड़ना मुश्किल है। यदि स्पष्ट व्यापार परिणाम प्राप्त नहीं होते हैं, तो मॉडल की लागत को लगातार उचित साबित करना और भी कठिन हो जाता है।
इसीलिए टोकन उपयोग का केवल ट्रैक करना, एक प्रभावी प्रबंधन उपकरण के रूप में अब और अधिक कठिन होता जा रहा है। यह कॉल के पैमाने को दर्शा सकता है, लेकिन यह नहीं बता सकता कि ये कॉल वास्तव में उत्पाद, प्रक्रिया या आय में सुधार कर रहे हैं या नहीं।
वास्तविक लाभ प्रक्रिया पुनर्गठन से आता है
लेख में Exponential View के लेखक अज़ीम अज़हर के विचार का उल्लेख किया गया है कि वर्तमान में AI निवेश और उत्पादकता के बीच का असंगति एक नए सामान्य प्रौद्योगिकी के प्रारंभिक चरण में सामान्यतः देखी जाने वाली “उत्पादकता J-वक्र” के समान है। व्यवसाय अपने प्रयोगात्मक चरण में पहले प्रयोगों की लागत बढ़ाते हैं, लेकिन छोटे समय के लिए स्पष्ट लाभ नहीं देखते, केवल तभी दक्षता में वृद्धि स्पष्ट रूप से प्रकट होती है जब व्यवसाय प्रक्रियाओं को पुनः डिज़ाइन किया जाता है।
बिजली के उन्नयन वाले कारखाने के उदाहरण के साथ समझाया गया है कि कंपनियाँ शुरू में केवल रोशनी या बिजली के स्रोत को बदलती हैं, लेकिन वास्तविक उत्पादकता में महत्वपूर्ण वृद्धि तभी होती है जब कारखाने की व्यवस्था और एकल उपकरणों को नई प्रौद्योगिकी के चारों ओर पुनः डिज़ाइन किया जाता है। AI के संदर्भ में, कई कंपनियाँ अभी भी सीमित परीक्षण या उपकरणों के संयोजन के चरण पर हैं, और अभी तक गहरे स्तर पर प्रक्रिया पुनर्निर्माण में नहीं आई हैं।
टिप्पणियों के अनुसार, टोकन उपयोग प्रतियोगिता के पीछे का मूल कारण यह है कि यह "कितना उपयोग किया गया" को हल करती है, न कि "क्या बनाया गया"। व्यवसायों के लिए, AI का मूल्य अंततः मॉडल कॉल रैंकिंग के बजाय उत्पाद वितरण, व्यावसायिक मॉडल और आय प्रदर्शन पर निर्भर करता है।
