2026 की वसंत, उत्तरी अमेरिकी क्लाउड कंप्यूटिंग विशालकाय की रिपोर्ट सीजन एक सामूहिक "पीड़ा का दिन" बन गया।
माइक्रोसॉफ्ट के स्मार्ट क्लाउड डिवीजन की क्वार्टरली आय पहली बार 50 अरब डॉलर से अधिक हो गई, जिसमें एज़्यूर की वार्षिक वृद्धि 39% रही, लेकिन रिपोर्ट जारी होने के बाद शेयर मूल्य में लगभग 10% की गिरावट आई; अमेज़न AWS की आय 13 क्वार्टरों में सबसे तेज़ गति से बढ़ी, लेकिन अगले दिन शेयर मूल्य में 11% की गिरावट आई; गूगल क्लाउड की आय 48% बढ़ी, लेकिन शेयर मूल्य अभी भी बाजार के बाद समय में बढ़त से घटकर गिरा।
कारण एक ही शब्द है: पैसा। या फिर, अनियंत्रित AI बिल।
महान कंपनियों की वार्षिक रिपोर्ट्स देखने पर पता चलता है कि माइक्रोसॉफ्ट ने एक तिमाही में 375 अरब डॉलर का पूंजी खर्च किया, जो पिछले वर्ष की तुलना में 66% बढ़ा है; हालांकि वर्षभर का निर्देश नहीं दिया गया है, लेकिन विश्लेषकों का कहना है कि यदि इस तिमाही के पूंजी खर्च के प्रवृत्ति को जारी रखा जाता है, तो वार्षिक खर्च 1000 अरब डॉलर से अधिक होगा; अमेज़न ने 2026 में 2000 अरब डॉलर का खर्च करने की घोषणा की है; और गूगल ने 1750-1850 अरब डॉलर निवेश करने की योजना बनाई है, जो 2025 के लगभग दोगुना है।
तीन विशालकाय कंपनियों का कुल खर्च 5000 अरब डॉलर से अधिक हो गया, जो नॉर्वे की 2024 की कुल GDP के बराबर है।
बाजार क्या चिंतित है? क्या बादल सेवा का विकास पर्याप्त नहीं है? स्पष्ट रूप से नहीं। जितने अधिक बड़े ग्राहक उपयोग करते हैं, उतनी ही आसानी से क्लाउड विक्रेताओं के बिल "विस्फोट" होने की संभावना बढ़ जाती है। सिलिकॉन वैली में एक "पैसा कैसे वसूलें" पर गुप्त लड़ाई चल रही है। जीत और हार पूरे AI उद्योग के मूल्य वितरण को पुनर्गठित कर देगी।
01 टोकन मॉडल गहरे उपयोगकर्ताओं को दंड देना शुरू कर रहा है?
एक अनदेखा नहीं किया जा सकने वाला तथ्य यह है कि टोकन बिलिंग मॉडल, AI के व्यापक अपनाये जाने का एक प्रमुख कारण बना है।
2024 की शुरुआत में, चीन में दिनभर के औसत टोकन कॉल्स 100 अरब थे; 2025 के अंत तक, यह 100 ट्रिलियन तक पहुंच गया; इस वर्ष मार्च में, यह 140 ट्रिलियन से आगे निकल गया, दो वर्षों में 1000 गुना से अधिक की वृद्धि हुई।
इसी समय, "क्रैफिश" के बढ़ते लोकप्रियता के साथ, AI "खिलौना" से "उत्पादन उपकरण" बन गया है, और टोकन मॉडल के नुकसान सामने आने लगे हैं।
एक एआई एजेंट के उदाहरण के रूप में, एक पारंपरिक चैटबॉट एक प्रश्न के उत्तर देने में कुछ सौ से कुछ हजार टोकन खर्च करता है। लेकिन एक स्वतंत्र रूप से कार्य पूरा करने में सक्षम एआई एजेंट को प्रत्येक कार्य के लिए कई चरणों का तर्क, बार-बार उपकरणों का उपयोग, और बड़ी मात्रा में संदर्भ पढ़ना आवश्यक होता है। उद्योग विशेषज्ञों के अनुसार, एजेंट का टोकन उपयोग आमतौर पर कई गुना बढ़ जाता है, और जटिल कार्यों के मामले में यह सामान्य संवाद की तुलना में सौ या हजार गुना हो सकता है।
OpenAI ने मार्च 2026 में वीडियो जनरेशन टूल Sora को बंद कर दिया, जिसमें से एक कारण लागत की तुलना में आय कम होना था। न्यू जिंगबाओ ने विश्लेषण संस्थान SemiAnalysis के अनुमान का हवाला देते हुए कहा कि Sora की दैनिक संचालन लागत लगभग 15 मिलियन डॉलर है और वार्षिक लागत 54 अरब डॉलर है।
OpenAI के प्रोजेक्ट लीड ने सीधे कहा था: "वर्तमान आर्थिक मॉडल पूरी तरह से अस्थायी है।" वीडियो जनरेशन की कैलकुलेशन खपत पाठ और चित्र जनरेशन से कहीं अधिक है; एक बार वीडियो जनरेशन के लिए आवश्यक GPU संसाधन, ChatGPT को दर्जनों प्रश्नों के उत्तर देने के लिए पर्याप्त हैं, जिससे मुख्य व्यवसाय संसाधनों पर गंभीर दबाव पड़ता है।
टोकन मोड में, जितना अधिक AI का उपयोग किया जाएगा, उतना ही बिल अनियंत्रित होता जाएगा। न्वीडिया के सीईओ हुआंग रेन्शुन ने यहां तक कहा कि भविष्य में न्वीडिया के हर इंजीनियर के पास अपना “वार्षिक टोकन बजट” होगा, और अगर एक उच्च वेतन प्राप्त इंजीनियर एक साल में कम टोकन खर्च करता है, तो वह अजीब लगेगा।
एक उद्योग जब "जितना अधिक उपयोग, उतनी ही अधिक डर" तक पहुँच जाता है, तो यह दर्शाता है कि शुल्क मॉडल में मूलभूत समस्या है।
जितना आप उपयोग करते हैं, उतना मुझे अधिक कमाई होती है, यह बहुत अच्छा लगता है। लेकिन बड़े ग्राहक जो AI बिल में भारी उतार-चढ़ाव का सामना करते हैं, उनके CFO बड़े पैमाने पर बजट को मंजूरी नहीं देते। टोकन मॉडल उन्हें सबसे ज्यादा दंड दे रहा है जिन्हें वह सबसे ज्यादा बरकरार रखना चाहते हैं: जो सबसे अधिक उपयोग करते हैं और सबसे गहरे स्केल पर काम करते हैं। यह क्लाउड प्रोवाइडर्स की लंबे समय तक के लाभ के साथ विपरीत है।
इस संदर्भ में, उत्तरी अमेरिकी क्लाउड फर्मों द्वारा लागू किए गए नए हथियार PTU कहलाते हैं: प्री-अलोकेटेड थ्रूपुट यूनिट।
सरल शब्दों में, ग्राहक एक निश्चित मात्रा में कैलकुलेशन क्षमता को पहले से खरीदता है और इसके लिए मासिक, त्रैमासिक या वार्षिक आधार पर एक निश्चित शुल्क देता है, जो वास्तविक Token खपत से स्वतंत्र होता है। Token मॉडल "जितना खाओ, उतना भुगतान करो" है, जबकि PTU "मासिक स्व-सेवा भोज" है। ग्राहक को लागत की निश्चितता प्राप्त होती है, और क्लाउड प्रदाता को ग्राहक संबंधों की बंधकता प्राप्त होती है।
इसके पीछे का खेल का तर्क पूरी तरह से बदल गया है।
टोकन मोड में, दोनों पक्षों के बीच "शून्य योग खेल" होता है, ग्राहक का पैसा बचाना बराबर है क्लाउड फैक्ट्री के लाभ में कमी के, और ग्राहक का अधिक खर्च करना बराबर है क्लाउड फैक्ट्री के लाभ में वृद्धि के। लेकिन बड़े ग्राहक लागत नियंत्रण से डरकर उपयोग कम कर देते हैं, जिससे क्लाउड फैक्ट्री की आय में वृद्धि अपेक्षित से कम होती है।
PTU मोड में, खेल "पॉजिटिव-सम" बन गया है, ग्राहक अपने बजट को बंद करने के बाद AI के उपयोग को बढ़ाने के लिए साहस करते हैं, जिससे क्लाउड फैक्ट्री की आय का विकास अधिक स्थायी हो जाता है। मूलतः, यह जोखिम को ग्राहक की ओर से क्लाउड फैक्ट्री की ओर स्थानांतरित करता है, ताकि ग्राहक संबंधों को गहराई से बांधा जा सके।
गुओशिन सेक्युरिटीज ने मोबाइल इंटरनेट शुल्क में परिवर्तन की तुलना की है।
2G काल में, डेटा की गणना KB में होती थी, 0.01 रुपये/KB, उपयोगकर्ता डेटा का उपयोग करते समय मानो खून बहा रहे हों। 3G काल में, शुल्क MB पर स्थानांतरित हो गया, 150 रुपये में 3GB, उपयोगकर्ता अब आज़ादी से डेटा का उपयोग करने लगे। 4G काल में, "तेज़ी और कम शुल्क" के साथ असीमित डेटा प्लान का पूर्ण विस्फोट हुआ, जैसे 2016 में टेंसेंट का "डेव बिल" 19 रुपये प्रति माह, टेंसेंट-संबंधित ऐप्स के लिए डेटा मुफ्त, उपयोगकर्ता पूरी तरह से "डेटा खरीदने" से "सेवा खरीदने" की ओर बदल गए। 5G काल में, शुल्क आगे "दर के आधार पर स्तरीकृत" हो गया, डेटा की मात्रा अब मूल्य निर्धारण का केंद्र नहीं है।
हर बिलिंग मॉडल में बदलाव, एक श्रृंखला के नियंत्रण के पुनर्वितरण का एक अवसर है। ऑपरेटर्स ने “प्रति KB शुल्क” के लाभकारी मॉडल को छोड़ दिया, जिससे उपयोगकर्ताओं का मासिक औसत डेटा उपयोग 30MB से बढ़कर 10GB से अधिक हो गया, और केक का कुल आकार सैकड़ों गुना बढ़ गया।
आज के बादल प्रदाताओं का चयन, उस समय के ऑपरेटरों के समान है। वे लघुकालीन शुद्ध लाभ मार्जिन की बलि देने को तैयार हैं, ताकि दीर्घकालिक अनुबंधों की निश्चितता प्राप्त कर सकें। गुओशेन सेक्यूरिटीज की अनुसंधान रिपोर्ट के अनुसार, PTU के परिवर्तन से बादल व्यवसाय का शुद्ध लाभ मार्जिन संरचना “उच्च लचीलापन वाली उतार-चढ़ाव” से “उच्च लचीलापन” की ओर बदलेगा, अर्थात् लघुकालीन दबाव, लेकिन दीर्घकाल में अधिक स्वस्थ और स्थिर।
02 ट्राइड के खेल का अलग तरीका
माइक्रोसॉफ्ट, एडब्ल्यूएस और गूगल, तीनों विशालकाय, बाहरी रूप से PTU को बढ़ावा दे रहे हैं, लेकिन उनकी अंतर्निहित रणनीति पूरी तरह से अलग है।
माइक्रोसॉफ्ट की ताकत इकोसिस्टम के बंधन पर है। माइक्रोसॉफ्ट का हथियार Windows, Office 365, GitHub से बना विशाल इकोसिस्टम है। यह "Azure AI Commitment Program" लॉन्च करके व्यावसायिक ग्राहकों को 1-3 साल के खपत प्रतिबद्धता अनुबंध पर हस्ताक्षर करने के लिए प्रोत्साहित करता है। इस तिमाही में, माइक्रोसॉफ्ट की व्यावसायिक शेष प्रतिबद्धता 6250 अरब डॉलर तक बढ़कर पिछले साल की तुलना में दोगुनी से अधिक हो गई। इसमें से 45% OpenAI के 2500 अरब डॉलर के नए समझौतों से आया।
माइक्रोसॉफ्ट की गणना बहुत सूक्ष्म है, सर्वोच्च बिक्री शक्ति यह है कि ग्राहक AI लागत को अलग से निकाल न सके। जब AI Word में एक बटन बन जाता है, तो बजट स्वतः सॉफ्टवेयर सदस्यता शुल्क में मिल जाता है। हालाँकि, एकल ग्राहक पर अत्यधिक निर्भरता बाजार में चिंता का कारण बनती है, क्योंकि अगर OpenAI का संचालन कठिनाई में पड़ता है, तो इसका प्रभाव सीधे माइक्रोसॉफ्ट पर पड़ेगा।
AWS की ताकत लागत के लाभ पर निर्भर करती है। AWS का आत्मविश्वास अपने स्वयं विकसित Trainium और Inferentia चिप्स और वैश्विक स्तर पर सबसे बड़े क्लाउड इंफ्रास्ट्रक्चर स्केल पर है। यह ग्राहकों को ऑन-डिमांड पेमेंट की तुलना में काफी अधिक छूट वाली कीमतें प्रदान करने के लिए "AI/ML सेविंग्स प्रोग्राम" को बढ़ावा दे रहा है।
अमेज़न के सीईओ एंडी जासी ने आय पत्रक परिचय में बहुत कठोर बयान दिया: "1420 अरब डॉलर की वार्षिक आय पर 24% की वार्षिक वृद्धि प्राप्त करना, और प्रतिद्वंद्वी जो स्पष्ट रूप से कम आधार पर अधिक प्रतिशत वृद्धि प्राप्त कर रहे हैं, इन दोनों के बीच पूर्ण अंतर है।"
AWS अपनी चरम आपूर्ति श्रृंखला की दक्षता के साथ एक रक्षात्मक ढाल बनाता है, यह मूल्य युद्ध से नहीं डरता क्योंकि इकाई कैलकुलेशन लागत पहले से ही उद्योग की सबसे कम है। अर्जित विवरण की बैठक में, प्रबंधन ने बार-बार "नए कैलकुलेशन क्षमता को त्वरित रूप से राजस्व में बदला जा सकता है" पर जोर दिया। इसका मतलब है कि यह साइज़ के प्रभाव पर निर्भर करता है, जो अंततः सब कुछ पर विजय प्राप्त करेगा।
और गूगल इसके प्रदर्शन प्रीमियम पर निर्भर करता है। गूगल के पास AI तकनीक में सबसे अधिक अनुभव है, जिसका स्वयं विकसित TPU सातवें संस्करण तक पहुँच चुका है, और Gemini मॉडल के 75 करोड़ मासिक सक्रिय उपयोगकर्ता हैं। चौथे तिमाही में गूगल क्लाउड की आय 48% बढ़ी, जो प्रतिद्वंद्वियों की तुलना में कहीं अधिक तेज़ है।
गूगल ने AI प्लेटफॉर्म पर "छूट का उपयोग करने का वादा" बढ़ाया है, जिससे प्रदर्शन के लिए अत्यधिक आवश्यकता वाले ग्राहकों को आकर्षित किया जा रहा है। यह तकनीकी लक्जरी रास्ता अपना रहा है, जिसमें अधिकतम ग्राहकों की बजाय सबसे लाभदायक उच्च-अंत ग्राहकों को अपने साथ बांधे रखने का लक्ष्य है।
Apple के साथ साझेदारी एक महत्वपूर्ण कदम है: Google Apple की पसंदीदा क्लाउड सेवा प्रदाता बन गया है, और दोनों कंपनियाँ आधारभूत मॉडल विकसित कर रही हैं, जिससे Google की AI तकनीक Apple उपकरणों के माध्यम से वैश्विक उपयोगकर्ताओं तक पहुँचेगी।
तीन रणनीतियाँ तीन अलग-अलग आर्थिक खाई को दर्शाती हैं: माइक्रोसॉफ्ट ट्रांसफर कॉस्ट पर, AWS स्केल इफेक्ट पर, और गूगल तकनीकी अग्रणीता पर। यह निर्धारित करने के लिए कि कौन सी कंपनी PTU रूपांतरण से सबसे अधिक लाभ उठाएगी, मुख्य बात यह है कि उसकी खाई का प्रकार लंबे समय तक के अनुबंध बंधन के दौरान प्रभावी रह सकता है या नहीं।
हालांकि, PTU के रूपांतरण का प्रभाव बादल प्रदाताओं और बड़े ग्राहकों तक सीमित नहीं होगा, यह श्रृंखला के माध्यम से ऊपर की ओर चिप निर्माताओं और नीचे की ओर अनुप्रयोग विक्रेताओं तक प्रसारित होगा।
ऊपरी चिप आपूर्तिकर्ता सबसे पहले लाभान्वित होते हैं। टोकन मॉडल में, क्लाउड फर्म की कैलकुलेशन की खरीद “पल्सेटिंग” होती है—जब ट्रैफिक में अचानक वृद्धि होती है तो तत्काल ऑर्डर बढ़ाया जाता है, और निम्न बिंदु पर संसाधन अव्यवहारित रहते हैं। PTU मॉडल में, दीर्घकालिक अनुबंध के कारण क्लाउड फर्म ऊपरी आपूर्तिकर्ता को अधिक समान और अधिक भविष्यवाणीयोग्य ऑर्डर देने के लिए साहसी बनते हैं।
माइक्रोसॉफ्ट 2026 के भीतर एआई कैलकुलेशन क्षमता में 80% से अधिक की वृद्धि की योजना बना रहा है, और अगले दो वर्षों में डेटा सेंटर का आकार दोगुना हो जाएगा। न्विडिया जैसे चिप निर्माताओं की उत्पादन योजनाएँ अब अधिक सुविधाजनक होंगी, और सप्लाई चेन की कुशलता में महत्वपूर्ण सुधार हुआ है।
निचले स्तर के AI एप्लीकेशन विक्रेता तेजी से बदलाव का सामना कर रहे हैं; PTU मॉडल के तहत, बड़े ग्राहकों द्वारा संसाधनों को बंद कर लिए जाने से छोटे और मध्यम ग्राहकों के संसाधन स्तर प्रभावित हो सकते हैं। AI एप्लीकेशन के लिए शुरुआती बाधाएँ बढ़ रही हैं; जिन परियोजनाओं को पहले Token के आधार पर आवश्यकता के अनुसार भुगतान करके शुरू किया जा सकता था, उन्हें भविष्य में अधिक शुरुआती लागत का सामना करना पड़ सकता है। इसी समय, ग्राहकों की PTU उपयोगदक्षता को बेहतर बनाने में मदद करने वाली टूल-लेयर कंपनियाँ—जैसे AI लोड स्केड्यूलिंग, लागत प्रबंधन SaaS—को संरचनात्मक अवसर प्राप्त होंगे।
गुओशिन सेक्युरिटीज की रिपोर्ट के अनुसार, मूल्य निर्धारण मॉडल में परिवर्तन एक मोड़ के बिंदु पर है, और अगले वर्ष तक परिवर्तन के प्रभाव के अवशोषण के बाद, ऑर्डर लंबी अवधि के समझौतों की दिशा में बढ़ोतरी से आय और लाभ में वृद्धि की निश्चितता में काफी वृद्धि होगी।
03 समापन
टोकन से PTU में बदलाव, AI उद्योग को "अनियंत्रित विकास" के प्रयोगात्मक चरण से "सूक्ष्म विकास" के व्यावसायिक परिपक्व चरण में ले जाता है।
मोबाइल इंटरनेट के शुरुआती दिनों में KB के आधार पर शुल्क लिए जाने से लेकर अब असीमित डेटा तक के यात्रा को देखें—यह मूल्य निर्धारण मॉडल के परिपक्व होने के कारण ही शॉर्ट वीडियो, लाइवस्ट्रीमिंग, क्लाउड गेमिंग जैसे ट्रिलियन डॉलर के बाजारों का जन्म हुआ। आज AI के लिए शुल्क निर्धारण की पीड़ा, अगले “डायन्शी-स्तरीय” AI-नेटिव ऐप के लिए रास्ता तैयार कर रही है।
बेशक, PTU अंत नहीं होगा। मॉडल एस ए सर्विस (MaaS) के उदय के साथ, AI बिलिंग आगे "व्यापार परिणाम के आधार पर भुगतान" की ओर विकसित हो सकती है। मूल्य निर्धारण का खेल, AI उद्योग के विकास को समझने की केंद्रीय रेखा है।
इस प्रक्रिया में, वास्तविक विजेता वे होंगे जो "क्लाइंट को बंधन में रखना" को "क्लाइंट की सेवा करना" बना देंगे, जब मूल्य निर्धारण का अधिकार शून्य-योग खेल से सकारात्मक-योग सहयोग की ओर जाएगा, तभी AI के व्यावसायिकीकरण की वयस्कता की परीक्षा पूरी होगी।
यह लेख वेचेन ग्रुप "मार्केट कैप बैंक" (ID: shizhibang2021) से आया है, लेखक: मार्केट कैप बैंक टीम
