हैशरेट की कमी
पिछले साल के अंत से, मोएर टेक्नोलॉजी, मू ज़ी शेयर्स, बिरेन टेक्नोलॉजी, टियनशु इंटेलिजेंट चिप जैसे घरेलू GPU ने पूंजी की लहर को उठाया है। हालांकि, द्वितीयक बाजार के संपत्ति के उत्सव के नीचे, एक अनदेखी लेकिन स्पष्ट रेखा धीरे-धीरे स्पष्ट हो रही है, जिसके कारण उत्पन्न समस्याएं अधिक तीव्र हो रही हैं।
पिछले कुछ वर्षों में, भारतीय AI चिप्स मुख्य रूप से अपेक्षाकृत सुरक्षित और अधिक किनारे वाले "इन्फरेंस साइड" पर केंद्रित रहे हैं, जैसे कि हाल ही में डोउबाओ योजना ने इस चीन के सबसे बड़े AI ऐप टर्मिनल की उच्च आवृत्ति वाली मांग को पूरा करने के लिए इन्फरेंस कॉम्प्यूटिंग कार्यों के लिए 50,000 चिप्स खरीदने की घोषणा की है।
और AI प्रशिक्षण के इस कैलकुलेशन पिरामिड के शीर्ष अनुक्रम में, घरेलू चिप्स वर्तमान में केवल किनारे के "सहायता" कार्यों में ही भाग ले सकते हैं।
AI ट्रेनिंग चिप्स का उपयोग मुख्य रूप से कृत्रिम बुद्धिमत्ता मॉडल के ट्रेनिंग के लिए किया जाता है, जिसमें बड़ी मात्रा में मैट्रिक्स ऑपरेशन और पैरामीटर एडजस्टमेंट होते हैं, इसलिए इन्हें शक्तिशाली कैलकुलेशन क्षमता और उच्च ऊर्जा कुशलता की आवश्यकता होती है; इनमें न्यूडिया A100, H100, H200 और AMD के MI300 सीरीज़ जैसे उत्पाद शामिल हैं;

तुलना में, निष्कर्ष चिप का कार्य काफी हल्का होता है। यह मॉडल प्रशिक्षण के बाद डिप्लॉयमेंट चरण के लिए उपयोग किया जाता है और मुख्य रूप से मॉडल के निष्कर्षण कार्यों को निष्पादित करता है, जिसकी वास्तविक समय आवश्यकता अधिक होती है; निष्कर्ष चिप को सटीकता को बनाए रखते हुए तेज प्रतिक्रिया और कम बिजली खपत की क्षमता होनी चाहिए।
एक उपयुक्त उपमा यह है कि प्रशिक्षण AI मॉडल को "ज्ञान सीखने" के लिए किया जाता है, जबकि निष्कर्षण में बड़े मॉडल "ज्ञान का उपयोग" करते हैं। अध्ययन चरण में, प्रशिक्षण चिप्स को अरब, खरब और यहां तक कि दस खरब पैरामीटर के डायनामिक अपडेट के लिए विशाल मात्रा में डेटा "पोषित" करना होता है, जिसमें शक्तिशाली कैलकुलेशन क्षमता के साथ-साथ कुशल बैंडविड्थ और संचार क्षमता की आवश्यकता होती है, और लाखों कार्ड के क्लस्टर में स्थिरता की गारंटी भी होनी चाहिए।
चीन और संयुक्त राज्य अमेरिका के मॉडल के बीच अंतर की जड़ इन "अदृश्य" स्थानों में है, विशेष रूप से उच्च-अंत प्रशिक्षण चिप्स की कमी के कारण।
बड़े मॉडल के स्केलिंग नियम के तहत, जितना अधिक मॉडल पैरामीटर होते हैं, उतना ही अधिक कैलकुलेशन की आवश्यकता होती है, और घातीय रूप से बढ़ती कैलकुलेशन और हार्डवेयर लागत के कारण, बड़े मॉडल को ट्रेन करना केवल कुछ ही टेक गिगंट्स के लिए "विशेष खेल" बन गया है।
अमेरिकी टेक दिग्गजों में, केवल मेटा अपने 2026 के अंत तक 12 लाख से अधिक उच्च-अंत GPU तैनात करने की योजना बना रहा है, जिसका वार्षिक निवेश 1450 अरब डॉलर से अधिक है; अनुमानों के अनुसार, गूगल के पास 50 लाख निवेडिया H100 के समतुल्य AI कुल प्रसंस्करण क्षमता है, जो विश्व की कुल क्षमता का एक-चौथाई हिस्सा है।
इस वर्ष, अमेज़न, माइक्रोसॉफ्ट, अल्फाबेट और मेटा चार कंपनियों द्वारा 7250 अरब डॉलर का पूंजी खर्च किया गया है, जो पिछले वर्ष की तुलना में 77% की तेजी से बढ़ा है, जो संयुक्त राज्य अमेरिका के पूरे वर्ष के निजी आंतरिक निवेश के 13% के बराबर है। मॉर्गन स्टेनले ने भविष्यवाणी की है कि 2027 तक, संयुक्त राज्य अमेरिका के टेक कंपनियों का पूंजी खर्च 1.1 ट्रिलियन डॉलर के ऐतिहासिक रिकॉर्ड तक पहुंच सकता है।
अभी संयुक्त राज्य अमेरिका विश्व के 70% से अधिक उच्च-अंत GPU पर काबिज है, चिप प्रतिबंध के बाद देश में उपलब्ध उच्च-अंत चिप्स केवल अमेरिका के 1/8 हैं। स्टैनफोर्ड AI सूचकांक रिपोर्ट 2026 में बताया गया है कि संयुक्त राज्य अमेरिका में डेटासेंटर की संख्या (5427) चीन से 10 गुना अधिक है।

चीनी सूचना और संचार अकादमी (CAICT) के अनुसार, 2025 की शुरुआत तक, संयुक्त राज्य अमेरिका की कैलकुलेशन क्षमता 2400 EFLOPS है, जबकि चीन की 1053 EFLOPS है, जो संयुक्त राज्य अमेरिका की चीन की तुलना में दो से अधिक है।

उपरोक्त चार टेक गायंट्स के पास जो कैलकुलेशन क्षमता है, उसमें से प्रत्येक अकेला चीन की सभी AI कंपनियों के योग से अधिक है।
इस भारी गणना क्षमता के लाभ के कारण, अमेरिकी कंपनियाँ एक वर्ष में दर्जनों बड़े मॉडल इटरेशन प्रयोग पूरे कर सकती हैं।
मस्क और भी अधिक शानदार हैं, जिनके अधीन xAI के पास "दुनिया का पहला GW स्तरीय AI क्लस्टर" कहलाने वाला Colossus 2 है। इसलिए वह दावा कर सकते हैं कि वे एक साथ 7 मॉडल ट्रेन कर रहे हैं—दो 1 ट्रिलियन, दो 1.5 ट्रिलियन, एक 6 ट्रिलियन और एक 10 ट्रिलियन पैरामीटर मॉडल, यह "बलवान सौंदर्य" केवल तभी संभव है जब कैलकुलेशन क्षमता अत्यधिक उपलब्ध हो।

इसी बीच, अमेरिका द्वारा चिप निर्यात पर प्रतिबंध लगाए जाने के कारण, पिछले कुछ वर्षों में वितरित उच्च-स्तरीय AI चिप्स में चीनी कंपनियों का हिस्सा लगातार घटता जा रहा है (epoch.AI के आंकड़ों के अनुसार)।
बिना किसी अतिशयोक्ति के कहा जा सकता है कि कैलकुलेशन क्षमता के आधार में विशाल अंतर के कारण चीनी AI लंबे समय तक पीछे रहेगा, और घरेलू बड़े मॉडल को अमेरिकी समकक्षों के साथ बराबरी करने की प्रक्रिया और भी कठिन हो जाएगी।
Generation gap
चीन की नवाचार की गति अवरुद्ध नहीं की जा सकती, “जो कोई सोचता है कि चीन चिप नहीं बना सकता, वह वास्तव में गलत देख रहा है। अमेरिका और चीन के बीच का अंतर केवल नैनोसेकंड के स्तर का है।”
न्विडिया के संस्थापक हुआंग रेन्शुन ने कई बार जाहिरा तौर पर चीनी सेमीकंडक्टर की प्रगति की प्रशंसा की है।

मस्क अक्सर X पर समान दृष्टिकोण व्यक्त करते हैं — “चीन अवश्य ही चिप की बाधा को दूर करेगा, आर्टिफिशियल इंटेलिजेंस की कैलकुलेशन क्षमता के क्षेत्र में, यह दुनिया के अन्य सभी देशों से आगे निकल जाएगा”, “चीन AI प्रतियोगिता में पृथ्वी पर जीतेगा”。
टेक दुनिया के प्रसिद्ध व्यक्ति चीनी AI विकास के लिए अत्यधिक प्रशंसा करते हैं, जिससे लोगों को विश्वास हो जाता है। ये बयान स्पष्ट रूप से अतिशयोक्ति के आरोप के योग्य हैं। कुछ अमेरिकी मीडिया लगातार चीन और संयुक्त राज्य अमेरिका के मॉडल के बीच बहुत कम अंतर का राजनीतिक संदेश प्रसारित कर रहे हैं, जिससे तथ्यों को भ्रमित किया जा रहा है और कुछ वास्तविक सत्यों को छुपाया जा रहा है।
इसके लिए, देश के AI संबंधी क्षेत्रों को स्पष्ट और शांत रहना चाहिए।
यदि आज के समय चीन के उन्नत बड़े मॉडल सामान्यीकृत समस्याओं को हल करने में अमेरिकी प्रतिस्पर्धियों के समान हैं, तो जटिल औद्योगिक और व्यावसायिक परिवेश में अंतर अधिक स्पष्ट हो जाता है।
अमेरिका की Anthropic जैसी कंपनियों के अग्रणी मॉडल्स की तुलना में, चीन अभी भी पीछे है। अमेरिकी CAISI मूल्यांकन के अनुसार, देश का सबसे मजबूत DeepSeek V4 Pro अमेरिकी अग्रणी मॉडल्स से लगभग 8 महीने पीछे है।
ली कैफे ने हाल ही में वॉल स्ट्रीट जर्नल के साथ एक साक्षात्कार में बताया कि एंथ्रोपिक द्वारा लॉन्च किए गए क्लॉड फेबल 5 जैसे अमेरिकी शीर्ष मॉडल के संदर्भ में, अमेरिका वर्तमान में चीन से लगभग 15 महीने आगे है।

बड़े मॉडल स्केलिंग नियम का पालन करते हैं: जितने अधिक मॉडल पैरामीटर, जितना अधिक प्रशिक्षण डेटा, और जितना अधिक कंप्यूटेशनल शक्ति लगाई जाती है, मॉडल का प्रदर्शन उतना ही बेहतर होता है। आज, अमेरिका के सबसे अग्रणी बड़े मॉडल दस ट्रिलियन पैरामीटर के युग में प्रवेश कर चुके हैं, और उनकी अपडेटिंग की गति भी तेज होती जा रही है।
Anthropic का सबसे शक्तिशाली Mythos 10 ट्रिलियन पैरामीटर तक पहुँच चुका है, और इसके प्रशिक्षण में 10 अरब डॉलर का खर्च होता है; xAI का Colossus 2 एक साथ 7 मॉडल ट्रेन कर रहा है, जिसमें 6 ट्रिलियन और 10 ट्रिलियन पैरामीटर वाले मॉडल शामिल हैं; OpenAI एक 4 ट्रिलियन पैरामीटर मॉडल को अपडेट करने का चक्र केवल एक महीने में पूरा कर लेता है।

चीन का सबसे शक्तिशाली मॉडल, DeepSeek V4 Pro, का कुल पैरामीटर आकार 1.6 ट्रिलियन है, जो संयुक्त राज्य अमेरिका के 10 ट्रिलियन स्तर के अग्रणी मॉडल से लगभग 6 गुना कम है।
Anthropic के Claude सीरीज को पिछले दो वर्षों का सबसे शक्तिशाली AI प्रोग्रामिंग मॉडल माना जाता है, जबकि Mythos ने फिर से जनता की समझ को अपडेट कर दिया है और इसकी प्रदर्शन क्षमता पिछले फ्लैगशिप Oups 4.6 से भी अधिक शक्तिशाली है।
OpenBSD को उद्योग में सबसे सुरक्षित प्रणाली के रूप में जाना जाता है, लेकिन Mythos ने एक 27 साल पुराना दरार खोज लिया, और FFmpeg और Linux कर्नेल में कई सालों या दशकों से अनदेखा दरारें ढूंढ़ीं, और पूरी तरह से स्वयं खोजीं, मानवीय सहायता के बिना।
ध्यान दें, बड़े मॉडल का "प्री-ट्रेनिंग" मॉडल क्षमता की सीमा निर्धारित करता है, और ट्रिलियन स्तर के पैरामीटर मॉडल को ट्रिलियन से अधिक पैरामीटर वाले मॉडल की क्षमता तक पहुँचाने के लिए "पोस्ट-ट्रेनिंग" से संभव नहीं है। और प्री-ट्रेनिंग का निर्णायक कारक उच्च-क्षमता वाले कॉम्प्यूटिंग चिप है, जो पैरामीटर स्केल और ट्रेनिंग इटरेशन स्पीड को निर्धारित करता है।
कोडा एक्सफेन के अध्यक्ष लिउ चिंगफेंग ने स्वीकार किया कि वर्तमान में प्रमुख बड़े मॉडल निर्माता, विशेषकर अमेरिकी विशालकाय, सभी अत्यधिक विस्तृत कैलकुलेशन प्लेटफॉर्म बना रहे हैं। और वर्तमान में घरेलू कैलकुलेशन का वास्तव में संकटकालीन चरण है, जिसके कारण अत्यधिक लंबे टेक्स्ट कॉन्टेक्स्ट में प्रशिक्षण के दौरान सीमाएं आई हैं।
दिखाई देता है कि कैलकुलेशन क्षमता का अंतर ही चीन और संयुक्त राज्य अमेरिका के मॉडल के अंतर की मूल बात है।
देशी उभार
एक व्यवसाय विश्वभर के उच्च-स्तरीय AI प्रशिक्षण चिप्स के 90% बाजार हिस्सेदारी पर कब्जा करता है—जिससे निविडा को विश्व की सबसे बड़ी बाजार मूल्य वाली कंपनी का खिताब बनाए रखने में मदद मिली। इसका कुल बाजार मूल्य एक बार विश्व की तीसरी सबसे बड़ी अर्थव्यवस्था, जर्मनी के 2025 के सकल घरेलू उत्पाद से अधिक हो गया।
सेटांग कंसल्टिंग के डेटा के अनुसार, 2026 के पहले तिमाही में वैश्विक GPU सर्वर बाजार में निवेडिया अकेले 68% हिस्सा लेती है, एएमडी 5%-6% पर कब्जा करती है, और घरेलू GPU निर्माता समूह का कुल हिस्सा 4% से कम है।
पहले आने के लाभ, अत्यधिक तकनीकी बाधाएँ, उच्च गति से जुड़ाव, सॉफ्टवेयर पारिस्थिति और TSMC के उन्नत प्रक्रिया से बंधन के कारण, NVIDIA एकाधिकार में है। उच्च-अंत प्रशिक्षण परिदृश्यों में, NVIDIA GB300 की क्षमता AMD MI325 से अधिक है, और सिमुला सियुआन 690 और मोएर टेक MTT40 से भी बेहतर है, विशेष रूप से ट्रिलियन पैरामीटर के बड़े मॉडल प्रशिक्षण में, इसकी क्षमता प्रतिद्वंद्वियों से 30% अधिक है।
निर्यात प्रतिबंध के तहत, हुआंग रेन्शुन ने पहले ही बताया था कि न्वीडिया का चीन में नए बाजार का हिस्सा लगभग शून्य हो चुका है, केवल स्टॉक मार्केट शेष रह गया है। घरेलू विकल्प नीति के समर्थन में, हुआवेई के शेंटेंग 910, हैगुआंग DCU शेनसुआन 2, केंवूजी सियुआन 370/590, और मोएर, मूक्सी जैसी कंपनियाँ क्रमशः उभरी हैं।
इसमें Ascend 910 हुआवेई का सबसे शक्तिशाली कैलकुलेशन चिप है, जिसकी क्षमता Ascend 910B पर 640 TOPS (INT8) तक पहुँचती है और यह NVIDIA A100 चिप के बराबर है।

प्रदर्शन के संदर्भ में, देशी GPU अभी भी अंतर रखते हैं, लेकिन निष्कर्षण और एज स्थितियों से शुरुआत की जा सकती है; वर्तमान में, देशी GPU भारतीय सरकारी और व्यावसायिक सामान्य निष्कर्षण आवश्यकताओं को पूरा करते हैं, और निविडा के मध्यम स्तर के उत्पादों के साथ अंतर 15%-20% तक कम हो गया है, जिससे प्रतिस्थापन संभव है।

ध्यान देने वाली बात यह है कि जबकि कैलकुलेशन प्रदर्शन महत्वपूर्ण है, लेकिन घरेलू GPU की सबसे बड़ी कमजोरी उसके पीछे का तकनीकी सॉफ्टवेयर पारिस्थितिकी है। जैसे CUDA ही निविडा GPU के साम्राज्य की नींव है, भारतीय इंजीनियरिंग अकादमी के सदस्य ज़हेंग वेमिन ने बताया कि घरेलू AI चिप की मुख्य समस्या पारिस्थितिकी का अच्छा न होना है; अगर पारिस्थितिकी अच्छी होती, तो 60% प्रदर्शन भी कई लोग इस्तेमाल करते।
कहा जा सकता है कि सॉफ्टवेयर इकोसिस्टम GPU सेगमेंट की सबसे कठोर बाधा है, और इस क्षेत्र में न्वीडिया की क्षमता भी अप्रतिस्थाप्य है।
CUDA इकोसिस्टम ने दशकों के गहन विकास के बाद अब 40 लाख से अधिक डेवलपर्स, लाखों ओपन सोर्स मॉडल्स और सभी प्रकार के थर्ड-पार्टी टूलचेन्स को शामिल किया है, जो AI ट्रेनिंग, इन्फरेंस, ग्राफिक्स रेंडरिंग और साइंटिफिक कॉम्प्यूटिंग को कवर करते हैं, जिससे इकोसिस्टम की बैरियर अद्वितीय है।
IDC के डेटा के अनुसार, वर्तमान में विश्व के 95% से अधिक AI मॉडल CUDA इकोसिस्टम पर विकसित किए जाते हैं। और देशी GPU को नीति समर्थन के साथ, लंबे समय तक उत्पादन श्रृंखला के साथ समन्वय की आवश्यकता है, जिसके लिए मीडिया और पूंजी बाजार को पर्याप्त सहनशीलता देने की आवश्यकता है।

इस साल जनवरी में, Zhipu ने हुआवेई के साथ मिलकर नवीनतम छवि उत्पादन मॉडल GLM-Image को ओपन सोर्स किया, जिसे हुआवेई Ascend Atlas 800T A2 डिवाइस और Ascend MindSpore AI फ्रेमवर्क के आधार पर डेटा प्रोसेसिंग से लेकर मॉडल ट्रेनिंग तक की पूरी प्रक्रिया को पूरा करने के लिए विकसित किया गया था; यह पहला SOTA मल्टीमॉडल मॉडल है जिसे स्वदेशी चिप के आधार पर पूरी तरह से ट्रेन किया गया है;
मोल टेक्नोलॉजीज ने बीजिंग ज़हुयुआन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट के साथ मिलकर MTT S5000 स्मार्ट कंप्यूटिंग क्लस्टर और FlagOS-Robo फ्रेमवर्क के आधार पर स्वदेशी रूप से विकसित एम्बॉडीड ब्रेन मॉडल RoboBrain 2.5 का पूर्ण प्रक्रिया प्रशिक्षण पूरा किया। इस उपलब्धि ने पहली बार साबित किया कि देशी कंप्यूटिंग क्लस्टर एम्बॉडीड इंटेलिजेंस बड़े मॉडल प्रशिक्षण में उपयोगी हैं।
देखा जा सकता है कि घरेलू GPU ने अनुकूलन और पारिस्थितिकी निर्माण में प्रगति की है और अब यह निष्कर्षण पक्ष के “एकल बिंदु उत्कृष्टता” से प्रशिक्षण पक्ष की “क्रमिक अनुकूलन” की ओर बढ़ रहा है, जो एक बड़ी प्रगति है।
Summary
समग्र रूप से, विदेशी उन्नत चिप के आयात में बाधा के संदर्भ में, घरेलू कैलकुलेशन चिप्स को प्राथमिकता देकर, दोनों तरफ से काम करना उचित होगा, ताकि तीव्र बाजार की मांग को पूरा किया जा सके।
आवश्यकता की वास्तविकता संदेहातीत है, "बुलबुला सिद्धांत" अभी भी मौजूद है, लेकिन इसकी आवाज़ बढ़ रही नहीं है। AI निर्माण के लिए वैश्विक बाजार की उत्सुकता पहले किसी भी उद्योग के प्रारंभिक विकास की तुलना में अधिक है।
इस साल तक, वैश्विक बाजार में एक और अत्यधिक AI चक्र शुरू हुआ है, जिसमें सैमसंग, SK हाइलेट्स, ब्रॉडकॉम और TSMC के शेयर नए उच्च स्तर पर पहुंच गए हैं। घरेलू बाजार में, क्राउनजी जैसे प्रतिनिधियों के साथ हार्डटेक भी तेजी से बढ़ रहा है, और ऑप्टिकल मॉड्यूल के नेता, ZWICHI XUCHUANG का बाजार मूल्य एक समय के लिए माओताई से भी अधिक हो गया।
दक्षिण कोरिया के सेमीकंडक्टर विकास के इतिहास को देखें, दक्षिण कोरिया ने स्मृति चिप उद्योग के समर्थन के लिए राष्ट्रीय स्तर पर प्रयास किए, अंधकारमय समय को झेला, और अंततः जापान को हराकर विश्व स्मृति उद्योग का निरपेक्ष राजा बन गया।
चाहे स्टोरेज चिप, मोबाइल चिप, या वर्तमान में एआई चिप हों, चीन अभी भी पीछे है, और यह कोई एक दिन का काम नहीं है। लेकिन विशाल बाजार, लगातार उभरते एआई पेशेवरों, और विशाल पूंजी क्षमता के साथ, घरेलू GPU ने पहले ही कुछ अनुकूलता दिखाई है और कई एआई कंपनियों की वास्तविक आवश्यकताओं को पूरा कर सकता है।
इस राष्ट्रीय भाग्य पर आधारित AI खेल में, संयुक्त राज्य अमेरिका और चीन दोनों प्रतिद्वंद्वी हैं, साथ ही एक दूसरे के लिए आवश्यक प्रौद्योगिकी, बाजार और संसाधन भी हैं।
यह लेख वेचीन ग्रुप: जूटाईवेव से आया है, संपादक: यांग ज़ुरान, लेखक: शिए ज़ेफेंग, मूल शीर्षक: 〈चीन-अमेरिका AI खेल के तहत कैलकुलेशन क्षमता की समस्या | जूटाईवेव〉
