चीन का एआई उच्च-अंत प्रशिक्षण चिपों और कंप्यूट पावर की पहुंच में संयुक्त राज्य अमेरिका से पीछे है

icon MarsBit
साझा करें
AI summary iconसारांश

हैशरेट की कमी

पिछले साल के अंत से, मोएर टेक्नोलॉजी, मू ज़ी शेयर्स, बिरेन टेक्नोलॉजी, टियनशु इंटेलिजेंट चिप जैसे घरेलू GPU ने पूंजी की लहर को उठाया है। हालांकि, द्वितीयक बाजार के संपत्ति के उत्सव के नीचे, एक अनदेखी लेकिन स्पष्ट रेखा धीरे-धीरे स्पष्ट हो रही है, जिसके कारण उत्पन्न समस्याएं अधिक तीव्र हो रही हैं।

पिछले कुछ वर्षों में, भारतीय AI चिप्स मुख्य रूप से अपेक्षाकृत सुरक्षित और अधिक किनारे वाले "इन्फरेंस साइड" पर केंद्रित रहे हैं, जैसे कि हाल ही में डोउबाओ योजना ने इस चीन के सबसे बड़े AI ऐप टर्मिनल की उच्च आवृत्ति वाली मांग को पूरा करने के लिए इन्फरेंस कॉम्प्यूटिंग कार्यों के लिए 50,000 चिप्स खरीदने की घोषणा की है।

और AI प्रशिक्षण के इस कैलकुलेशन पिरामिड के शीर्ष अनुक्रम में, घरेलू चिप्स वर्तमान में केवल किनारे के "सहायता" कार्यों में ही भाग ले सकते हैं।

AI ट्रेनिंग चिप्स का उपयोग मुख्य रूप से कृत्रिम बुद्धिमत्ता मॉडल के ट्रेनिंग के लिए किया जाता है, जिसमें बड़ी मात्रा में मैट्रिक्स ऑपरेशन और पैरामीटर एडजस्टमेंट होते हैं, इसलिए इन्हें शक्तिशाली कैलकुलेशन क्षमता और उच्च ऊर्जा कुशलता की आवश्यकता होती है; इनमें न्यूडिया A100, H100, H200 और AMD के MI300 सीरीज़ जैसे उत्पाद शामिल हैं;

Hash rate

तुलना में, निष्कर्ष चिप का कार्य काफी हल्का होता है। यह मॉडल प्रशिक्षण के बाद डिप्लॉयमेंट चरण के लिए उपयोग किया जाता है और मुख्य रूप से मॉडल के निष्कर्षण कार्यों को निष्पादित करता है, जिसकी वास्तविक समय आवश्यकता अधिक होती है; निष्कर्ष चिप को सटीकता को बनाए रखते हुए तेज प्रतिक्रिया और कम बिजली खपत की क्षमता होनी चाहिए।

एक उपयुक्त उपमा यह है कि प्रशिक्षण AI मॉडल को "ज्ञान सीखने" के लिए किया जाता है, जबकि निष्कर्षण में बड़े मॉडल "ज्ञान का उपयोग" करते हैं। अध्ययन चरण में, प्रशिक्षण चिप्स को अरब, खरब और यहां तक कि दस खरब पैरामीटर के डायनामिक अपडेट के लिए विशाल मात्रा में डेटा "पोषित" करना होता है, जिसमें शक्तिशाली कैलकुलेशन क्षमता के साथ-साथ कुशल बैंडविड्थ और संचार क्षमता की आवश्यकता होती है, और लाखों कार्ड के क्लस्टर में स्थिरता की गारंटी भी होनी चाहिए।

चीन और संयुक्त राज्य अमेरिका के मॉडल के बीच अंतर की जड़ इन "अदृश्य" स्थानों में है, विशेष रूप से उच्च-अंत प्रशिक्षण चिप्स की कमी के कारण।

बड़े मॉडल के स्केलिंग नियम के तहत, जितना अधिक मॉडल पैरामीटर होते हैं, उतना ही अधिक कैलकुलेशन की आवश्यकता होती है, और घातीय रूप से बढ़ती कैलकुलेशन और हार्डवेयर लागत के कारण, बड़े मॉडल को ट्रेन करना केवल कुछ ही टेक गिगंट्स के लिए "विशेष खेल" बन गया है।

अमेरिकी टेक दिग्गजों में, केवल मेटा अपने 2026 के अंत तक 12 लाख से अधिक उच्च-अंत GPU तैनात करने की योजना बना रहा है, जिसका वार्षिक निवेश 1450 अरब डॉलर से अधिक है; अनुमानों के अनुसार, गूगल के पास 50 लाख निवेडिया H100 के समतुल्य AI कुल प्रसंस्करण क्षमता है, जो विश्व की कुल क्षमता का एक-चौथाई हिस्सा है।

इस वर्ष, अमेज़न, माइक्रोसॉफ्ट, अल्फाबेट और मेटा चार कंपनियों द्वारा 7250 अरब डॉलर का पूंजी खर्च किया गया है, जो पिछले वर्ष की तुलना में 77% की तेजी से बढ़ा है, जो संयुक्त राज्य अमेरिका के पूरे वर्ष के निजी आंतरिक निवेश के 13% के बराबर है। मॉर्गन स्टेनले ने भविष्यवाणी की है कि 2027 तक, संयुक्त राज्य अमेरिका के टेक कंपनियों का पूंजी खर्च 1.1 ट्रिलियन डॉलर के ऐतिहासिक रिकॉर्ड तक पहुंच सकता है।

अभी संयुक्त राज्य अमेरिका विश्व के 70% से अधिक उच्च-अंत GPU पर काबिज है, चिप प्रतिबंध के बाद देश में उपलब्ध उच्च-अंत चिप्स केवल अमेरिका के 1/8 हैं। स्टैनफोर्ड AI सूचकांक रिपोर्ट 2026 में बताया गया है कि संयुक्त राज्य अमेरिका में डेटासेंटर की संख्या (5427) चीन से 10 गुना अधिक है।

Hash rate

चीनी सूचना और संचार अकादमी (CAICT) के अनुसार, 2025 की शुरुआत तक, संयुक्त राज्य अमेरिका की कैलकुलेशन क्षमता 2400 EFLOPS है, जबकि चीन की 1053 EFLOPS है, जो संयुक्त राज्य अमेरिका की चीन की तुलना में दो से अधिक है।

Hash rate

उपरोक्त चार टेक गायंट्स के पास जो कैलकुलेशन क्षमता है, उसमें से प्रत्येक अकेला चीन की सभी AI कंपनियों के योग से अधिक है।

इस भारी गणना क्षमता के लाभ के कारण, अमेरिकी कंपनियाँ एक वर्ष में दर्जनों बड़े मॉडल इटरेशन प्रयोग पूरे कर सकती हैं।

मस्क और भी अधिक शानदार हैं, जिनके अधीन xAI के पास "दुनिया का पहला GW स्तरीय AI क्लस्टर" कहलाने वाला Colossus 2 है। इसलिए वह दावा कर सकते हैं कि वे एक साथ 7 मॉडल ट्रेन कर रहे हैं—दो 1 ट्रिलियन, दो 1.5 ट्रिलियन, एक 6 ट्रिलियन और एक 10 ट्रिलियन पैरामीटर मॉडल, यह "बलवान सौंदर्य" केवल तभी संभव है जब कैलकुलेशन क्षमता अत्यधिक उपलब्ध हो।

Hash rate

इसी बीच, अमेरिका द्वारा चिप निर्यात पर प्रतिबंध लगाए जाने के कारण, पिछले कुछ वर्षों में वितरित उच्च-स्तरीय AI चिप्स में चीनी कंपनियों का हिस्सा लगातार घटता जा रहा है (epoch.AI के आंकड़ों के अनुसार)।

बिना किसी अतिशयोक्ति के कहा जा सकता है कि कैलकुलेशन क्षमता के आधार में विशाल अंतर के कारण चीनी AI लंबे समय तक पीछे रहेगा, और घरेलू बड़े मॉडल को अमेरिकी समकक्षों के साथ बराबरी करने की प्रक्रिया और भी कठिन हो जाएगी।

Generation gap

चीन की नवाचार की गति अवरुद्ध नहीं की जा सकती, “जो कोई सोचता है कि चीन चिप नहीं बना सकता, वह वास्तव में गलत देख रहा है। अमेरिका और चीन के बीच का अंतर केवल नैनोसेकंड के स्तर का है।”

न्विडिया के संस्थापक हुआंग रेन्शुन ने कई बार जाहिरा तौर पर चीनी सेमीकंडक्टर की प्रगति की प्रशंसा की है।

Hash rate

मस्क अक्सर X पर समान दृष्टिकोण व्यक्त करते हैं — “चीन अवश्य ही चिप की बाधा को दूर करेगा, आर्टिफिशियल इंटेलिजेंस की कैलकुलेशन क्षमता के क्षेत्र में, यह दुनिया के अन्य सभी देशों से आगे निकल जाएगा”, “चीन AI प्रतियोगिता में पृथ्वी पर जीतेगा”。

टेक दुनिया के प्रसिद्ध व्यक्ति चीनी AI विकास के लिए अत्यधिक प्रशंसा करते हैं, जिससे लोगों को विश्वास हो जाता है। ये बयान स्पष्ट रूप से अतिशयोक्ति के आरोप के योग्य हैं। कुछ अमेरिकी मीडिया लगातार चीन और संयुक्त राज्य अमेरिका के मॉडल के बीच बहुत कम अंतर का राजनीतिक संदेश प्रसारित कर रहे हैं, जिससे तथ्यों को भ्रमित किया जा रहा है और कुछ वास्तविक सत्यों को छुपाया जा रहा है।

इसके लिए, देश के AI संबंधी क्षेत्रों को स्पष्ट और शांत रहना चाहिए।

यदि आज के समय चीन के उन्नत बड़े मॉडल सामान्यीकृत समस्याओं को हल करने में अमेरिकी प्रतिस्पर्धियों के समान हैं, तो जटिल औद्योगिक और व्यावसायिक परिवेश में अंतर अधिक स्पष्ट हो जाता है।

अमेरिका की Anthropic जैसी कंपनियों के अग्रणी मॉडल्स की तुलना में, चीन अभी भी पीछे है। अमेरिकी CAISI मूल्यांकन के अनुसार, देश का सबसे मजबूत DeepSeek V4 Pro अमेरिकी अग्रणी मॉडल्स से लगभग 8 महीने पीछे है।

ली कैफे ने हाल ही में वॉल स्ट्रीट जर्नल के साथ एक साक्षात्कार में बताया कि एंथ्रोपिक द्वारा लॉन्च किए गए क्लॉड फेबल 5 जैसे अमेरिकी शीर्ष मॉडल के संदर्भ में, अमेरिका वर्तमान में चीन से लगभग 15 महीने आगे है।

Hash rate

बड़े मॉडल स्केलिंग नियम का पालन करते हैं: जितने अधिक मॉडल पैरामीटर, जितना अधिक प्रशिक्षण डेटा, और जितना अधिक कंप्यूटेशनल शक्ति लगाई जाती है, मॉडल का प्रदर्शन उतना ही बेहतर होता है। आज, अमेरिका के सबसे अग्रणी बड़े मॉडल दस ट्रिलियन पैरामीटर के युग में प्रवेश कर चुके हैं, और उनकी अपडेटिंग की गति भी तेज होती जा रही है।

Anthropic का सबसे शक्तिशाली Mythos 10 ट्रिलियन पैरामीटर तक पहुँच चुका है, और इसके प्रशिक्षण में 10 अरब डॉलर का खर्च होता है; xAI का Colossus 2 एक साथ 7 मॉडल ट्रेन कर रहा है, जिसमें 6 ट्रिलियन और 10 ट्रिलियन पैरामीटर वाले मॉडल शामिल हैं; OpenAI एक 4 ट्रिलियन पैरामीटर मॉडल को अपडेट करने का चक्र केवल एक महीने में पूरा कर लेता है।

Hash rate

चीन का सबसे शक्तिशाली मॉडल, DeepSeek V4 Pro, का कुल पैरामीटर आकार 1.6 ट्रिलियन है, जो संयुक्त राज्य अमेरिका के 10 ट्रिलियन स्तर के अग्रणी मॉडल से लगभग 6 गुना कम है।

Anthropic के Claude सीरीज को पिछले दो वर्षों का सबसे शक्तिशाली AI प्रोग्रामिंग मॉडल माना जाता है, जबकि Mythos ने फिर से जनता की समझ को अपडेट कर दिया है और इसकी प्रदर्शन क्षमता पिछले फ्लैगशिप Oups 4.6 से भी अधिक शक्तिशाली है।

OpenBSD को उद्योग में सबसे सुरक्षित प्रणाली के रूप में जाना जाता है, लेकिन Mythos ने एक 27 साल पुराना दरार खोज लिया, और FFmpeg और Linux कर्नेल में कई सालों या दशकों से अनदेखा दरारें ढूंढ़ीं, और पूरी तरह से स्वयं खोजीं, मानवीय सहायता के बिना।

ध्यान दें, बड़े मॉडल का "प्री-ट्रेनिंग" मॉडल क्षमता की सीमा निर्धारित करता है, और ट्रिलियन स्तर के पैरामीटर मॉडल को ट्रिलियन से अधिक पैरामीटर वाले मॉडल की क्षमता तक पहुँचाने के लिए "पोस्ट-ट्रेनिंग" से संभव नहीं है। और प्री-ट्रेनिंग का निर्णायक कारक उच्च-क्षमता वाले कॉम्प्यूटिंग चिप है, जो पैरामीटर स्केल और ट्रेनिंग इटरेशन स्पीड को निर्धारित करता है।

कोडा एक्सफेन के अध्यक्ष लिउ चिंगफेंग ने स्वीकार किया कि वर्तमान में प्रमुख बड़े मॉडल निर्माता, विशेषकर अमेरिकी विशालकाय, सभी अत्यधिक विस्तृत कैलकुलेशन प्लेटफॉर्म बना रहे हैं। और वर्तमान में घरेलू कैलकुलेशन का वास्तव में संकटकालीन चरण है, जिसके कारण अत्यधिक लंबे टेक्स्ट कॉन्टेक्स्ट में प्रशिक्षण के दौरान सीमाएं आई हैं।

दिखाई देता है कि कैलकुलेशन क्षमता का अंतर ही चीन और संयुक्त राज्य अमेरिका के मॉडल के अंतर की मूल बात है।

देशी उभार

एक व्यवसाय विश्वभर के उच्च-स्तरीय AI प्रशिक्षण चिप्स के 90% बाजार हिस्सेदारी पर कब्जा करता है—जिससे निविडा को विश्व की सबसे बड़ी बाजार मूल्य वाली कंपनी का खिताब बनाए रखने में मदद मिली। इसका कुल बाजार मूल्य एक बार विश्व की तीसरी सबसे बड़ी अर्थव्यवस्था, जर्मनी के 2025 के सकल घरेलू उत्पाद से अधिक हो गया।

सेटांग कंसल्टिंग के डेटा के अनुसार, 2026 के पहले तिमाही में वैश्विक GPU सर्वर बाजार में निवेडिया अकेले 68% हिस्सा लेती है, एएमडी 5%-6% पर कब्जा करती है, और घरेलू GPU निर्माता समूह का कुल हिस्सा 4% से कम है।

पहले आने के लाभ, अत्यधिक तकनीकी बाधाएँ, उच्च गति से जुड़ाव, सॉफ्टवेयर पारिस्थिति और TSMC के उन्नत प्रक्रिया से बंधन के कारण, NVIDIA एकाधिकार में है। उच्च-अंत प्रशिक्षण परिदृश्यों में, NVIDIA GB300 की क्षमता AMD MI325 से अधिक है, और सिमुला सियुआन 690 और मोएर टेक MTT40 से भी बेहतर है, विशेष रूप से ट्रिलियन पैरामीटर के बड़े मॉडल प्रशिक्षण में, इसकी क्षमता प्रतिद्वंद्वियों से 30% अधिक है।

निर्यात प्रतिबंध के तहत, हुआंग रेन्शुन ने पहले ही बताया था कि न्वीडिया का चीन में नए बाजार का हिस्सा लगभग शून्य हो चुका है, केवल स्टॉक मार्केट शेष रह गया है। घरेलू विकल्प नीति के समर्थन में, हुआवेई के शेंटेंग 910, हैगुआंग DCU शेनसुआन 2, केंवूजी सियुआन 370/590, और मोएर, मूक्सी जैसी कंपनियाँ क्रमशः उभरी हैं।

इसमें Ascend 910 हुआवेई का सबसे शक्तिशाली कैलकुलेशन चिप है, जिसकी क्षमता Ascend 910B पर 640 TOPS (INT8) तक पहुँचती है और यह NVIDIA A100 चिप के बराबर है।

Hash rate

प्रदर्शन के संदर्भ में, देशी GPU अभी भी अंतर रखते हैं, लेकिन निष्कर्षण और एज स्थितियों से शुरुआत की जा सकती है; वर्तमान में, देशी GPU भारतीय सरकारी और व्यावसायिक सामान्य निष्कर्षण आवश्यकताओं को पूरा करते हैं, और निविडा के मध्यम स्तर के उत्पादों के साथ अंतर 15%-20% तक कम हो गया है, जिससे प्रतिस्थापन संभव है।

Hash rate

ध्यान देने वाली बात यह है कि जबकि कैलकुलेशन प्रदर्शन महत्वपूर्ण है, लेकिन घरेलू GPU की सबसे बड़ी कमजोरी उसके पीछे का तकनीकी सॉफ्टवेयर पारिस्थितिकी है। जैसे CUDA ही निविडा GPU के साम्राज्य की नींव है, भारतीय इंजीनियरिंग अकादमी के सदस्य ज़हेंग वेमिन ने बताया कि घरेलू AI चिप की मुख्य समस्या पारिस्थितिकी का अच्छा न होना है; अगर पारिस्थितिकी अच्छी होती, तो 60% प्रदर्शन भी कई लोग इस्तेमाल करते।

कहा जा सकता है कि सॉफ्टवेयर इकोसिस्टम GPU सेगमेंट की सबसे कठोर बाधा है, और इस क्षेत्र में न्वीडिया की क्षमता भी अप्रतिस्थाप्य है।

CUDA इकोसिस्टम ने दशकों के गहन विकास के बाद अब 40 लाख से अधिक डेवलपर्स, लाखों ओपन सोर्स मॉडल्स और सभी प्रकार के थर्ड-पार्टी टूलचेन्स को शामिल किया है, जो AI ट्रेनिंग, इन्फरेंस, ग्राफिक्स रेंडरिंग और साइंटिफिक कॉम्प्यूटिंग को कवर करते हैं, जिससे इकोसिस्टम की बैरियर अद्वितीय है।

IDC के डेटा के अनुसार, वर्तमान में विश्व के 95% से अधिक AI मॉडल CUDA इकोसिस्टम पर विकसित किए जाते हैं। और देशी GPU को नीति समर्थन के साथ, लंबे समय तक उत्पादन श्रृंखला के साथ समन्वय की आवश्यकता है, जिसके लिए मीडिया और पूंजी बाजार को पर्याप्त सहनशीलता देने की आवश्यकता है।

Hash rate

इस साल जनवरी में, Zhipu ने हुआवेई के साथ मिलकर नवीनतम छवि उत्पादन मॉडल GLM-Image को ओपन सोर्स किया, जिसे हुआवेई Ascend Atlas 800T A2 डिवाइस और Ascend MindSpore AI फ्रेमवर्क के आधार पर डेटा प्रोसेसिंग से लेकर मॉडल ट्रेनिंग तक की पूरी प्रक्रिया को पूरा करने के लिए विकसित किया गया था; यह पहला SOTA मल्टीमॉडल मॉडल है जिसे स्वदेशी चिप के आधार पर पूरी तरह से ट्रेन किया गया है;

मोल टेक्नोलॉजीज ने बीजिंग ज़हुयुआन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट के साथ मिलकर MTT S5000 स्मार्ट कंप्यूटिंग क्लस्टर और FlagOS-Robo फ्रेमवर्क के आधार पर स्वदेशी रूप से विकसित एम्बॉडीड ब्रेन मॉडल RoboBrain 2.5 का पूर्ण प्रक्रिया प्रशिक्षण पूरा किया। इस उपलब्धि ने पहली बार साबित किया कि देशी कंप्यूटिंग क्लस्टर एम्बॉडीड इंटेलिजेंस बड़े मॉडल प्रशिक्षण में उपयोगी हैं।

देखा जा सकता है कि घरेलू GPU ने अनुकूलन और पारिस्थितिकी निर्माण में प्रगति की है और अब यह निष्कर्षण पक्ष के “एकल बिंदु उत्कृष्टता” से प्रशिक्षण पक्ष की “क्रमिक अनुकूलन” की ओर बढ़ रहा है, जो एक बड़ी प्रगति है।

Summary

समग्र रूप से, विदेशी उन्नत चिप के आयात में बाधा के संदर्भ में, घरेलू कैलकुलेशन चिप्स को प्राथमिकता देकर, दोनों तरफ से काम करना उचित होगा, ताकि तीव्र बाजार की मांग को पूरा किया जा सके।

आवश्यकता की वास्तविकता संदेहातीत है, "बुलबुला सिद्धांत" अभी भी मौजूद है, लेकिन इसकी आवाज़ बढ़ रही नहीं है। AI निर्माण के लिए वैश्विक बाजार की उत्सुकता पहले किसी भी उद्योग के प्रारंभिक विकास की तुलना में अधिक है।

इस साल तक, वैश्विक बाजार में एक और अत्यधिक AI चक्र शुरू हुआ है, जिसमें सैमसंग, SK हाइलेट्स, ब्रॉडकॉम और TSMC के शेयर नए उच्च स्तर पर पहुंच गए हैं। घरेलू बाजार में, क्राउनजी जैसे प्रतिनिधियों के साथ हार्डटेक भी तेजी से बढ़ रहा है, और ऑप्टिकल मॉड्यूल के नेता, ZWICHI XUCHUANG का बाजार मूल्य एक समय के लिए माओताई से भी अधिक हो गया।

दक्षिण कोरिया के सेमीकंडक्टर विकास के इतिहास को देखें, दक्षिण कोरिया ने स्मृति चिप उद्योग के समर्थन के लिए राष्ट्रीय स्तर पर प्रयास किए, अंधकारमय समय को झेला, और अंततः जापान को हराकर विश्व स्मृति उद्योग का निरपेक्ष राजा बन गया।

चाहे स्टोरेज चिप, मोबाइल चिप, या वर्तमान में एआई चिप हों, चीन अभी भी पीछे है, और यह कोई एक दिन का काम नहीं है। लेकिन विशाल बाजार, लगातार उभरते एआई पेशेवरों, और विशाल पूंजी क्षमता के साथ, घरेलू GPU ने पहले ही कुछ अनुकूलता दिखाई है और कई एआई कंपनियों की वास्तविक आवश्यकताओं को पूरा कर सकता है।

इस राष्ट्रीय भाग्य पर आधारित AI खेल में, संयुक्त राज्य अमेरिका और चीन दोनों प्रतिद्वंद्वी हैं, साथ ही एक दूसरे के लिए आवश्यक प्रौद्योगिकी, बाजार और संसाधन भी हैं।

यह लेख वेचीन ग्रुप: जूटाईवेव से आया है, संपादक: यांग ज़ुरान, लेखक: शिए ज़ेफेंग, मूल शीर्षक: 〈चीन-अमेरिका AI खेल के तहत कैलकुलेशन क्षमता की समस्या | जूटाईवेव〉

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।