लेखक: आदा, शेनचाओ टेकफ्लो
सैन फ्रांसिस्को, सैन होसे कॉन्फ्रेंस सेंटर, GTC लाइव।
नीदिया के मुख्य वैज्ञानिक बिल डैली टीम पर बैठे हुए हैं, जिनके सामने गूगल के जेफ डीन हैं। दोनों बातचीत के बीच में, डैली ने एक संख्या उठाई: "पहले, लगभग 2500 से 3000 यूनिट्स के स्टैंडर्ड सेल लाइब्रेरी को स्थानांतरित करने में 8 इंजीनियरों की टीम को लगभग 10 महीने लगते थे।"
वह एक पल के लिए रुक गया।
अब केवल एक GPU कार्ड के साथ, एक रात चलाएं।
नीचे किसी ने चीख नहीं उठाई, क्योंकि इस वाक्य को समझने वाले सभी जानते थे कि इसका क्या अर्थ है। 8 इंजीनियरों द्वारा 10 महीनों का काम, एक अपने निर्मित GPU द्वारा एक रात में खत्म हो गया। और डैली ने यह भी जोड़ा: प्राप्त परिणाम क्षेत्रफल, शक्ति उपभोग और लेटेंसी के तीन सूचकांकों पर मानवीय डिज़ाइन के समान या उससे बेहतर हैं।
अगले दिन समाचारों ने इसे "निविडा द्वारा AI का उपयोग करके GPU डिज़ाइन किया गया" के रूप में पढ़ा।
लेकिन इस बात का सच, समाचार के शीर्षक से कहीं अधिक दिलचस्प है।
NVIDIA के अंदर क्या चल रहा है?
NVIDIA के अंदर चलने वाला कोई ब्लैक बॉक्स नहीं है, बल्कि कुछ ऐसे टूलचेन हैं जिन्हें कई सालों तक बेहतर बनाया गया है।
NB-Cell एक रिइनफोर्समेंट लर्निंग आधारित प्रोग्राम है, जो स्टैंडर्ड सेल लाइब्रेरी माइग्रेशन जैसे सबसे कठिन कार्यों के लिए डिज़ाइन किया गया है। Prefix RL लंबे समय से अनुसंधान की जा रही समस्या—कैरी-लुकअहेड चेन में लुकअहेड चरण का स्थान—को हल करने के लिए बनाया गया है। डैली के अनुसार, इस प्रणाली द्वारा उत्पन्न लेआउट "मनुष्य कभी सोच नहीं पाते," और मानव डिज़ाइन की तुलना में महत्वपूर्ण सूचकांक में लगभग 20% से 30% की वृद्धि हुई है।
और दो आंतरिक LLM, Chip Nemo और Bug Nemo। NVIDIA ने अपने इतिहास के हर GPU के RTL कोड, आर्किटेक्चर दस्तावेज़ और डिज़ाइन स्पेसिफिकेशन को इन दोनों बड़े मॉडल्स को दिया। Dally के वर्णन के अनुसार, यह इस बात के समान है कि NVIDIA ने G80 से Blackwell तक के बीस साल की मांसपेशी स्मृति को एक आंतरिक मॉडल में सारांशित कर दिया है, जिससे नए लोग प्रवेश करते ही बीस साल के अनुभव के सीनियर इंजीनियर से सीधे जुड़ जाते हैं।
तो क्या “AI GPU डिज़ाइन कर सकता है”?
विपरीत रूप से, डैली ने कहा: "मुझे एक दिन सीधे कहने की इच्छा है, 'मुझे एक नया GPU डिज़ाइन करो,' लेकिन हम उस बिंदु तक अभी बहुत दूर हैं।"
NVIDIA ने AI का उपयोग करके GPU नहीं बनाया। लेकिन इसने एक अन्य चीज की जो इस उद्योग के लिए अब बिना इसके काम नहीं चलेगा।
20 अरब डॉलर का EDA फील्ड खरीदें
1 दिसंबर, 2025 को, NVIDIA ने EDA के तीन प्रमुख खिलाड़ियों में से एक, Synopsys में 2 बिलियन डॉलर का निवेश किया। दोनों ओर ने संयुक्त विकास समझौते पर हस्ताक्षर किए, जिसके तहत NVIDIA का त्वरित कंप्यूटिंग स्टैक Synopsys की पूरी EDA वर्कफ्लो में एम्बेड किया जाएगा, और Blackwell और अगली पीढ़ी के Rubin GPU को Synopsys.ai के साथ गहराई से एकीकृत किया जाएगा।
Synopsys की स्थिति को समझाने की आवश्यकता है। वैश्विक स्तर पर प्रत्येक उन्नत प्रक्रिया चिप, एप्पल M सीरीज़, AMD MI सीरीज़, Google TPU, डिज़ाइन चरण में लगभग सभी Synopsys या Cadence के टूलचेन पर चलते हैं। इन दोनों के साथ सीमेंस EDA, चिप डिज़ाइन के नींव के टूल्स पर एकाधिकार रखते हैं। आप क्वालकॉम की चिप का उपयोग नहीं कर सकते, ताइवान सेमीकंडक्टर मैनुफैक्चरिंग कंपनी की लाइन का उपयोग नहीं कर सकते, लेकिन इन तीनों के सॉफ़्टवेयर से जुड़े रहना अनिवार्य है।
Synopsys में निवेश के तीन महीने बाद, NVIDIA ने Cadence, Siemens, Dassault को भी शामिल किया और घोषणा की कि वे सभी NVIDIA GPU के आधार पर AI-संचालित चिप डिज़ाइन उपकरण विकसित कर रहे हैं।
निविडा द्वारा प्रकाशित बेंचमार्क डेटा काफी डरावना लगता है: Synopsys PrimeSim, Blackwell पर 30 गुना तेज, Proteus 20 गुना तेज, और Sentaurus, B200 पर CPU त्वरित करने की तुलना में 12 गुना तेज। मेडियाटेक ने H100 का उपयोग करके Cadence Spectre को 6 गुना तेज किया। Astera Labs ने Synopsys + NVIDIA का उपयोग करके चिप प्रमाणीकरण को 3.5 गुना तेज किया।
एक विशेष बात अलग से उल्लेख करने योग्य है: कैडेंस का मिलेनियम M2000 प्लेटफॉर्म, जो "EDA बाजार के लिए विशेष रूप से बनाया गया है और NVIDIA Blackwell पर एकमात्र आधारित है"।
“独家”这两个字最值得品味。也就是说,以前 EDA 工具运行在 CPU 上,Intel 和 AMD 都能使用。今后,要想使用最快的 EDA,只能购买英伟达的显卡。
The actual shape of the flywheel
निविडा का फ्लाईव्हील, जिसे अधिकांश लोग समझते हैं, ऐसा है: AI कंपनियों को GPU बेचना, AI कंपनियाँ बड़े मॉडल को प्रशिक्षित करती हैं, बड़े मॉडल साबित करते हैं कि GPU अपरिहार्य है, और अधिक लोग GPU खरीदते हैं।
यह फ्लाईव्हील पर्याप्त भयानक है। लेकिन इसके नीचे एक और स्तर है।
निविडा अपने खुद के टूल्स का उपयोग करके अगली पीढ़ी के GPU का डिज़ाइन कर रही है, जिससे डिज़ाइन दक्षता में पीढ़ीगत अंतर आ गया है, और पूरी उद्योग की EDA टूलचेन को अपने हार्डवेयर से जोड़ दिया है। प्रतिद्वंद्वी अनुसरण करना चाहते हैं, लेकिन अनुसरण के लिए आवश्यक टूल्स भी निविडा के पारिस्थितिकी से किराए पर लेने पड़ते हैं।
AMD का वह रिपोर्ट, जिसके कारण शेयर मूल्य में गिरावट आई, उसके पीछे यही चिंता छिपी हुई है। भले ही NVIDIA और Synopsys सतही रूप से कहते हैं कि "निवेश के साथ NVIDIA हार्डवेयर खरीदने का कोई बंधन नहीं है", बाजार जानता है: त्वरित EDA सुविधाओं का प्रारंभिक संस्करण NVIDIA हार्डवेयर पर ही लॉन्च होता है, AMD और Intel को केवल एक "अपने सबसे बड़े प्रतिद्वंद्वी के प्लेटफॉर्म के लिए अनुकूलित मार्ग" पर निर्भर रहना पड़ता है।
कल्पना कीजिए कि AMD के इंजीनियर भविष्य में ब्लैकवेल के प्रतिस्पर्धी एक चिप डिज़ाइन करना चाहते हैं, और वे सिनोप्सिस के टूल को खोलते हैं, जो निवाडा GPU पर सबसे तेज़ चलता है। तो उन्हें या तो दोगुना धीमी डिज़ाइन अवधि सहन करनी होगी, या फिर निवाडा के कई कार्ड खरीदने होंगे ताकि वे निवाडा को हराने के लिए एक चिप डिज़ाइन कर सकें।
शूवल अभी भी बेचा जा रहा है। लेकिन बिक्री का तरीका बदल गया है।
भारतीय GPU की वास्तविक स्थिति
At this point, we must present a set of sobering numbers.
एनविडिया ने 2025 वित्तीय वर्ष में 700 अरब डॉलर का शुद्ध लाभ कमाया, उसी वर्ष घरेलू GPU "चार छोटे ड्रैगन" मोएर टेक्नोलॉजी, मूक्सी, बिरेन और सुईयुआन, आईपीओ की खिड़की के सामने पंक्ति में खड़े हो गए।
मोल टेक्नोलॉजी के आईपीओ दस्तावेज़ के अनुसार, 2022 से 2024 तक, तीन वर्षों में कुल शुद्ध नुकसान 50 अरब युआन था, 2025 की पहली छमाही में अतिरिक्त 2.71 अरब युआन का नुकसान हुआ, और 30 जून तक कुल अपूर्ति नुकसान 14.78 अरब युआन है। कंपनी के प्रबंधन का स्वयं का अनुमान है कि सबसे जल्दी 2027 तक ही संयुक्त वित्तीय विवरण में लाभ प्राप्त होगा। मूक्सी कुछ बेहतर है, जिसका तीन वर्षों में कुल नुकसान 30 अरब युआन से अधिक है। सबसे खराब स्थिति बिरेन की है, जिसका तीन वर्ष और आधा में 63 अरब युआन से अधिक का नुकसान हुआ है, और 2025 की पहली छमाही में आय केवल 58.9 करोड़ युआन थी, जो मोल टेक्नोलॉजी के समान अवधि के 7.02 अरब युआन का केवल एक हिस्सा है।
अब अनुसंधान और विकास निवेश की तीव्रता पर नजर डालें। मोएर टेक्नोलॉजीज का 2022 का अनुसंधान और विकास खर्च राजस्व का 2422.51% था, और 2024 में भी यह 309.88% रहा। एक साल में किए गए अनुसंधान खर्च की राशि, आय से तीन गुना से अधिक है। यह व्यवसाय प्रबंधन नहीं है, यह एक आईवी ड्रॉप है, जो प्राथमिक बाजार और हाल ही में खुले स्केक्यूबी के माध्यम से लगातार रक्तदान पर निर्भर है।
उपकरण स्तर पर अधिक बाधाएँ हैं। हुआदा जिउतियान की 2022 की आईपीओ प्रोस्पेक्टस में दर्शाया गया है कि उपकरण केवल 5 एनएम उन्नत प्रक्रिया को आंशिक रूप से समर्थन करते हैं। गैलुन इलेक्ट्रॉनिक्स 7 एनएम/5 एनएम/3 एनएम नोड्स को कवर कर सकता है, लेकिन केवल बिंदु उपकरण ही बनाता है, पूर्ण प्रक्रिया की बात तो दूर की है।
हुआदा जिउतियान के संस्थापक लिउ वेइपिंग ने कहा: "भारतीय EDA का उन्नत प्रक्रिया के लिए समर्थन अभी भी स्पष्ट रूप से कमजोर है, खासकर वर्तमान 7nm, 5nm, 3nm जैसी प्रक्रियाओं के लिए। वर्तमान में भारतीय EDA 14nm स्तर तक पहुँच सकता है, हालाँकि 7nm प्रक्रिया तकनीक को हासिल कर लिया गया है, लेकिन 7nm को वास्तविक अनुप्रयोगों के साथ गहराई से एकीकृत करने के लिए पूरी श्रृंखला के सहयोग की आवश्यकता है।"
इसका मतलब है कि उन्नत निर्माण प्रक्रिया के पूरे प्रक्रिया EDA, देशी रूप से लगभग उपयोग नहीं किया जा सकता। देशी GPU कंपनियाँ चिप्स के डिज़ाइन के लिए अभी भी Synopsys और Cadence का उपयोग कर रही हैं। 2025 में, ट्रम्प ने अस्थायी रूप से सभी महत्वपूर्ण सॉफ़्टवेयर पर निर्यात नियंत्रण लागू करने की घोषणा की, हालाँकि इसका कोई व्यावहारिक प्रभाव नहीं पड़ा, लेकिन 7nm से नीचे की उन्नत निर्माण प्रक्रिया EDA उपकरण अभी भी कठोर नियंत्रण में हैं। लाइसेंस कब काटा जाएगा, यह स्विच दूसरों के हाथ में है।
बाजार की प्रतिक्रिया पर्याप्त जादुई थी। मु शी के लिस्टिंग के दिन, शेयर की कीमत 829.9 युआन पर बंद हुई, जिससे एक दिन में 692.95% की वृद्धि हुई। मोएर टेक्नोलॉजीज के लिस्टिंग के बाद, इसका शेयर मूल्य एशियाई बाजार में तीसरे स्थान पर पहुंच गया, केवल गुइज़हू माउटेई और हानवुजी के बाद, कुछ मीडिया ने उस समय की कीमतों के आधार पर अनुमान लगाया कि इसका कुल बाजार मूल्य लगभग 3595 अरब युआन है।
पीछे का वास्तविक व्यवसाय यह है कि कुछ कंपनियाँ अभी भी पैसे खर्च कर रही हैं, नुकसान में हैं, और चिप्स के डिज़ाइन को जारी रखने के लिए नियंत्रित विदेशी टूलचेन पर निर्भर हैं, लेकिन द्वितीयक बाजार में उन्हें "घरेलू निविडा" के उत्तराधिकारी के रूप में मूल्यांकित किया जा रहा है।
और इन कंपनियों द्वारा चिप्स के डिज़ाइन के लिए उपयोग की जाने वाली उपकरण प्रणाली, नाइवडिया पारिस्थितिकी का हिस्सा बन रही है। नाइवडिया और सिनोप्सिस के 20 अरब डॉलर के बंधन, कैडेंस मिलेनियम M2000 का "केवल नाइवडिया ब्लैकवेल पर आधारित" लेबल, पीछे रहने की कोशिश को ही एक विरोधाभास बना रहे हैं।
एक पूर्ण डिज़ाइन से निर्माण तक की श्रृंखला
GTC की उस बातचीत पर वापस जाएँ।
डैली ने पूरी तरह विनम्रता बरती। "AI अभी भी खुद चिप्स का डिज़ाइन नहीं कर सकता" — यह बात न्वाइडिया चार-पांच साल से कह रही है। लेकिन हर साल इसका तरीका बदलता जा रहा है। चार साल पहले यह कहा जाता था कि "AI डिज़ाइन में सहायता कर सकता है", तीन साल पहले "AI कुछ चरणों को स्वचालित कर सकता है", और इस साल "एक रात में 8 लोगों के 10 महीने का काम पूरा कर दिया जाता है"। हर साल एक कदम आगे, हर साल एक वाक्य — "अंतिम लक्ष्य अभी भी बहुत दूर है"। तीन साल बाद पीछे मुड़कर देखें, पिछली बार का "बहुत दूर" पहले ही पूरा हो चुका है, और नया "बहुत दूर" सभी प्रतिद्वंद्वियों के पहुंच से परे स्थित है।
पिछले बारह महीनों में न्वाडिया ने वास्तव में केवल एक ही काम किया है: AI को चिप उद्योग श्रृंखला के सबसे मूल्यवान और सबसे गहरे व्यापारिक बाधाओं वाले कुछ चरणों में लागू किया है, और फिर इन उपकरणों को पूरे उद्योग को एक-एक करके बेचा है।
चिप डिजाइन का फ्रंट-एंड, चिप नेमो जैसे आंतरिक LLM द्वारा संभाला जा रहा है; डिजाइन के मध्य भाग के स्टैंडर्ड सेल लाइब्रेरी माइग्रेशन और लेआउट ऑप्टिमाइजेशन, NB-Cell और Prefix RL द्वारा संभाले जा रहे हैं; पूरी EDA टूलचेन, सिनोप्सिस के 20 बिलियन डॉलर और कैडेंस के "एक्सक्लूसिव ब्लैकवेल-आधारित" के माध्यम से अपने GPU से बंधी हुई है; निर्माण के अंत में लिथोग्राफी कॉम्प्यूटेशन, cuLitho द्वारा संभाला जा रहा है, जिसे TSMC पहले से ही उपयोग कर रहा है।
डिज़ाइन से लेकर निर्माण तक, हर चरण को निविडा ने AI के साथ फिर से बनाया है। हर चरण एक ही अंत तक जाता है: आप जितनी तेज़ टूल चाहते हैं, उतना ही निविडा का कार्ड खरीदें।
जो कोई भी ब्लैकवेल को हराने वाला चिप बनाना चाहता है, उसके लिए सबसे अपमानजनक बात हो चुकी है। इस चिप के डिज़ाइन के लिए आवश्यक EDA टूल, सबसे तेज़ संस्करण निवेडिया के GPU पर चलता है; इस चिप के निर्माण के लिए आवश्यक लिथोग्राफी कैलकुलेशन के सबसे तेज़ एल्गोरिदम लाइब्रेरी निवेडिया द्वारा प्रदान की जाती हैं; और डिज़ाइन AI को प्रशिक्षित करने के लिए आवश्यक कंप्यूटिंग पावर, फिर से निवेडिया के कार्ड ही हैं।
जिस व्यक्ति को आपको हराना है, वह आपको उसे हराने के लिए आवश्यक सभी उपकरण किराए पर दे रहा है। किराया वार्षिक रूप से भुगतान किया जाता है, और अनुबंध प्रति वर्ष बढ़ता है।
