DeepSeek ने API लागत 100 गुना कम कर दी, जिससे AI बुनियादी ढांचे की केंद्रीकरण पर बहस शुरू हो गई

—— गोंका के LA Hacks 2026 में भाषण से शुरू

26 अप्रैल को, DeepSeek ने V4 सीरीज़ API के नए मूल्य की घोषणा की: सभी इनपुट कैश हिट मूल्य में पहले के मूल्य का दसवाँ हिस्सा हो गया, Pro संस्करण पर सीमित समय की छूट जोड़ने के बाद, एक मिलियन Token की प्रोसेसिंग लागत केवल 0.025 युआन है—जो एक साल पहले की तुलना में लगभग सौ गुना सस्ता है। उसी दिन A-शेयर कैलकुलेशन सेक्टर ने सभी स्टॉक्स में प्रतिबंध लगा दिया, और बाजार का मनोबल उबल पड़ा।

लेकिन तालियों के पीछे, एक सवाल है जिसकी कोई सीधे तौर पर चर्चा नहीं कर रहा है: जब मॉडल हर बार सस्ते होते जा रहे हैं, तो मॉडल चलाने के लिए आवश्यक कंप्यूटिंग पावर अधिक केंद्रीय होती जा रही है।

डेटा झूठ नहीं बोलता। 2025 की चौथी तिमाही में, माइक्रोसॉफ्ट, अमेज़ॉन, मेटा और गूगल जैसे चार क्लाउड फर्मों का संयुक्त पूंजी खर्च 64% बढ़कर 1186 अरब डॉलर हो गया; 2026 के पूरे वर्ष के लिए संयुक्त पूंजी खर्च में 53% की वार्षिक वृद्धि का अनुमान है, जो 5708 अरब डॉलर तक पहुँचेगा। गूगल ने समान अवधि में 2026 के लिए TPU चिप की डिलीवरी लक्ष्य को 50% बढ़ाकर 60 लाख इकाइयों कर दिया। कुछ बाजारों में निवेडिया H100 सीरीज़ की डिलीवरी की अवधि कई महीनों तक हो चुकी है।

मॉडल स्तर पर मूल्य निर्धारण का अधिकार विकासकों की ओर झुक रहा है, लेकिन कैलकुलेशन क्षमता स्तर पर नियंत्रण कम से कम कुछ विशालकायों की ओर तेजी से केंद्रित हो रहा है। यह AI युग का एक छिपा हुआ लेकिन गहरा विरोधाभास है।

गोंका

इस संदर्भ में, 24 अप्रैल, 2026 को, गोंका प्रोटोकॉल के सह-संस्थापक डैनिल और डेविड लिबरमैन ने LA Hacks 2026 के प्रमुख सम्मेलन पर कदम रखा। इस UCLA की वार्षिक सबसे बड़ी कॉलेज हैकथॉन में, इस वर्ष लिबरमैन भाइयों को प्रमुख वक्ता के रूप में आमंत्रित किया गया था, जिनके सामने सैकड़ों ऐसे शीर्ष इंजीनियर थे जो इस क्षेत्र में प्रवेश करने वाले थे। उनके द्वारा उठाया गया प्रश्न, इस समय विशेष रूप से स्पष्ट था: डिसेंट्रलाइज्ड कंप्यूटिंग पावर, क्या अभी भी समय है?

एक, कीमत में कमी की लहर का दूसरा पहलू

डीपसीक V4 की कीमत में कमी का तर्क, दिखने में तकनीकी प्रगति से आने वाली दक्षता का लाभ है—नया ध्यान तंत्र Token आयाम को संकुचित करता है, और DSA विरल ध्यान के साथ मिलकर, गणना और वीडियो मेमोरी की मांग को काफी कम करता है। लेकिन कीमत में लगातार कमी हो पाने की आधारशिला यह है कि कहीं न कहीं कैलकुलेशन क्षमता पर्याप्त रूप से उपलब्ध और सस्ती है।

वास्तविकता यह है कि यह «पर्याप्त» कैलकुलेशन स्रोत, वैश्विक स्तर पर तेजी से कुछ ही नोड्स की ओर एकत्रित हो रहा है। ऑप्टिकल कम्युनिकेशन के नेता Lumentum के सीईओ माइकल हर्लस्टन ने हाल ही में कहा कि वर्तमान प्रवृत्ति के अनुसार, कंपनी की 2028 तक की उत्पादन क्षमता लगभग पूरी तरह से बिक चुकी है। यह केवल एक कंपनी की समस्या नहीं है, बल्कि AI बुनियादी ढांचे की पूरी सप्लाई चेन है, जो तेजी से बढ़ती मांग के सामने सामूहिक रूप से तनावग्रस्त है।

डैनिल ने LA Hacks के स्पीच में एक सरल लेकिन शक्तिशाली तुलना प्रस्तुत की: बिटकॉइन नेटवर्क की कैलकुलेशन क्षमता, गूगल, माइक्रोसॉफ्ट और एमएज़ॉन के तीनों क्लाउड डेटासेंटर्स की कुल क्षमता से अधिक है—लेकिन ये कैलकुलेशन क्या कर रहे हैं? वे एक ऐसे हैश पहेली को हल कर रहे हैं जिसका कोई उत्तर नहीं चाहता। वैश्विक अव्यवस्थित GPU कैलकुलेशन के साथ भी ऐसा ही है: गेमर्स के मशीनों में कार्ड, विश्वविद्यालय के कंप्यूटर हॉल में सर्वर, और छोटे-मध्यम बादल सेवा प्रदाताओं के पास उपलब्ध संसाधन—इनका कुल आकार विशाल है, लेकिन समन्वय प्रणाली की कमी के कारण AI निष्कर्षण के लिए इस्तेमाल नहीं किए जा सकते।

गोंका द्वारा हल किए जा रहे समस्या, यह समन्वय समस्या है—कार्य सबूत के प्रोत्साहन तंत्र का उपयोग करके, विश्वभर में बिखरे हुए अव्यवहृत GPU को एक ऐसे नेटवर्क में संगठित करना जो वास्तविक AI अनुमान कार्यों को संभाल सके।

द्वितीय, निष्कर्ष निकालना नया क्षेत्र है

डीपसीक की कीमत में कमी ने चीनी इंटरनेट पर 'AI पारितोषिक' के बारे में व्यापक चर्चा को जन्म दिया। लेकिन एक उपेक्षित बात यह है: कीमत में कमी 'कॉल प्राइस' पर हुई है, 'कैलकुलेशन लागत' पर नहीं। AI अनुप्रयोगों के स्केलिंग के साथ, इन्फरेंस कॉल्स की मात्रा में घातीय वृद्धि हो रही है—उद्योग के अनुमानों के अनुसार, 2026 तक, इन्फरेंस विश्वव्यापी AI कैलकुलेशन खपत का लगभग दो-तिहाई होगा।

इसका क्या अर्थ है? हर एक स्तर कम लागत पर कॉल करने पर, वास्तविक रूप से आवश्यक कुल कैलकुलेशन क्षमता अधिक होगी, कम नहीं। बड़े मॉडल की 'लोकतांत्रिकता' किसी न किसी रूप में कैलकुलेशन स्तर की केंद्रीयकरण को तेज कर रही है—क्योंकि केवल वे ही खिलाड़ी हैं जिनके पास बड़े पैमाने पर कैलकुलेशन क्षमता है, और जो अत्यधिक कम मुनाफा मार्जिन के साथ इन्फरेंस सेवाओं के संचालन को बनाए रख सकते हैं।

यह एक बनती हुई संरचनात्मक बंदबंदी है: जो व्यक्ति रीजनिंग साइड की भौतिक कैलकुलेशन क्षमता पर काबिज है, वही AI युग का वास्तविक बुनियादी ढांचा एंट्री पॉइंट नियंत्रित करता है। इस दृष्टिकोण से, डिसेंट्रलाइज्ड कैलकुलेशन नेटवर्क का महत्व केवल '50% सस्ता' लागत अनुकूलन नहीं है, बल्कि केंद्रीकृत बंदबंदी पूरी होने से पहले एक संरचनात्मक वैकल्पिक मार्ग प्रदान करना है।

तीसरा: युवा निर्माताओं के प्रति वास्तविक प्रश्न

LA Hacks के प्रतिभागी—कैलिफोर्निया के शीर्ष विश्वविद्यालयों के इंजीनियर और प्रोडक्ट लोग—जल्द ही एक अनुकूलित इंजीनियरिंग विकल्प का सामना करेंगे: अपने उत्पाद को किस कैलकुलेशन लेयर पर बनाएं।

आपके AI उत्पाद का निष्कर्षण किस सर्वर पर होता है?

जब उस प्लेटफॉर्म की कीमत निर्धारण रणनीति या एक्सेस नीति में बदलाव होता है, तो क्या आपके पास स्थानांतरण की क्षमता है?

आपके द्वारा बनाई गई उपयोगकर्ता संख्या, क्या आपको खुद के लिए मूल्य बना रही है, या प्लेटफॉर्म को चिप्स प्रदान कर रही है?

वेब2 के युग में डेवलपर्स ने पहले ही इन समस्याओं का अनुभव किया है: जब एप्लिकेशन की भाग्य एक प्लेटफॉर्म के एल्गोरिदम या वितरण नियमों से गहराई से जुड़ा होता है, तो 'स्वतंत्रता' एक ऐसा शब्द बन जाता है जिसे लगातार पुनः परिभाषित करने की आवश्यकता होती है। AI के युग में कैलकुलेशन पर निर्भरता, बुनियादी ढांचे के स्तर पर समान तर्क को दोहराएगी, और क्योंकि स्विचिंग लागत अधिक होगी, लॉक-इन प्रभाव केवल मजबूत होगा।

गोंका

हैकथॉन, एक रूप के रूप में, अपने भीतर विरोधाभासी है: 36 घंटे में, न्यूनतम संसाधनों और सबसे तेज़ गति से कार्यात्मक चीज़ बनाना—यही तो डिसेंट्रलाइज्ड नेटवर्क के प्रोत्साहन तंत्र का लक्ष्य है। डैनिल LA Hacks पर स्टेज पर खड़े हुए, सिर्फ़ गोंका के बारे में बात करने के लिए नहीं, बल्कि इस समूह से पूछने के लिए थे: आपका भविष्य का काम, क्या इस केंद्रीकृत प्रवृत्ति को तेज़ करने में मदद कर रहा है, या नए संभावनाएँ बना रहा है?

चार: PoW 2.0: एक इंजीनियरिंग प्रश्न

Gonka ने साबित करने के लिए प्रेरणा संरचना को हैश गणना से AI निष्कर्षण की ओर पुनः अभिविन्यासित किया, जिससे नेटवर्क में लगभग 100% की कैलकुलेशन योगदान सीधे वास्तविक कार्यों से संबंधित होता है। इस तंत्र के लिए एक इंजीनियरिंग की महत्वपूर्ण आवश्यकता है: AI निष्कर्षण कार्य जाँचने योग्य और पुनर्निर्मित करने योग्य होने चाहिए—समान मॉडल वेट, समान रैंडम सीड और इनपुट देने पर, कोई भी नोड गणना परिणाम को पुनः उत्पन्न कर सकता है और उसकी वैधता की पुष्टि कर सकता है। यही Gonka के लिए शैक्षणिक प्रोटोटाइप से संचालनयोग्य नेटवर्क में परिवर्तन की मुख्य इंजीनियरिंग चुनौती है।

आर्थिक दृष्टिकोण से, इस तंत्र का महत्व यह है कि टोकन का मूल्य प्राकृतिक रूप से भौतिक कैलकुलेशन लागत से जुड़ा हुआ है, न कि तरलता के भावनात्मक पहलू से। कैलकुलेशन योगदान देने वाले माइनर्स को पुरस्कार मिलता है, जबकि कैलकुलेशन का उपयोग करने वाले डेवलपर्स शुल्क देते हैं, और पूरी प्रणाली का प्रोत्साहन चक्र किसी मध्यस्थ की कृपा पर निर्भर नहीं होता।

बेशक, तकनीकी संभवता केवल एक हिस्सा है। अधिक कठिन प्रश्न यह है: गणना क्षमता की मांग तेजी से बढ़ रही है और बड़े खिलाड़ियों के पूंजी खर्च अरब डॉलर के स्तर पर हैं, ऐसे समय में, समुदाय द्वारा स्वयं की योगदान से संगठित एक वितरित गणना क्षमता नेटवर्क, क्या स्केल पर वास्तविक प्रतिस्पर्धा बना सकता है?

गोंका के प्रारंभिक डेटा एक संदर्भ बिंदु प्रदान करते हैं: मेननेट लॉन्च से कम एक वर्ष में, नेटवर्क की संयुक्त कैलकुलेशन क्षमता 60 H100 इकाइयों से बढ़कर 10,000 से अधिक हो गई, जो केंद्रीकृत आवंटन के बजाय वैश्विक सैकड़ों स्वतंत्र नोड्स के स्वयंसेवी संलग्न होने से प्राप्त हुई। यह साबित नहीं करता कि पैमाने की समस्या हल हो चुकी है, लेकिन यह दर्शाता है कि प्रेरणा प्रणाली ने प्रारंभिक वृद्धि को प्रभावी ढंग से प्रेरित किया है।

पांचवां: विंडो पीरियड की समस्याएं

इतिहास में, बुनियादी ढांचे का नियंत्रण अक्सर प्रारंभिक चरण में तेजी से संकुचित हो जाता है—रेलवे युग में ऐसा हुआ, इंटरनेट युग में ऐसा हुआ, और मोबाइल इंटरनेट युग में भी ऐसा हुआ। हर बार, कुछ लोगों ने मानकों के स्थिर होने से पहले ही अपना स्थान प्राप्त कर लिया, जबकि कुछ लोगों ने केंद्रीकरण पूरा होने के बाद ही अहसास किया कि भागीदारी का अवसर काफी सीमित हो चुका है।

AI कैलकुलेशन बुनियादी ढांचा वर्तमान में किस चरण पर है? चार प्रमुख क्लाउड फर्मों के 2026 के लिए 5708 अरब डॉलर के अपेक्षित पूंजी खर्च के आधार पर, केंद्रीकरण तेजी से बढ़ रहा है; लेकिन विकासकों के वास्तविक उपयोग पैटर्न के आधार पर, आपूर्ति पक्ष पर अभी भी कई अनुपयोगित संसाधन मौजूद हैं। यह अंतराल, विकेंद्रीकृत नेटवर्क के लिए संरचनात्मक रूप से मौजूद होने का स्थान है।

डैनिल ने एक तुलना का उल्लेख किया: 2000 के इंटरनेट बुलबुले के फूटने के बाद, जो बचा वह खंडहर नहीं, बल्कि पूरी दुनिया में फैले ऑप्टिकल फाइबर नेटवर्क थे, जिन्होंने अगले दो दशकों तक डिजिटल अर्थव्यवस्था को संचालित किया। AI बुनियादी ढांचे में निवेश की लहर के उतार-चढ़ाव के बाद, जो कैलकुलेशन प्रोटोकॉल और प्रोत्साहन तंत्र बचेंगे, वे अगले चक्र का आधारभूत ढांचा बन जाएंगे—सवाल सिर्फ यह है कि कौन से प्रोटोकॉल का नींव का तर्क पर्याप्त मजबूत है, ताकि दबाव के बावजूद वे काम करते रहें।

यह किसी विशिष्ट प्रोजेक्ट के बारे में नहीं है, बल्कि पूरे डिसेंट्रलाइज्ड AI सेक्टर को सामना करना पड़ रहा है: गवर्नेंस डिज़ाइन वास्तव में एकल बिंदु नियंत्रण के क्षय का प्रतिरोध कर सकता है? प्रोत्साहन तंत्र मापक बढ़ने के बाद भी प्रभावी रहता है? कैलकुलेशन नेटवर्क की डिसेंट्रलाइजेशन, तकनीकी कार्यान्वयन स्तर, टोकन जारीकरण स्तर और अपग्रेड निर्णय स्तर पर एक साथ सत्य है?

निष्कर्ष

DeepSeek के मूल्य में कमी से 'AI डेमोक्रेटाइजेशन' की कहानी फिर से जीवित हो गई है। लेकिन डेमोक्रेटाइज्ड रीजनिंग कॉल और डेमोक्रेटाइज्ड कैलकुलेशन इंफ्रास्ट्रक्चर दो अलग बातें हैं। पहली चीज अभी हो रही है; दूसरी चीज हो पाएगी या नहीं, यह इस बात पर निर्भर करता है कि अगले कुछ वर्षों में कितने लोग इसे एक वास्तविक इंजीनियरिंग समस्या के रूप में समझेंगे, और केवल एक सुनहरी कहानी नहीं।