DeepSeek V4 और Meituan LongCat 2.0 ट्रिलियन-पैरामीटर सीमा को तोड़ते हैं

icon MarsBit
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
DeepSeek V4 और Meituan LongCat 2.0-Preview दोनों ने ट्रिलियन पैरामीटर की सीमा पार कर ली है, जिसका 1M संदर्भ लंबाई के लिए समर्थन है। DeepSeek V4 ने NVIDIA के CUDA से Huawei Ascend पर स्विच कर दिया है। LongCat 2.0 के प्रशिक्षण और निष्कर्षण के लिए 50,000–60,000 घरेलू चिप्स का उपयोग किया जाता है। घरेलू AI मॉडल्स के लोकप्रिय होने के साथ भय और लालच सूचकांक अभी भी उच्च स्तर पर है।

देशी AI उद्यम अपने स्वयं के मार्ग बनाने का प्रयास करने लगे हैं।

इस साल की शुरुआत में, विदेशी टेक समुदाय चीन की कैलकुलेशन क्षमता पर ध्यान केंद्रित कर रहे हैं।

जनवरी में, मस्क ने एक पॉडकास्ट में कहा कि चीन AI कैपेसिटी पर «दुनिया के अन्य क्षेत्रों से कहीं अधिक आगे निकल जाएगा»। फरवरी में, OpenAI के सीईओ ऑटमैन ने कहा कि चीन में कृत्रिम बुद्धिमत्ता के क्षेत्र में तकनीकी प्रगति «अविश्वसनीय रूप से तेज» है। NVIDIA के सीईओ हुआंग रेन्क्सन ने भी कई बार सार्वजनिक रूप से कहा: «चीन की AI तकनीक पर प्रतिबंध लगाने से इसका स्वदेशी विकास तेज होगा»।

2025 को सप्लाई साइड के संगठन का वर्ष कहा जा सकता है। मोएर टेक्नोलॉजी, मू जी शेयर्स जैसे घरेलू GPU क्रमिक रूप से पूंजी बाजार में प्रवेश कर रहे हैं, जिससे घरेलू बड़े मॉडल की उद्योग आधारशिला और मजबूत हो रही है। 2026 में, परिवर्तन श्रृंखला के नीचे की ओर स्थानांतरित हो रहे हैं, अप्रैल के अंत में, कई घरेलू बड़े मॉडल नए संस्करण जारी किए गए।

20 अप्रैल को, मून ऑफ द डार्क साइड ने लंबी दूरी के कोडिंग में कुशल किमी K2.6 मॉडल लॉन्च किया; 24 अप्रैल को, डीपसीक V4 जारी किया गया; इसके बाद मेन्यू LongCat-2.0-Preview का प्रीव्यू टेस्टिंग शुरू हुआ, दोनों की कुल पैरामीटर स्केल ट्रिलियन से अधिक है और दोनों 1M अत्यधिक लंबे कंटेक्स्ट का समर्थन करते हैं।

ध्यान देने योग्य बात यह है कि DeepSeek V4 ने निविडा प्लेटफॉर्म से हुआवेई शेंगटेंग प्लेटफॉर्म पर स्थानांतरण और अनुकूलन पूरा किया है; जबकि मेन्गुआन LongCat2.0 एक ट्रिलियन पैरामीटर वाला मॉडल है जिसका प्रशिक्षण और निष्कर्षण पूरी तरह से घरेलू कैलकुलेशन पावर पर आधारित है, जिसमें 50,000 से 60,000 घरेलू कैलकुलेशन चिप्स का उपयोग किया गया है।

लंबे समय तक, चीनी AI पेशेवरों की सामान्य रणनीति पहले से मौजूद परिपक्व समाधानों का लाभ उठाना रही है। अब, घरेलू AI कंपनियाँ अपना स्वयं का मार्ग बनाने का प्रयास कर रही हैं।

राह बनाना जंगल में

आप एक कठिन कार्य को कैसे पूरा करें?

Science fiction author Arthur Clarke's answer was: "The only way is to make the impossible the starting point of progress."

डीपसीक V4 को शुरू में निर्धारित किया गया था, लेकिन अंतिम प्रकाशन तक कई बार समय में बदलाव किया गया। बाहरी रूप से अनुमान लगाया जा रहा है कि इसका एक कारण, कोर कोड को निविडा के CUDA से स्थानांतरित करने की आवश्यकता है।

CUDA इकोसिस्टम को कई दशकों के विकास के बाद एक शक्तिशाली और सुव्यवस्थित डेवलपमेंट प्लेटफॉर्म बना दिया गया है। देशी कैलकुलेशन इकोसिस्टम अभी शुरुआती चरण में है। कोड को स्थानांतरित करने की प्रक्रिया का अर्थ है कि डेवलपमेंट टीम को काफी निचले स्तर के फ्रेमवर्क के पुनर्निर्माण का कार्य करना पड़ेगा।

अंततः, डीपसीक ने यह कर दिखाया, V4 के लॉन्च के दो दिन बाद, जेपी मॉर्गन ने एक रिपोर्ट में बताया कि V4 सफलतापूर्वक हुआवेई के Ascend चिप्स के साथ समायोजित हो गया है, जिससे घरेलू कैलकुलेशन क्षमता की अग्रणी AI निष्कर्षण पर संभावना साबित हुई; और डीपसीक ने मिश्रित ध्यान आर्किटेक्चर जैसी नींव की तकनीकी नवाचारों के माध्यम से निष्कर्षण लागत में महत्वपूर्ण कमी की है।

DeepSeek ने तकनीकी जुनून के साथ लागत कम करके दक्षता बढ़ाई, जिसमें एक बड़े मॉडल के आधे कार्य को पुनः लिखकर कठोर स्थानांतरण पूरा किया गया। उसी दिन लॉन्च किए गए Meituan LongCat-2.0-Preview को सीधे देशी कैलकुलेशन पर चलाया गया है।

इंजीनियरिंग स्तर पर, घरेलू कैलकुलेशन क्षमता के क्या कठिनाइयाँ हैं? आइए LongCat-2.0-Preview के उदाहरण से देखें।

पहली कठिनाई भौतिक स्तर पर है। घरेलू हार्डवेयर प्लेटफॉर्म की वीडियो मेमोरी क्षमता और बैंडविड्थ निविडा चिप्स से भिन्न है, जब मेन्यू टीम ट्रिलियन पैरामीटर मॉडल के प्रशिक्षण और डिप्लॉयमेंट के दौरान इंजीनियरिंग संबंधी बड़ी चुनौतियों का सामना करती है, जिसमें समानांतर रणनीति को डीबग करने और वीडियो मेमोरी को अनुकूलित करने के लिए अधिक प्रयास की आवश्यकता होती है।

दूसरी कठिनाई, सॉफ्टवेयर इकोसिस्टम की परिपक्वता है, जिसमें घरेलू चिप की विशेषताओं के अनुसार, प्रशिक्षण के पूरे चक्र की सटीकता और पुनर्निर्माणयोग्यता सुनिश्चित करने के लिए टीम को मुख्य ऑपरेटर को पुनः लिखना और अनुकूलित करना होगा, और स्वयं डिज़ाइन किए गए पूर्ण निर्धारणात्मक ऑपरेटर विकसित करने होंगे।

तीसरी चुनौती है वनका क्लस्टर की स्थिरता, जहां 50,000 से 60,000 देशी कैलकुलेशन कार्ड्स के साथ अत्यधिक विशाल क्लस्टर का उपयोग किया जाता है, जहां हार्डवेयर खराबी अपरिहार्य है। इसके लिए, टीम ने एक पूर्ण त्रुटि सहनशीलता और स्वचालित पुनर्स्थापना प्रणाली विकसित की है।

अंत में, घरेलू हार्डवेयर की विशेषताओं के आधार पर, टीम ने ट्रेनिंग फ्रेमवर्क और मॉडल स्ट्रक्चर में विशिष्ट अनुकूलन किया, जिससे सामान्य फ्रेमवर्क के अनुकूलन की सीमाओं को तोड़ दिया गया और कैलकुलेशन प्रदर्शन में सुधार हुआ।

डीपसीक के एल्गोरिदम अनुकूलन ने कैलकुलेशन की आवश्यकता को कम किया और मॉडल की कीमतों को कम कर दिया; मेन्यू के इंजीनियरिंग अभ्यास ने घरेलू चिप्स की संभावना को साबित किया। ये अन्वेषण घरेलू चिप इकोसिस्टम को इंजीनियरिंग क्षमताओं और अनुभव प्रदान करते हैं।

लियांग वेनफेंग ने कहा था: "हम जानबूझकर एक बास नहीं बनना चाहते थे, बस अनजाने में एक बास बन गए," और अब "बास प्रभाव" स्पष्ट हो चुका है, डीपसीक केवल अकेला नहीं है।

एकल बिंदु से सिस्टम तक

टेंसेंट क्लाउड के तांग डाओशेंग ने एक उपमा दी थी: "बड़ा मॉडल इंजन है, और उपयोगकर्ता ड्राइवर है।" उपयोगकर्ता आसानी से इंजन के प्रदर्शन को ध्यान में रखते हैं, लेकिन एक उत्कृष्ट ड्राइवर, ईंधन और चेसिस के बराबर महत्व को समझता है।

चीन की कैलकुलेशन क्षमता का विकास पूरी श्रृंखला के सहयोगात्मक प्रगति पर निर्भर करता है। प्रत्येक चरण की प्रमुख कंपनियाँ लगातार कमजोरियों को पूरा कर रही हैं।

निर्माण छोर पर, जनसामान्य डेटा दर्शाता है कि चीन में चिप उत्पादन लगातार बढ़ रहा है, लेकिन यह "डंबल-आकार" संरचना है, जिसमें 28nm से ऊपर के परिपक्व प्रक्रिया अग्रणी हैं, और 14nm और उससे कम की उन्नत प्रक्रिया क्षमता अभी भी सीमित है।

ईयूवी लिथोग्राफी मशीन की कमी के संदर्भ में, SMIC, Hua Hong Semiconductor जैसी कंपनियाँ बहु-एक्सपोजर जैसी प्रक्रियाओं पर काम कर रही हैं और भौतिक सीमाओं के भीतर संतुलन ढूंढने का प्रयास कर रही हैं। कई रिपोर्ट्स के अनुसार, SMIC की N+2 प्रक्रिया (7nm के समकक्ष) की उत्पादन दक्षता 80% से अधिक पार कर चुकी है, जिसका अर्थ है कि व्यावसायिक उत्पादन की सीमा पार कर ली गई है।

कैलकुलेशन एंड पर, देशी चिप्स अभी भी निविडा के साथ एकल कार्ड कैलकुलेशन क्षमता में अंतर रखते हैं। हुआवेई के शेंगटें 910C जैसे उत्पादों के अभ्यास से पता चलता है कि अत्यधिक क्लस्टर लीनियर एक्सेलरेशन अनुपात के माध्यम से भी बड़े मॉडल ट्रेनिंग को सफलतापूर्वक चलाया जा सकता है।

जो इकोसिस्टम को प्राप्त करता है, वही दुनिया को प्राप्त करता है। निविडा CUDA द्वारा निर्मित रक्षात्मक खाई इतनी गहरी है क्योंकि इसने एक सार्वभौमिक सॉफ्टवेयर-हार्डवेयर संगत मानक बनाया है।

उद्योग के पेशेवर भी इसे समझते हैं। उदाहरण के लिए, Cambricon ने एक बेसिक सॉफ्टवेयर प्लेटफॉर्म लॉन्च किया है जो प्रमुख फ्रेमवर्क्स के साथ संगत है और डेवलपर्स के लिए स्थानांतरण की बाधाओं को कम करता है। Zhiyuan AI रिसर्च इंस्टीट्यूट द्वारा नेतृत्व किए जा रहे ओपन-सोर्स सिस्टम ने एक समान नीचले स्तर के इंटरफेस का निर्माण किया है, जिससे ऊपरी मॉडल कई अलग-अलग घरेलू चिप्स पर चलाए जा सकते हैं।

देशी इंटरनेट बड़े कंपनियों ने भी कई कदम उठाए हैं, बैइडु की डुअल-ट्रैक रणनीति और बाइटडांस का खर्च अरबों में, दोनों ही कैलकुलेशन बेसिस के लिए बेहतर समाधान ढूंढ रहे हैं।

प्रकाशित डेटा के आधार पर, पिछले कुछ वर्षों में Meituan ने कम से कम 21 कंपनियों में निवेश किया है, जो अर्धचालक/बुद्धिमान हार्डवेयर और सामान्य बड़े मॉडल क्षेत्रों को कवर करती हैं। इनमें चिप कैलकुलेशन स्तर की Moore Threads और Muxi Semiconductor, तथा विज़ुअल चिप क्षेत्र की Axel Yuanzhi शामिल हैं; साथ ही, नए सामग्री जैसे विशिष्ट क्षेत्रों में Guangzhou Zhongshan और Oriental Computing Chip जैसी कई कंपनियाँ भी हैं।

जबकि तकनीकी रूप से लगातार अपडेट किया जा रहा है, उद्योग रूपी पूंजी भी कैलकुलेशन क्षमता में निवेशक और सह-निर्माता के रूप में कार्य कर रही है, जिससे धीरे-धीरे एक सकारात्मक चक्र बन रहा है।

डिजिटल दुनिया से, वास्तविक कार्यों तक

वर्तमान में कृत्रिम बुद्धिमत्ता तीसरी लहर के एक महत्वपूर्ण मोड़ पर है, बड़े मॉडल इसे कमजोर कृत्रिम बुद्धिमत्ता से सामान्य कृत्रिम बुद्धिमत्ता की ओर ले जा रहे हैं, और अधिक महत्वपूर्ण बात यह है कि वे रोबोट को 1.0 विशिष्ट रोबोट युग से 2.0 सामान्य शरीरयुक्त बुद्धिमत्ता युग में ले जा रहे हैं।

बीजिंग ज़हुयुआन आर्टिफिशियल इंटेलिजेंस इंस्टीट्यूट के अध्यक्ष वांग ज़होंगयुआन के शब्दों में, AI क्षमताओं का महत्वपूर्ण बिंदु भौतिक दुनिया है।

एक ओर, कई घरेलू निर्माता महान मॉडल को क्लाउड पर "हजारों पुस्तकें पढ़ने" के लिए समर्पित हैं, जिससे मॉडल की बुद्धिमत्ता और तार्किक तर्क की कठोरता में सुधार होता है। दूसरी ओर, महान मॉडल को "हजारों मील की यात्रा करने" के लिए भी तैयार किया जा रहा है, जैसे कि वेनसिन महान मॉडल को ऑटोनॉमस ड्राइविंग निर्णय प्रणाली में एम्बेड किया गया है; हुनयुन महान मॉडल का औद्योगिक गुणवत्ता निरीक्षण समाधान कई उत्पादन लाइन स्थितियों में प्रकट हो चुका है।

मे�იटुआन के डिलीवरी, स्टोर-बेस्ड सेवाएँ, होटल और यात्रा जैसे बिजनेस, दैनिक जीवन में सबसे जटिल कार्य निष्पादन नेटवर्क का निर्माण करते हैं। यहाँ असंख्य वास्तविक परिदृश्य हैं: व्यापारी के रसोईघर की खाना तैयार करने की गति से लेकर सवार बारिश में डिलीवरी के मार्ग तक, और फिर उपभोक्ता की रात के समय की एक बात—“मुझे फोन्ग हुआ खाना चाहिए।”

वांग शिंग ने स्पष्ट रूप से घोषणा की थी कि मेइटुआन ऐप को सबसे पहले «AI-सक्षम ऐप» में अपग्रेड किया जाएगा। इसका अर्थ है कि लॉंगकैट का प्रशिक्षण लक्ष्य केवल यह जवाब देना नहीं है कि “किसकी छोटी सब्ज़ी स्वादिष्ट है”, बल्कि “उस दुकान को ढूंढना, सर्वोत्तम ग्रुप डील कूपन चुनना, और फिर दो शुक्रवार की शाम 7 बजे के सीट बुक करना” है।

इसका अर्थ है कि कार्य के वितरण का प्रभाव अत्यंत महत्वपूर्ण है, और यह समझाता है कि मेन्गुआ क्यों भौतिक दुनिया के एआई आधार को विकसित करने पर जोर दे रहा है।

पैरामीटर बढ़ाने से लेकर कैलकुलेशन पावर तक, घरेलू बड़े मॉडल 'उपयोगयोग्य' से 'अच्छी तरह उपयोगयोग्य' तक के विकास को पूरा कर रहे हैं।

इस रास्ते पर कोई छोटा रास्ता नहीं है। भविष्य में, जब एल्गोरिदम, कैलकुलेशन क्षमता, धन और स्थितियाँ लगातार रासायनिक प्रतिक्रिया करती रहेंगी, तो चीनी AI की कहानी भी 'एकल ब्रेकथ्रू' से 'सिस्टम एवोल्यूशन' के पन्ने पर पलट जाएगी।

यह लेख वेचेन ग्रुप "लानडोंग बिजनेस" से आया है, लेखक: यू वेइलिन

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।