चीनी एआई का मील का पत्थर: 1.6 ट्रिलियन पैरामीटर वाला डीपसीक मॉडल घरेलू एसेंड 910सी पर पूरी तरह से प्रशिक्षित

ME AI संदेश, डोंगचा द्वारा मॉनिटर किए जाने पर, शेन्ज़ेन हेसुआई कॉलेज, हार्बिन इंजीनियरिंग विश्वविद्यालय (शेन्ज़ेन), शेन्ज़ेन बड़े डेटा रिसर्च इंस्टीट्यूट और हुआवेई संबंधित टीमों द्वारा गठित, और शेन्ज़ेन ज़हुईचेंग AI कैलकुलेशन प्लेटफॉर्म के सहयोगी अनुसंधान टीम द्वारा, घरेलू AI कैलकुलेशन प्लेटफॉर्म पर 1.6 ट्रिलियन पैरामीटर के बड़े मॉडल DeepSeek-V4-Pro का पूर्ण पैरामीटर पोस्ट-ट्रेनिंग (Post-training) सफलतापूर्वक चलाया गया है। यह वैश्विक स्तर पर पहली बार कोई तीसरा पक्ष संगठन है जिसने घरेलू कैलकुलेशन प्लेटफॉर्म पर 1.6 ट्रिलियन पैरामीटर स्केल के मॉडल का पूर्ण पैरामीटर पोस्ट-ट्रेनिंग पूरा किया है। शून्य से प्री-ट्रेनिंग (Pre-training) के विपरीत, पोस्ट-ट्रेनिंग चरण (जिसमें मुख्य रूप से सुपरवाइज्ड फाइन-ट्यूनिंग SFT और रीइनफोर्समेंट लर्निंग RL शामिल है) उच्च गुणवत्ता वाले निर्देशों और मानव प्राथमिकताओं के माध्यम से मॉडल को निर्देशों का पालन करने और विशिष्ट कार्यों को संपादित करने के लिए प्रशिक्षित करता है। हालाँकि, 1.6 ट्रिलियन पैरामीटर MoE आर्किटेक्चर मॉडल के लिए, पूर्ण पैरामीटर पोस्ट-ट्रेनिंग नीचले हार्डवेयर की VRAM क्षमता, मल्टी-कार्ड के बीच संचार बैंडविड्थ (जैसे MoE रूटिंग द्वारा सक्रिय होने वाला सभी-से-सभी संचार) और बड़े समूह की स्थिरता के लिए बहुत कठोर आवश्यकताएँ रखता है। संयुक्त अनुसंधान टीम ने हुआवेई Ascend 910C कैलकुलेशन क्लस्टर, जो 1000 से अधिक चिप्स के स्केल पर है, का उपयोग करते हुए, वितरित होस्टिंग और लोड-बैलेंसिंग रणनीति में सुधार के माध्यम से संचार की संकीर्णता को सफलतापूर्वक दूर किया। 1500 से अधिक स्टेप्स की प्रशिक्षण प्रक्रिया में, सिस्टम में कभी भी विघटन नहीं हुआ, मॉडल कैलकुलेशन उपयोग (MFU) 30% से अधिक हुआ, महत्वपूर्ण कैलकुलेशन ऑपरेटर की कुशलता 14% बढ़ी, और सभी संकेतक औद्योगिक स्तर के संचालन मानकों को प्राप्त करते हैं। उद्योग के विश्लेषकों का मानना है कि हुआवेई Ascend 910C क्लस्टर की सफलता, 10000+ पैरामीटर मॉडल प्रशिक्षण में, प्रमाणित करती है कि घरेलू AI चिप,अति-विशाल मॉडल के गहन प्रशिक्षण के कार्यों को संभालने में प्रावधानिक संभवता है। पहले, महान मॉडलों के विकास में प्रमुख प्री-ट्रेनिंग मुख्यतः NVIDIA GPU क्लस्टर पर निर्भर करती थी, और घरेलू कैलकुलेशन मुख्यतः अनुमान (Inference) या सामान्य-पैरामीटर फाइन-ट्यूनिंग के कार्यों में ही सीमित होता था। इस संयुक्त प्रयास की सफलता,घरेलू कैलकुलेशन पारिस्थिति के 'केवलअनुमान' से 'अति-विशाल पैरामीटर मॉडल के पूर्ण प्रशिक्षण' में प्रावधानिक-बंदचक्र में संक्रमण की समय-समय पर समय-समय पर समय-समय पर (来源：MLion)