Nvidia का GB300 NVL72 प्रति मेगावॉट 61.4K AI एजेंट प्राप्त करता है, H200 से 20x बेहतर

Nvidia ने एक संख्या जारी की है जिससे हर डेटा सेंटर संचालक को दोबारा सोचना पड़ेगा। कंपनी का नया GB300 NVL72 सिस्टम प्रति मेगावॉट बिजली खपत पर 61,400 समानांतर AI एजेंट्स को संभाल सकता है, जबकि पिछली पीढ़ी के H200 पर केवल 2,600 हैं।

ऊर्जा की प्रति इकाई एजेंट घनत्व में यह 20x सुधार है। एक ऐसे उद्योग के लिए जहाँ बिजली की लागत तेजी से विकास के लिए बाधा बनती जा रही है, यह केवल एक स्पेक शीट का प्रदर्शन नहीं है। यह निष्कर्षण की आर्थिक संरचना में एक संरचनात्मक परिवर्तन है।

रैक के अंदर क्या है

GB300 NVL72 Nvidia के Blackwell Ultra आर्किटेक्चर पर बनाया गया है, जिसमें एकल तरल शीतलित रैक में 72 Blackwell Ultra GPU और 36 Grace CPU शामिल हैं। यह सिस्टम लगभग 20 से 21 TB HBM3e मेमोरी को एकीकृत करता है और 130 TB/s NVLink बैंडविड्थ प्रदान करता है, जो एक आंतरिक डेटा हाईवे है जो इन सभी GPU को बिना बॉटलनेक के एक-दूसरे से जोड़ता है।

Nvidia का कहना है कि यह प्लेटफॉर्म अपने पुराने Hopper-पीढ़ि के सिस्टम की तुलना में AI फैक्ट्री आउटपुट में अधिकतम 50 गुना बढ़ोतरी करता है। यह दावा भी करता है कि प्रति उपयोगकर्ता प्रति सेकंड 10 गुना अधिक टोकन और प्रति वाट पांच गुना अधिक थ्रूपुट है।

सिस्टम में सॉफ्टवेयर-स्तरीय अनुकूलन शामिल हैं जैसे वाइडईपी/डीपईपी और संयुक्त मिक्सचर ऑफ एक्सपर्ट्स (MoE) तकनीकें, जो प्रत्येक वॉट और प्रत्येक GPU साइकिल से अधिक उपयोगी गणना निकालने के लिए डिज़ाइन की गई हैं। MoE एक रूटिंग सिस्टम है जो प्रत्येक बार हर न्यूरॉन को सक्रिय करने के बजाय केवल उन भागों को सक्रिय करता है जो एक दिए गए प्रश्न के लिए प्रासंगिक हैं।

प्रदर्शन का मूल्यांकन Artificial Analysis द्वारा एजेंट-केंद्रित AI प्रदर्शन के मूल्यांकन के लिए विकसित एक बेंचमार्क, AgentPerf का उपयोग करके किया गया। बेंचमार्क ने DeepSeek V4 Pro मॉडल, एक MoE आर्किटेक्चर, को 20 या 60 टोकन प्रति सेकंड प्रति एजेंट के सेवा-स्तरीय लक्ष्यों के साथ चलाया।

यह कौन तैनात कर रहा है

GB300 NVL72 ने पहले ही सबसे महत्वपूर्ण क्लाउड प्रोवाइडर्स से प्रतिबद्धताएँ आकर्षित कर ली हैं। माइक्रोसॉफ्ट एज़्योर प्रणाली के आसपास पहला बड़े पैमाने पर क्लस्टर लगा रहा है, जिन रैक्स की उम्मीद है कि वे अंतिम 2025 में शुरू होकर 2026 तक OpenAI के कार्यभार को संचालित करेंगे।

कोरवेव ने GB300 NVL72 के पहले उत्पादन उदाहरण की घोषणा की है, जिससे यह GPU क्लाउड स्पेस में एक प्रारंभिक अग्रणी के रूप में स्थित हो गया है। ओरेकल क्लाउड इंफ्रास्ट्रक्चर भी डिप्लॉयमेंट पाइपलाइन में है।

इसका निवेशकों के लिए क्या अर्थ है

H200 की तुलना में 20x दक्षता वृद्धि डेटा सेंटर संचालकों के लिए एक सीधा ROI गणना बनाती है: समान बिजली आवरण सैद्धांतिक रूप से GB300 हार्डवेयर पर 20 गुना अधिक एजेंट्स का समर्थन कर सकता है।

हॉपर प्लेटफॉर्म की तुलना में 50x आउटपुट में सुधार, जिसमें प्रति वाट पांच गुना अधिक थ्रूपुट शामिल है, निवेशकों के लिए Nvidia के लिए ESG-जागरूक संस्थागत निवेशकों के लिए एक विश्वसनीय कहानी प्रदान करता है। जैसे-जैसे नियामक और शेयरधारक AI बुनियादी ढांचे की ऊर्जा खपत पर अधिक नजर रखने लगते हैं, प्रति किलोवाट-घंटा अधिक बुद्धिमत्ता प्रदान करने वाले सिस्टम को खरीदारी के निर्णयों में प्रीमियम मिलेगा।