Cerebras ने Kimi K2.6 मॉडल पर 981 टोकन प्रति सेकंड की गति प्राप्त की, GPU क्लाउड की तुलना में 6.7x तेज

iconCryptoBriefing
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
Cerebras Systems, Artificial Analysis द्वारा पुष्टि किए जाने पर, Moonshot AI के Kimi K2.6 मॉडल के लिए 981 टोकन प्रति सेकंड प्रदान कर रहा है। यह 1-ट्रिलियन पैरामीटर वाला ओपन-वेट MoE मॉडल, सर्वश्रेष्ठ GPU क्लाउड की तुलना में 6.7x तेज़ है। ऑन-चेन डेटा के अनुसार, कोडिंग कार्यों में 29x लेटेंसी में सुधार हुआ है, जहाँ Cerebras 5.6 सेकंड में प्रतिक्रिया पूरी करता है, जबकि आधिकारिक Kimi एंडपॉइंट पर यह 163.7 सेकंड लगता है। ऑन-चेन विश्लेषण पुष्टि करता है कि प्रदर्शन का अंतर सभी कार्यभारों में समान बना रहता है।

Cerebras Systems अब Moonshot AI के 1 ट्रिलियन पैरामीटर ओपन-वेट मिक्सचर-ऑफ-एक्सपर्ट्स मॉडल, Kimi K2.6 को 981 आउटपुट टोकन प्रति सेकंड की गति से सेवा प्रदान कर रहा है। यह संख्या, Artificial Analysis द्वारा स्वतंत्र परीक्षण द्वारा पुष्टि की गई है, जो अगले सर्वश्रेष्ठ GPU क्लाउड प्रदाता की तुलना में 6.7 गुना तेज है।

संदर्भ के लिए, माध्यिका निष्कर्ष प्रदाता लगभग 23 गुना धीमा होता है।

व्यवहार में संख्याएँ वास्तव में कैसी दिखती हैं

एक प्रतिनिधि एजेंटिक कोडिंग लोड पर, 10,000 इनपुट टोकन और 500 आउटपुट टोकन के साथ, सेरेब्रास-सक्षम सेटअप ने 5.6 सेकंड में पूरा उत्तर प्रदान किया।

विज्ञापन

आधिकारिक Kimi एंडपॉइंट पर इस कार्य को पूरा करने में 163.7 सेकंड लगे। यह एंड-टू-एंड लेटेंसी में 29x का सुधार है।

Kimi K2.6 मॉडल को समझना आवश्यक है। मूनशॉट AI द्वारा विकसित और 20 अप्रैल, 2026 को जारी किया गया, इसमें मल्टीमॉडल और एजेंटिक क्षमताएँ शामिल हैं। हालाँकि कुल पैरामीटर की संख्या 1 ट्रिलियन तक पहुँचती है, MoE आर्किटेक्चर के कारण किसी भी समय केवल 32 अरब पैरामीटर सक्रिय होते हैं।

क्यों वेफर-स्केल आर्किटेक्चर गणित को बदल देता है

सेरेब्रस की मुख्य तकनीक वेफर-स्केल इंजन है, जो एक ऐसा चिप है जो पूरा सिलिकॉन वेफर है। पारंपरिक चिप्स को वेफर्स से छोटे-छोटे डाइ में काटा जाता है। सेरेब्रस कटिंग के हिस्से को छोड़ देता है और पूरे वेफर का उपयोग करता है।

सेरेब्रास दावा करता है कि इसकी बैंडविड्थ NVIDIA की NVLink से 200 गुना अधिक है, जो डेटा सेंटर क्लस्टर में GPU को जोड़ने वाली इंटरकनेक्ट तकनीक है। बड़े मॉडल पर निष्कर्ष निकालने पर, बॉटलनेक लगभग हमेशा कच्ची गणना नहीं, बल्कि मेमोरी बैंडविड्थ होती है। प्रत्येक जेनरेट किए गए टोकन के लिए वजन को मेमोरी से पढ़ा जाना और प्रोसेसर को प्रदान किया जाना आवश्यक है।

एक हाल ही में सार्वजनिक कंपनी जिसके पास कुछ साबित करने को है

सेरेब्रास ने मई 2026 में $95 बिलियन के मूल्यांकन पर अपना आईपीओ पूरा किया, जिससे यह वर्ष का सबसे बड़ा टेक आईपीओ बन गया।

प्रति सेकंड 981 टोकन का परिणाम अब तक का सबसे अधिक स्पष्ट सबूत है कि उस थीसिस का गति वाला हिस्सा सही साबित होता है। सेरेब्रास ने इस बेंचमार्क के साथ विस्तृत मूल्य तुलनाएँ प्रकाशित नहीं की हैं।

एक प्रमुख चीनी एआई प्रयोगशाला के सबसे प्रमुख ओपन-वेट मॉडल को सर्व करके, सेरेब्रास यह दर्शा रहा है कि इसका हार्डवेयर उन मॉडल्स को संभाल सकता है जिन्हें डेवलपर्स वास्तव में उपयोग करना चाहते हैं।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।