حقق Cerebras 981 رمزًا في الثانية على نموذج Kimi K2.6، أسرع بـ 6.7 مرات من سحابة GPU

iconCryptoBriefing
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
تقوم Cerebras Systems الآن بتوصيل 981 رمزًا في الثانية لنموذج Moonshot AI Kimi K2.6، وهو ما تم التحقق منه من قبل Artificial Analysis. يعمل هذا النموذج المفتوح الوزن MoE بـ 1 تريليون معلمة بسرعة 6.7 مرات أسرع من أفضل سحابة GPU. تُظهر البيانات على السلسلة تحسنًا في زمن الاستجابة بنسبة 29 ضعفًا في مهام البرمجة، حيث تكمل Cerebras الاستجابة في 5.6 ثانية مقارنة بـ 163.7 ثانية على نقطة النهاية الرسمية لـ Kimi. وتأكّد التحليلات على السلسلة أن فجوة الأداء تظل ثابتة عبر الأحمال المختلفة.

تقوم Cerebras Systems حاليًا بخدمة Kimi K2.6 من Moonshot AI، وهو نموذج مفتوح الوزن قائم على مزيج من الخبراء يحتوي على تريليون معامل، بسرعة 981 رمزًا مخرجًا في الثانية. ويمثل هذا الرقم، الذي تأكد من خلال اختبارات مستقلة أجرتها Artificial Analysis، 6.7 أضعاف سرعة مزود السحابة الأقرب من حيث الأداء باستخدام وحدات معالجة الرسوميات.

للسياق، يبلغ متوسط مزود الاستنتاج أبطأ بحوالي 23 مرة.

كيف تبدو الأرقام فعليًا في التطبيق

في حملة برمجية تمثيلية تعتمد على الوكلاء، وباستخدام 10,000 رمز مدخل و500 رمز مخرج، قدم الإعداد المدعوم بـ Cerebras استجابة كاملة في 5.6 ثانية.

إعلان

استغرقت نفس المهمة على نقطة النهاية الرسمية لـ Kimi 163.7 ثانية. هذا تحسن بنسبة 29 ضعفًا في التأخير الكامل.

نموذج Kimi K2.6 نفسه يستحق الفهم. تم تطويره من قبل Moonshot AI وطرحه في 20 أبريل 2026، ويتضمن قدرات متعددة الوسائط ووكلاء. بينما يصل إجمالي عدد المعلمات إلى تريليون واحد، يتم تفعيل 32 مليار معلمة فقط في أي وقت معين، بفضل بنية MoE.

لماذا تغيّر البنية على مستوى الرقاقة المعادلات

التقنية الأساسية لشركة Cerebras هي محرك Wafer-Scale، وهو شريحة تتكوّن من قطعة سيليكون كاملة. يتم قطع الرقائق التقليدية من الألواح إلى شرائح صغيرة فردية. وتتخطى Cerebras مرحلة القطع وتستخدم القطعة بأكملها.

تُدّعي Cerebras أن لديها أكثر من 200 ضعف عرض النطاق الترددي مقارنة بـ NVLink من NVIDIA، وهي تقنية الربط التي تربط وحدات معالجة الرسومات معًا في مجموعات مراكز البيانات. عند تشغيل الاستنتاج على النماذج الكبيرة، يكون العائق هو دائمًا عرض النطاق الترددي للذاكرة، وليس الحوسبة الخام. يجب قراءة الأوزان من الذاكرة وتمريرها إلى المعالجات لكل رمز يتم إنشاؤه.

السياق التجاري: شركة حديثة الطرح العام ولديها ما تثبته

أكملت Cerebras طرحها العام الأولي في مايو 2026 بتقييم قدره 95 مليار دولار، مما جعلها أكبر طرح عام أولي تقني في السنة.

نتيجة 981 رمزًا في الثانية هي أكثر الأدلة وضوحًا حتى الآن على أن جانب السرعة من هذه الفرضية يظل ساريًا. لم تنشر Cerebras مقارنات تسعير تفصيلية جنبًا إلى جنب مع هذا المعيار.

من خلال تقديم أحد أكثر النماذج المفتوحة الوزن شهرةً من مختبر صيني رائد في الذكاء الاصطناعي، تُظهر Cerebras أن أجهزتها قادرة على التعامل مع النماذج التي يرغب المطورون في استخدامها.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.