تقوم Cerebras Systems حاليًا بخدمة Kimi K2.6 من Moonshot AI، وهو نموذج مفتوح الوزن قائم على مزيج من الخبراء يحتوي على تريليون معامل، بسرعة 981 رمزًا مخرجًا في الثانية. ويمثل هذا الرقم، الذي تأكد من خلال اختبارات مستقلة أجرتها Artificial Analysis، 6.7 أضعاف سرعة مزود السحابة الأقرب من حيث الأداء باستخدام وحدات معالجة الرسوميات.
للسياق، يبلغ متوسط مزود الاستنتاج أبطأ بحوالي 23 مرة.
كيف تبدو الأرقام فعليًا في التطبيق
في حملة برمجية تمثيلية تعتمد على الوكلاء، وباستخدام 10,000 رمز مدخل و500 رمز مخرج، قدم الإعداد المدعوم بـ Cerebras استجابة كاملة في 5.6 ثانية.
استغرقت نفس المهمة على نقطة النهاية الرسمية لـ Kimi 163.7 ثانية. هذا تحسن بنسبة 29 ضعفًا في التأخير الكامل.
نموذج Kimi K2.6 نفسه يستحق الفهم. تم تطويره من قبل Moonshot AI وطرحه في 20 أبريل 2026، ويتضمن قدرات متعددة الوسائط ووكلاء. بينما يصل إجمالي عدد المعلمات إلى تريليون واحد، يتم تفعيل 32 مليار معلمة فقط في أي وقت معين، بفضل بنية MoE.
لماذا تغيّر البنية على مستوى الرقاقة المعادلات
التقنية الأساسية لشركة Cerebras هي محرك Wafer-Scale، وهو شريحة تتكوّن من قطعة سيليكون كاملة. يتم قطع الرقائق التقليدية من الألواح إلى شرائح صغيرة فردية. وتتخطى Cerebras مرحلة القطع وتستخدم القطعة بأكملها.
تُدّعي Cerebras أن لديها أكثر من 200 ضعف عرض النطاق الترددي مقارنة بـ NVLink من NVIDIA، وهي تقنية الربط التي تربط وحدات معالجة الرسومات معًا في مجموعات مراكز البيانات. عند تشغيل الاستنتاج على النماذج الكبيرة، يكون العائق هو دائمًا عرض النطاق الترددي للذاكرة، وليس الحوسبة الخام. يجب قراءة الأوزان من الذاكرة وتمريرها إلى المعالجات لكل رمز يتم إنشاؤه.
السياق التجاري: شركة حديثة الطرح العام ولديها ما تثبته
أكملت Cerebras طرحها العام الأولي في مايو 2026 بتقييم قدره 95 مليار دولار، مما جعلها أكبر طرح عام أولي تقني في السنة.
نتيجة 981 رمزًا في الثانية هي أكثر الأدلة وضوحًا حتى الآن على أن جانب السرعة من هذه الفرضية يظل ساريًا. لم تنشر Cerebras مقارنات تسعير تفصيلية جنبًا إلى جنب مع هذا المعيار.
من خلال تقديم أحد أكثر النماذج المفتوحة الوزن شهرةً من مختبر صيني رائد في الذكاء الاصطناعي، تُظهر Cerebras أن أجهزتها قادرة على التعامل مع النماذج التي يرغب المطورون في استخدامها.
