مُحب صيني يُشغل كيمي K2.5 بـ 1 تريليون معلمة على RTX 3060 مع ذاكرة Intel Optane بسعة 768 جيجابايت

تم تشغيل نموذج ذكاء اصطناعي بتريليون معلمة على بطاقة رسومية يُعتبرها معظم اللاعبين متوسطة المستوى.

أظهر مُحبّ الذكاء الاصطناعي الصيني المعروف باسم APFrisco نموذج Kimi K2.5 من Moonshot AI، وهو نموذج لغوي ضخم من نوع Mixture-of-Experts (MoE) يحتوي على تريليون معامل إجمالي، يعمل على وحدة معالجة رسوميات Nvidia RTX 3060 واحدة مزودة بذاكرة Intel Optane Persistent Memory بسعة 768 جيجابايت. وحققت هذه البيئة حوالي أربعة رموز في الثانية، وهو ما يُعد بطيئًا وفق معايير الإنتاج، لكنه مذهل نظرًا للعتاد المستخدم.

كيف تعامل وحدة معالجة رسوميات متوسطة المستوى تريليون معلمة

لا يُفعّل Kimi K2.5 جميع المعلمات البالغة تريليون واحد في وقت واحد. فلكل رمز يتم إنشاؤه، يتم تفعيل 32 مليار معلمة فقط. بينما تبقى البقية في حالة سكون، وتنتظر دورها.

حتى مع هذه الحيلة الكفؤة، فإن النموذج ضخم جدًا. يبلغ وزن Kimi K2.5 الكامل حوالي 630 جيجابايت. وتظل الإصدارات المُكمَّمة، التي تُقلل دقة النموذج لتقليل متطلبات الذاكرة، حوالي 381 جيجابايت. وهذا هو السبب في أن APFrisco احتاج إلى 768 جيجابايت من ذاكرة Intel Optane الدائمة: لا تقترب أي مجموعة ذاكرة استهلاكية قياسية من التعامل مع هذا الحجم الهائل.

تُعد وحدات Optane PMem DIMM خيارًا مثيرًا للاهتمام. أوقفت إنتل خط Optane، مما يعني أن هذه الوحدات أصبحت الآن عبارة عن أجهزة قديمة متداولة في سوق المنتجات المستعملة. وهي أبطأ من ذاكرة DRAM التقليدية، لكنها أرخص بكثير لكل جيجابايت، مما يجعلها حلاً غير تقليدي لكنه عملي بشكل مفاجئ لتحميل النماذج الضخمة التي تتطلب عادةً بنية تحتية من فئة المؤسسات.

تم إطلاق RTX 3060 في أوائل عام 2021 مع 12 غيغابايت من VRAM. تم تصميمها لألعاب 1080p وأحمال العمل الإبداعية الخفيفة، وليس لتشغيل نماذج الذكاء الاصطناعي المتقدمة.

كيف تبدو نشرات Kimi K2.5 النموذجية

الاستدلال عالي الأداء لـ Kimi K2.5 يستهدف عادةً التكوينات التي تصل إلى 8 بطاقات رسومية عالية الأداء. وتقدم هذه الإعدادات سرعات تتراوح بين 10 و300 رمز أو أكثر في الثانية.

تم مشاركة العرض التوضيحي على مجتمع Reddit r/LocalLLaMA ثم تم تغطيته من قبل Tom’s Hardware.

تم إصدار Kimi K2.5 في 27 يناير 2026 من قبل Moonshot AI. وهو يمتلك قدرات متعددة الوسائط وتم تدريبه على حوالي 15 تريليون رمز بصري ونصي. إنه نموذج مفتوح الوزن، مما يعني أنه يمكن لأي شخص تنزيله وتشغيله، وهو بالضبط ما جعل تجربة APFrisco ممكنة في المقام الأول.