إنجاز صيني في الذكاء الاصطناعي: تم تدريب نموذج DeepSeek بـ 1.6 تريليون معلمة بالكامل على وحدة Ascend 910C المحلية

iconKuCoinFlash
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
أكمل فريق مشترك يضم كلية شنتشن هيتاو، معهد هاربين للتكنولوجيا (شنتشن)، معهد شنتشن للبيانات الضخمة، وهواوي تدريبًا كاملًا بعد التدريب للنموذج DeepSeek-V4-Pro بـ 1.6 تريليون معلمة على منصة الذكاء الاصطناعي Ascend 910C المحلية. يُعد هذا الخبر على السلسلة أول مرة تحقق فيها مجموعة خارجية تدريبًا كاملًا لنموذج بـ 1.6 تريليون معلمة باستخدام أكثر من 1000 شريحة Ascend 910C. وحسّن الفريق استخدام الحوسبة للنموذج بنسبة أكثر من 30% وكفاءة العاملين الرئيسيين بنسبة 14%، دون أي أعطال في النظام خلال أكثر من 1500 خطوة تدريب. ويُبرز خبر الذكاء الاصطناعي + التشفير النمو المتزايد لقدرات البنية التحتية للذكاء الاصطناعي المحلية.
ME AI رسالة، وفقًا لمراقبة Beating، تم تطويرها من قبل فريق مشترك يتكون من جامعة هاربين للعلوم والتكنولوجيا (شنتشن)، ومعهد شنتشن للبيانات الكبيرة، وفريق مرتبط بـ Huawei، بالتعاون مع فريق البحث المشترك لمنصة حسابات الذكاء الاصطناعي Shenzhen Intelligence City، وأعلنت عن نجاحها في تشغيل تدريب كامل المعاملات (Post-training) لنموذج DeepSeek-V4-Pro بحجم 1.6 تريليون معلمة على منصة حسابات الذكاء الاصطناعي المحلية. هذه هي المرة الأولى التي تُكمل فيها جهة خارجية عالمية تدريبًا كامل المعاملات لنموذج بحجم 1.6 تريليون معلمة على منصة حسابات محلية. مقارنةً بالتدريب المسبق (Pre-training) من الصفر، يركز مرحلة التدريب اللاحق (التي تشمل بشكل رئيسي الضبط الخاضع للإشراف SFT والتعلم المعزز RL) على تعليم النموذج اتباع التعليمات وتنفيذ مهام محددة من خلال تعليمات عالية الجودة وتوافق التفضيلات البشرية. ومع ذلك، فإن التدريب الكامل للمعلمات لنموذج MoE بحجم 1.6 تريليون معلمة لا يزال يتطلب متطلبات صارمة جدًا على سعة ذاكرة GPU الأساسية، وعرض النطاق الترددي للتواصل بين بطاقات متعددة (مثل الاتصال الكامل بين كل زوج من البطاقات الذي يُحفزه توجيه MoE)، واستقرار المجموعة الكبيرة. اعتمد فريق البحث المشترك على مجموعة حسابية من Huawei Ascend 910C تضم أكثر من ألف شريحة، ونجح في التغلب على عوائق الاتصال من خلال تحسين استراتيجيات التحميل الموزع والتوازن في الأحمال. خلال أكثر من 1500 خطوة تدريب، لم يحدث أي انقطاع في النظام، وتجاوز استخدام قدرة الحوسبة للموديل (MFU) 30٪، وتحسّنت كفاءة العوامل الحاسوبية الرئيسية بنسبة 14٪، ووصلت جميع المؤشرات إلى معايير التشغيل الصناعي. أشار التحليل الصناعي إلى أن نجاح مجموعة Huawei Ascend 910C في تشغيل تدريب النماذج بحجم تريليونات المعلمات يؤكد الجدوى التقنية للرقائق المحلية للذكاء الاصطناعي في تحمل مهام التدريب العميق للنماذج الضخمة جدًا. نظرًا لأن التدريب المسبق الأساسي لتطوير النماذج الكبيرة كان يعتمد سابقًا على مجموعات GPU من NVIDIA، كانت الحوسبة المحلية تُستخدم بشكل رئيسي للمهام الاستنتاجية (Inference) أو الضبط الدقيق للمعلمات الصغيرة. يمثل نجاح هذا التعاون المشترك علامة فارقة في انتقال نظام الحوسبة المحلية من "الدعم فقط للاستنتاج" إلى "القدرة على تحمل التدريب الكامل للمعلمات للنماذج الضخمة جدًا". (المصدر: MLion)
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.