جامعة تشينغهوا وMianbi يطلقان مفتوح المصدر لأول إطار تدريب مسبق للذكاء الاصطناعي لكتابة الكود ForgeTrain

iconKuCoinFlash
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
جامعة تشينغهوا وMianbi أطلقا ForgeTrain، أول إطار عمل مكتوب بالذكاء الاصطناعي للتدريب المسبق في مجال الأخبار الخاصة بالذكاء الاصطناعي والعملات المشفرة. يتفوق هذا الإطار على Megatron من NVIDIA ويزيد السرعة بنسبة 10% على Huawei Ascend، كما أنتج MiniCPM5-1B، وهو نموذج مدمج من أعلى التصنيفات. يسلط المشروع الضوء على إمكانية دمج أخبار الأصول الواقعية (RWA) مع تقدم أدوات الذكاء الاصطناعي.
ME AI رسالة، وفقًا لمراقبة Beating، قام FaceWall Intelligence ومخبر NLP في جامعة تشينغهوا بالتعاون في مجتمع OpenBMB بإطلاق مفتوح المصدر لأول إطار عمل تدريب مسبق للنماذج الكبيرة من إنتاجية كاملة مكتوب بالذكاء الاصطناعي، ForgeTrain، بالإضافة إلى نموذج صغير مُدرب باستخدام ForgeTrain يُدعى MiniCPM5-1B. كأول عينة تُظهر الحلقة الهندسية "الذكاء الاصطناعي يصنع الذكاء الاصطناعي"، تفوق ForgeTrain في الأداء على Megatron من NVIDIA في ظروف عتاد مماثلة، كما حقق تسريعًا بنسبة 10% أثناء التدريب المسبق على Huawei Ascend. في الوقت نفسه، احتل MiniCPM5-1B المرتبة الأولى في قائمة Artificial Analysis للنماذج الصغيرة ذات الأوزان المفتوحة. لتمكين الذكاء الاصطناعي من بناء البنية التحتية للتدريب المسبق بشكل ذاتي، اقترح FaceWall Intelligence نمط برمجي جديد يُسمى "الهندسة المُصنّعة" (Forge Engineering)، حيث تم التخلي عن الإطارات العامة المتوافقة مع جميع الأجهزة والمهام، واستبدالها باستخدام قدرة الذكاء الاصطناعي على توليد الكود بتكاليف منخفضة لإنتاج كود مخصص لموديلات وأجهزة محددة. من حيث الآلية، يستخدم ForgeTrain منهجًا ثلاثي المراحل: أولاً، جمع البيانات الأساسية من إطارات التدريب المسبق الحالية لتشكيل ساحة اختبار (Harness)، ثم توليد كود الإطار بشكل متكرر في حلقة مغلقة تلقائية للحصول على نسخ متطابقة ثنائيًا، وأخيرًا إزالة القيود لتحقيق تفوق على التنفيذ المرجعي. يتوافق هذا التطور الآلي الكامل مع المراحل L3 إلى L4 لـ "الذكاء الاصطناعي يصنع الذكاء الاصطناعي". كأول نموذج تم إنتاجه بواسطة ForgeTrain، يتمتع MiniCPM5-1B بـ 1.08 مليار معلمة، ويعتمد هيكله الأساسي على تصميم LlamaForCausalLM القياسي، مما يقلل بشكل كبير من عتبة التكامل والنشر الاستنتاجي للتطبيقات الفرعية. في تقييمات Artificial Analysis، تفوق النموذج على Qwen3.5-2B بحجم 2B (16 نقطة) بفارق 18 نقطة، وتفوق أيضًا على Qwen3.5-0.8B (11 نقطة) وLFM2.5-1.2B-Thinking (8 نقاط). يدعم النموذج تنسيقات النشر مثل MLX 4-bit وGGUF Q4_K_M، ويبلغ وزنه بعد التكميم INT4 فقط 0.5 جيجابايت، ويدعم أصليًا سياق نص طويل يصل إلى 131,072 رمزًا مع استنتاج هجين ثنائي النمط مبني على enable_thinking. وبفضل التكاليف المنخفضة جدًا للعتاد، أطلقت OpenBMB بالتوازي تطبيقًا سطح مكتب يعمل بالكامل دون اتصال بالإنترنت يُسمى MiniCPM Desk Pet، والذي يدعم الاستجابة الفورية لأنشطة البرمجة في أدوات التطوير مثل Cursor وتبديل الشخصيات عبر LoRA. (المصدر: BlockBeats)
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.