جامعة تشينغهوا وMianbi يطلقان مفتوح المصدر لأول إطار تدريب مسبق للذكاء الاصطناعي لكتابة الكود ForgeTrain

ME AI رسالة، وفقًا لمراقبة Beating، قام FaceWall Intelligence ومخبر NLP في جامعة تشينغهوا بالتعاون في مجتمع OpenBMB بإطلاق مفتوح المصدر لأول إطار عمل تدريب مسبق للنماذج الكبيرة من إنتاجية كاملة مكتوب بالذكاء الاصطناعي، ForgeTrain، بالإضافة إلى نموذج صغير مُدرب باستخدام ForgeTrain يُدعى MiniCPM5-1B. كأول عينة تُظهر الحلقة الهندسية "الذكاء الاصطناعي يصنع الذكاء الاصطناعي"، تفوق ForgeTrain في الأداء على Megatron من NVIDIA في ظروف عتاد مماثلة، كما حقق تسريعًا بنسبة 10% أثناء التدريب المسبق على Huawei Ascend. في الوقت نفسه، احتل MiniCPM5-1B المرتبة الأولى في قائمة Artificial Analysis للنماذج الصغيرة ذات الأوزان المفتوحة. لتمكين الذكاء الاصطناعي من بناء البنية التحتية للتدريب المسبق بشكل ذاتي، اقترح FaceWall Intelligence نمط برمجي جديد يُسمى "الهندسة المُصنّعة" (Forge Engineering)، حيث تم التخلي عن الإطارات العامة المتوافقة مع جميع الأجهزة والمهام، واستبدالها باستخدام قدرة الذكاء الاصطناعي على توليد الكود بتكاليف منخفضة لإنتاج كود مخصص لموديلات وأجهزة محددة. من حيث الآلية، يستخدم ForgeTrain منهجًا ثلاثي المراحل: أولاً، جمع البيانات الأساسية من إطارات التدريب المسبق الحالية لتشكيل ساحة اختبار (Harness)، ثم توليد كود الإطار بشكل متكرر في حلقة مغلقة تلقائية للحصول على نسخ متطابقة ثنائيًا، وأخيرًا إزالة القيود لتحقيق تفوق على التنفيذ المرجعي. يتوافق هذا التطور الآلي الكامل مع المراحل L3 إلى L4 لـ "الذكاء الاصطناعي يصنع الذكاء الاصطناعي". كأول نموذج تم إنتاجه بواسطة ForgeTrain، يتمتع MiniCPM5-1B بـ 1.08 مليار معلمة، ويعتمد هيكله الأساسي على تصميم LlamaForCausalLM القياسي، مما يقلل بشكل كبير من عتبة التكامل والنشر الاستنتاجي للتطبيقات الفرعية. في تقييمات Artificial Analysis، تفوق النموذج على Qwen3.5-2B بحجم 2B (16 نقطة) بفارق 18 نقطة، وتفوق أيضًا على Qwen3.5-0.8B (11 نقطة) وLFM2.5-1.2B-Thinking (8 نقاط). يدعم النموذج تنسيقات النشر مثل MLX 4-bit وGGUF Q4_K_M، ويبلغ وزنه بعد التكميم INT4 فقط 0.5 جيجابايت، ويدعم أصليًا سياق نص طويل يصل إلى 131,072 رمزًا مع استنتاج هجين ثنائي النمط مبني على enable_thinking. وبفضل التكاليف المنخفضة جدًا للعتاد، أطلقت OpenBMB بالتوازي تطبيقًا سطح مكتب يعمل بالكامل دون اتصال بالإنترنت يُسمى MiniCPM Desk Pet، والذي يدعم الاستجابة الفورية لأنشطة البرمجة في أدوات التطوير مثل Cursor وتبديل الشخصيات عبر LoRA. (المصدر: BlockBeats)