Ang Tsinghua University at Mianbi ay inilabas ang unang open-source na AI-coding pre-training framework sa mundo na ForgeTrain

ME AI mensahe, ayon sa pagmamasid ng Beating, ang Moonshot AI at ang清华 NLP Laboratory ay naglabas ng global na unang production-grade na pretraining framework na ganap na isinulat ng AI na tinatawag na ForgeTrain sa OpenBMB community, kasama ang MiniCPM5-1B, isang maliit na model na itinuturo gamit ang ForgeTrain. Bilang unang halimbawa ng isang engineering loop na “AI na gumawa ng AI,” ang ForgeTrain ay nagpapakita ng mas mabuting performance kaysa sa NVIDIA’s Megatron sa parehong hardware, at nagkaroon ng 10% na pagpapabilis sa Huawei Ascend. Samantala, ang MiniCPM5-1B ay naging numero uno sa Artificial Analysis open-weight small model leaderboard. Para sa pagbuo ng sariling pangunahing pretraining infrastructure ng AI, ang Moonshot AI ay nagtataguyod ng “Forge Engineering” software programming paradigm, na nagtatanggal sa pangkalahatang framework na sumasakop sa lahat ng hardware at task, at gumagamit ng kakayahan ng AI sa mura at awtomatikong paggawa ng code upang lumikha ng espesyalisadong code para sa partikular na model at hardware. Sa pamamagitan ng mekanismo, ang ForgeTrain ay gumagamit ng tatlong yugto: una, kumukuha ng mahahalagang data mula sa umiiral na pretraining frameworks upang makabuo ng isang test harness; pangalawa, iteratibong paggawa ng binary-consistent framework code sa isang awtomatikong loop; at pangatlo, pag-alis ng mga limitasyon upang lalong labis na lalong labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na laborious. Ang buong awtomatikong pag-unlad ay tumutugma sa L3 hanggang L4 stage ng “AI that creates AI.” Bilang unang output ng ForgeTrain, ang MiniCPM5-1B ay may 1.08 bilyon parameters, at ang pangunahing arkitektura ay batay sa standard LlamaForCausalLM, kung saan malaki ang pagbaba sa barrier para sa downstream integration at deployment. Sa pagtataya ng Artificial Analysis, ang model ay nakakuha ng 18 puntos, higit sa Qwen3.5-2B (16 puntos) sa 2B scale, at mas mataas kaysa sa Qwen3.5-0.8B (11 puntos) at LFM2.5-1.2B-Thinking (8 puntos). Ang model ay sumusuporta sa mga format tulad ng MLX 4-bit at GGUF Q4_K_M; pagkatapos ng INT4 quantization, ang weights ay naging 0.5GB lamang, at may native suporta para sa 131,072 tokens long context at hybrid dual-mode inference batay sa enable_thinking. Sa pamamagitan ng napakababang hardware overhead, inilabas din ng OpenBMB ang MiniCPM Desk Pet, isang desktop floating companion app para sa pure offline operation, kung saan sumusuporta sa real-time response sa coding activities sa mga development tool tulad ng Cursor at LoRA persona switching. (Source: BlockBeats)