Ang Tsinghua University at Mianbi ay inilabas ang unang open-source na AI-coding pre-training framework sa mundo na ForgeTrain

iconKuCoinFlash
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ang Tsinghua University at Mianbi ay nag-open source ng ForgeTrain, ang unang AI-naisulat na pre-training framework sa mundo para sa AI + crypto news. Ang framework ay mas mahusay kaysa kay NVIDIA's Megatron at nagpapabilis ng 10% sa Huawei Ascend. Ito rin ay naglikha ng MiniCPM5-1B, isang nangungunang kompakto na modelo. Ang proyekto ay nagpapakita ng potensyal para sa integrasyon ng balita tungkol sa mga real-world assets (RWA) habang umaunlad ang mga tool sa AI.
ME AI mensahe, ayon sa pagmamasid ng Beating, ang Moonshot AI at ang清华 NLP Laboratory ay naglabas ng global na unang production-grade na pretraining framework na ganap na isinulat ng AI na tinatawag na ForgeTrain sa OpenBMB community, kasama ang MiniCPM5-1B, isang maliit na model na itinuturo gamit ang ForgeTrain. Bilang unang halimbawa ng isang engineering loop na “AI na gumawa ng AI,” ang ForgeTrain ay nagpapakita ng mas mabuting performance kaysa sa NVIDIA’s Megatron sa parehong hardware, at nagkaroon ng 10% na pagpapabilis sa Huawei Ascend. Samantala, ang MiniCPM5-1B ay naging numero uno sa Artificial Analysis open-weight small model leaderboard. Para sa pagbuo ng sariling pangunahing pretraining infrastructure ng AI, ang Moonshot AI ay nagtataguyod ng “Forge Engineering” software programming paradigm, na nagtatanggal sa pangkalahatang framework na sumasakop sa lahat ng hardware at task, at gumagamit ng kakayahan ng AI sa mura at awtomatikong paggawa ng code upang lumikha ng espesyalisadong code para sa partikular na model at hardware. Sa pamamagitan ng mekanismo, ang ForgeTrain ay gumagamit ng tatlong yugto: una, kumukuha ng mahahalagang data mula sa umiiral na pretraining frameworks upang makabuo ng isang test harness; pangalawa, iteratibong paggawa ng binary-consistent framework code sa isang awtomatikong loop; at pangatlo, pag-alis ng mga limitasyon upang lalong labis na lalong labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na labis na laborious. Ang buong awtomatikong pag-unlad ay tumutugma sa L3 hanggang L4 stage ng “AI that creates AI.” Bilang unang output ng ForgeTrain, ang MiniCPM5-1B ay may 1.08 bilyon parameters, at ang pangunahing arkitektura ay batay sa standard LlamaForCausalLM, kung saan malaki ang pagbaba sa barrier para sa downstream integration at deployment. Sa pagtataya ng Artificial Analysis, ang model ay nakakuha ng 18 puntos, higit sa Qwen3.5-2B (16 puntos) sa 2B scale, at mas mataas kaysa sa Qwen3.5-0.8B (11 puntos) at LFM2.5-1.2B-Thinking (8 puntos). Ang model ay sumusuporta sa mga format tulad ng MLX 4-bit at GGUF Q4_K_M; pagkatapos ng INT4 quantization, ang weights ay naging 0.5GB lamang, at may native suporta para sa 131,072 tokens long context at hybrid dual-mode inference batay sa enable_thinking. Sa pamamagitan ng napakababang hardware overhead, inilabas din ng OpenBMB ang MiniCPM Desk Pet, isang desktop floating companion app para sa pure offline operation, kung saan sumusuporta sa real-time response sa coding activities sa mga development tool tulad ng Cursor at LoRA persona switching. (Source: BlockBeats)
Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.