Universiti Tsinghua dan Mianbi membuka sumber Kerangka Pra-pelatihan AI-pengkodean pertama di dunia, ForgeTrain
KuCoinFlash
Kongsi
Ringkasan
Universiti Tsinghua dan Mianbi membuka sumber ForgeTrain, kerangka kerja pra-pelatihan pertama di dunia yang ditulis oleh AI untuk berita AI + kripto. Kerangka kerja ini mengungguli Megatron daripada NVIDIA dan meningkatkan kelajuan sebanyak 10% pada Huawei Ascend. Ia juga menghasilkan MiniCPM5-1B, model kompak yang berperingkat teratas. Projek ini menonjolkan potensi integrasi berita aset sebenar (RWA) semasa alat AI terus berkembang.
ME AI mesej, menurut pemantauan Beating, Bimbingan Membatalkan dan Laboratorium NLP Tsinghua secara bersama-sama membuka sumber kod kerangka latihan pra-pretrai model besar peringkat pengeluaran pertama di dunia yang sepenuhnya ditulis oleh AI, iaitu ForgeTrain, serta menerbitkan model kecil sisi hujung yang dilatih oleh ForgeTrain, MiniCPM5-1B. Sebagai contoh pertama yang menunjukkan kitaran kejuruteraan "AI membuat AI", ForgeTrain mencapai prestasi yang melampaui Megatron milik NVIDIA dalam keadaan peranti yang sama, serta mencapai percepatan 10% semasa latihan pra-pretrai di Huawei Ascend. Sementara itu, MiniCPM5-1B menduduki tempat pertama dalam senarai model berukuran kecil dengan bobot terbuka oleh Artificial Analysis.
Untuk membolehkan AI membina infrastruktur latihan pra-pretrai bawahannya secara kendiri, Bimbingan Membatalkan mencadangkan paradigma pengaturcaraan perisian "Kejuruteraan Pemprosesan" (Forge Engineering), menolak kerangka serba boleh yang kompatibel dengan semua peranti dan tugas, sebaliknya memanfaatkan kemampuan penjanaan kod berkos rendah AI untuk membentuk kod khusus secara tempatan bagi model dan peranti tertentu. Dari segi mekanisme pembinaan, ForgeTrain menggunakan kaedah tiga peringkat: pertama, mengumpul data penting daripada kerangka latihan pra-pretrai sedia ada untuk membentuk peperiksaan ujian (Harness), kemudian secara berulang menghasilkan kod kerangka yang konsisten secara binari dalam kitaran automatik, dan akhirnya melepaskan sekatan untuk melampaui pelaksanaan rujukan. Seluruh proses evolusi automatik ini sepadan dengan peringkat L3 hingga L4 "AI membuat AI".
Sebagai model pertama yang dihasilkan oleh ForgeTrain, MiniCPM5-1B mempunyai 1.08 bilion parameter, dengan arsitektur utama berdasarkan LlamaForCausalLM piawai, yang secara besar-besaran mengurangkan rintangan integrasi dan penghantaran inferens bawahannya. Dalam ujian Artificial Analysis, model ini mencapai 18 mata, melampaui Qwen3.5-2B berskala 2B (16 mata), serta mengungguli Qwen3.5-0.8B (11 mata) dan LFM2.5-1.2B-Thinking (8 mata). Model ini menyokong format penghantaran seperti MLX 4-bit dan GGUF Q4_K_M; selepas kuantisasi INT4, bobotnya hanya 0.5GB, dan menyokong secara asli konteks teks panjang 131,072 token serta inferens bimodal campuran berdasarkan enable_thinking. Dengan penggunaan peranti yang sangat rendah, OpenBMB juga secara serentak membuka sumber aplikasi teman desktop berjalan secara percuma, MiniCPM Desk Pet, yang menyokong respons masa nyata terhadap aktiviti pengkodean dalam alat pembangunan seperti Cursor serta pertukaran persona LoRA.
(Sumber: BlockBeats)
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini.
Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.