OpenBMB meluncurkan model pertama dari seri MiniCPM5, yaitu MiniCPM5-1B, yang tidak ditujukan untuk bersaing langsung dengan model besar, melainkan untuk mengompres AI Agent lokal agar dapat berjalan di perangkat konsumen seperti ponsel. Model ini memiliki 1 miliar parameter, mendukung MCP dan pemanggilan alat asli, dengan fokus pada kemampuan perangkat untuk menyelesaikan tugas agen ringan tanpa bergantung pada koneksi cloud.
Fokus pada penyebaran di sisi perangkat dan konteks panjang
Dari segi posisi produk, keunggulan MiniCPM5-1B bukanlah cakupan pengetahuan, melainkan "menyelesaikan lebih banyak tugas dengan ukuran yang lebih kecil". Jendela konteks model mencapai 128K, memungkinkan pemrosesan dokumen panjang, percakapan berkelanjutan, dan rantai tugas yang lebih panjang. Untuk model dengan 1 miliar parameter, spesifikasi ini sudah mendekati rentang penggunaan praktis di perangkat tepi.
Laporan tersebut menyebutkan bahwa model ini dapat digunakan untuk membaca catatan, merangkum PDF, menjawab pertanyaan terkait dokumen, serta memanggil kalender, database, atau layanan penelitian eksternal secara lokal. Jika digunakan bersama server MCP, kemampuan seperti pencarian web juga dapat diintegrasikan ke dalam alur kerja lokal.
- Jumlah parameter: 1 miliar
- Jendela konteks: 128K
- Kemampuan dukungan: MCP, pemanggilan alat asli
Metode pelatihan menekankan efisiensi
MiniCPM5-1B dibangun di atas arsitektur MiniCPM4, salah satu teknologi intinya adalah InfLLM v2. Mekanisme ini saat inferensi konteks panjang hanya memungkinkan setiap token berinteraksi dengan sedikit token terdekat, untuk mengurangi beban komputasi sekaligus mempertahankan akurasi semaksimal mungkin.
Dalam hal pemrosesan data, tim menggunakan proses penyaringan bernama UltraClean dan menyatakan bahwa model mencapai kinerja kuat pada sekitar 8 triliun token pelatihan. Tahap pasca-pelatihan menggabungkan pembelajaran penguatan dan metode distilasi untuk meningkatkan skor uji pada matematika, kode, dan pengikutan instruksi, sekaligus mengurangi output yang terlalu panjang.
Leading in benchmarking, but reasoning remains limited
Menurut hasil perbandingan dari OpenBMB, MiniCPM5-1B mencapai skor rata-rata lebih tinggi daripada pesaing sekelasnya dalam berbagai uji coba, termasuk pengetahuan umum, pengetahuan spesifik bidang, kode, matematika, logika, dan tugas agen, dengan keunggulan lebih nyata dalam kemampuan agen dan tugas pengetahuan umum.
Namun, pengujian media juga menunjukkan bahwa model ini masih membuat kesalahan pada soal logika dasar. Misalnya, saat menghadapi pertanyaan hukum pernikahan yang jelas-jelas memiliki jebakan, model gagal mengenali kontradiksi logis dalam soal itu sendiri, dan sebaliknya memberikan analisis hukum yang tampak lengkap. Dalam pengujian lain, model juga gagal memberikan jawaban langsung pada pertanyaan pilihan ganda, dan cenderung memberikan respons kompromi.
Ini berarti MiniCPM5-1B lebih cocok untuk tugas ringan dan skenario pemanggilan alat, bukan untuk menangani penilaian fakta presisi tinggi secara mandiri. Laporan tersebut menyatakan bahwa setelah terhubung dengan alat eksternal atau server penelitian, ilusi model kecil ini pada pertanyaan fakta yang kurang umum diharapkan berkurang secara signifikan.
Sudah dibuka untuk diunduh
Saat ini, MiniCPM5-1B telah dirilis di Hugging Face dengan lisensi Apache 2.0, kompatibel dengan kerangka kerja inferensi vLLM, SGLang, dan Transformers. Bagi AI sisi perangkat, model kecil semacam ini yang dapat dijalankan secara lokal, memanggil alat, dan mempertahankan konteks panjang, secara bertahap berubah dari proyek penelitian menjadi bentuk produk nyata.
