OpenBMB Meluncurkan MiniCPM5-1B untuk Agen AI Perangkat

icon币界网
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
OpenBMB telah meluncurkan MiniCPM5-1B, model dengan 10 miliar parameter untuk penggunaan agen AI di perangkat pada smartphone. Model ini mendukung MCP dan pemanggilan alat, dengan jendela konteks 128K untuk dokumen panjang dan analisis on-chain. Model ini berjalan secara lokal tanpa dukungan cloud dan dioptimalkan untuk tugas agen ringan. Integrasi dengan alat eksternal meningkatkan fungsionalitas dan memungkinkan pemrosesan data on-chain.
CoinGape melaporkan:

OpenBMB meluncurkan model pertama dari seri MiniCPM5, yaitu MiniCPM5-1B, yang tidak ditujukan untuk bersaing langsung dengan model besar, melainkan untuk mengompres AI Agent lokal agar dapat berjalan di perangkat konsumen seperti ponsel. Model ini memiliki 1 miliar parameter, mendukung MCP dan pemanggilan alat asli, dengan fokus pada kemampuan perangkat untuk menyelesaikan tugas agen ringan tanpa bergantung pada koneksi cloud.

Fokus pada penyebaran di sisi perangkat dan konteks panjang

Dari segi posisi produk, keunggulan MiniCPM5-1B bukanlah cakupan pengetahuan, melainkan "menyelesaikan lebih banyak tugas dengan ukuran yang lebih kecil". Jendela konteks model mencapai 128K, memungkinkan pemrosesan dokumen panjang, percakapan berkelanjutan, dan rantai tugas yang lebih panjang. Untuk model dengan 1 miliar parameter, spesifikasi ini sudah mendekati rentang penggunaan praktis di perangkat tepi.

Laporan tersebut menyebutkan bahwa model ini dapat digunakan untuk membaca catatan, merangkum PDF, menjawab pertanyaan terkait dokumen, serta memanggil kalender, database, atau layanan penelitian eksternal secara lokal. Jika digunakan bersama server MCP, kemampuan seperti pencarian web juga dapat diintegrasikan ke dalam alur kerja lokal.

  • Jumlah parameter: 1 miliar
  • Jendela konteks: 128K
  • Kemampuan dukungan: MCP, pemanggilan alat asli

Metode pelatihan menekankan efisiensi

MiniCPM5-1B dibangun di atas arsitektur MiniCPM4, salah satu teknologi intinya adalah InfLLM v2. Mekanisme ini saat inferensi konteks panjang hanya memungkinkan setiap token berinteraksi dengan sedikit token terdekat, untuk mengurangi beban komputasi sekaligus mempertahankan akurasi semaksimal mungkin.

Dalam hal pemrosesan data, tim menggunakan proses penyaringan bernama UltraClean dan menyatakan bahwa model mencapai kinerja kuat pada sekitar 8 triliun token pelatihan. Tahap pasca-pelatihan menggabungkan pembelajaran penguatan dan metode distilasi untuk meningkatkan skor uji pada matematika, kode, dan pengikutan instruksi, sekaligus mengurangi output yang terlalu panjang.

Leading in benchmarking, but reasoning remains limited

Menurut hasil perbandingan dari OpenBMB, MiniCPM5-1B mencapai skor rata-rata lebih tinggi daripada pesaing sekelasnya dalam berbagai uji coba, termasuk pengetahuan umum, pengetahuan spesifik bidang, kode, matematika, logika, dan tugas agen, dengan keunggulan lebih nyata dalam kemampuan agen dan tugas pengetahuan umum.

Namun, pengujian media juga menunjukkan bahwa model ini masih membuat kesalahan pada soal logika dasar. Misalnya, saat menghadapi pertanyaan hukum pernikahan yang jelas-jelas memiliki jebakan, model gagal mengenali kontradiksi logis dalam soal itu sendiri, dan sebaliknya memberikan analisis hukum yang tampak lengkap. Dalam pengujian lain, model juga gagal memberikan jawaban langsung pada pertanyaan pilihan ganda, dan cenderung memberikan respons kompromi.

Ini berarti MiniCPM5-1B lebih cocok untuk tugas ringan dan skenario pemanggilan alat, bukan untuk menangani penilaian fakta presisi tinggi secara mandiri. Laporan tersebut menyatakan bahwa setelah terhubung dengan alat eksternal atau server penelitian, ilusi model kecil ini pada pertanyaan fakta yang kurang umum diharapkan berkurang secara signifikan.

Sudah dibuka untuk diunduh

Saat ini, MiniCPM5-1B telah dirilis di Hugging Face dengan lisensi Apache 2.0, kompatibel dengan kerangka kerja inferensi vLLM, SGLang, dan Transformers. Bagi AI sisi perangkat, model kecil semacam ini yang dapat dijalankan secara lokal, memanggil alat, dan mempertahankan konteks panjang, secara bertahap berubah dari proyek penelitian menjadi bentuk produk nyata.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.