Moonshot AI baru saja meluncurkan Kimi-K2.7-Code, model pemrograman open-source yang bertujuan membuat pemrograman berbantuan AI menjadi lebih hemat dan lebih mampu. Perusahaan berbasis Beijing ini mengklaim model ini mengurangi penggunaan token penalaran sebesar 30% dibandingkan pendahulunya, yang secara praktis berarti pengembang menghabiskan lebih sedikit sumber daya komputasi sambil mendapatkan hasil yang lebih baik.
Model ini telah aktif di API platform Kimi milik Moonshot AI dan dihosting di Hugging Face dengan lisensi Modified MIT. Lisensi ini mengizinkan penggunaan komersial dengan atribusi untuk penyebaran skala besar, sebuah detail yang penting bagi perusahaan mana pun yang mempertimbangkan untuk membangun produk berbasis model ini.
Angka-angka di balik pembaruan
Kimi-K2.7-Code adalah arsitektur Mixture-of-Experts yang mengemas total 1 triliun parameter dengan 32 miliar parameter aktif.
Peningkatan benchmark dibandingkan model K2.6 sebelumnya sulit diabaikan. Moonshot AI melaporkan peningkatan 21,8% pada Kimi Code Bench v2, peningkatan 11,0% pada Program Bench, dan lonjakan 31,5% pada MLS Bench Lite.
Angka terakhir itu sangat mencolok. MLS Bench Lite menguji kemampuan dukungan multi-bahasa, artinya model ini menangani tugas-tugas di berbagai bahasa pemrograman seperti Python, Rust, dan Go dengan akurasi yang jauh lebih baik daripada sebelumnya.
Pengurangan 30% pada token penalaran menangani apa yang disebut para peneliti sebagai “overthinking,” masalah umum di lingkungan pemrograman otomatis. Ketika model AI menghabiskan terlalu banyak token untuk bernalar melalui suatu masalah, ia menghabiskan daya komputasi, meningkatkan latensi, dan menaikkan biaya API bagi pengembang.
Dari startup chatbot menjadi kekuatan open-source
Moonshot AI didirikan pada 2023 oleh Zhilin Yang, seorang alumni Universitas Tsinghua yang membangun perusahaan di sekitar chatbot Kimi. Peralihan ke rilis model berbobot terbuka dimulai dengan seri K2 pada pertengahan 2025, dan kecepatan iterasi sejak itu tak terbendung.
Model dasar K2 diluncurkan pada Juli 2025. K2 Thinking menyusul pada November 2025, menambahkan kemampuan penalaran yang ditingkatkan. K2.5 tiba pada Januari 2026, dan K2.6 datang pada April 2026. Sekarang K2.7-Code hadir pada Juni 2026, menjadikannya rilis utama kelima dalam waktu kurang dari satu tahun.
Perusahaan telah menempatkan model-modelnya di sekitar tiga pilar: kemampuan agen, penanganan konteks yang diperluas, dan input multimodal. K2.7-Code sangat mengandalkan dua pilar pertama, dirancang untuk skenario di mana agen AI perlu merencanakan, mengeksekusi, dan memperbaiki kode di sepanjang urutan panjang.
