Moonshot AI Melancarkan Kimi-K2.7-Code dengan 1 Triliun Parameter

Moonshot AI baru sahaja melancarkan Kimi-K2.7-Code, model pengaturcaraan sumber terbuka yang bertujuan menjadikan pengaturcaraan berasaskan AI kurang pembaziran dan lebih cekap. Syarikat berpusat di Beijing itu mengklaim model ini mengurangkan penggunaan token penalaran sebanyak 30% berbanding pendahulunya, yang dalam istilah praktikal bermakna pembangun menggunakan lebih sedikit sumber pengiraan sambil mendapat keputusan yang lebih baik.

Model ini telah dilancarkan di API platform Kimi Moonshot AI dan dihoskan di Hugging Face di bawah Lesen MIT Dimodifikasi. Lesen ini membenarkan penggunaan komersial dengan pemberian kredit untuk pelaksanaan berskala besar, satu butiran yang penting bagi sebarang syarikat yang mempertimbangkan untuk membina produk berdasarkannya.

Nombor di belakang peningkatan

Kimi-K2.7-Code adalah aritektur Mixture-of-Experts yang mengandung 1 trilion parameter keseluruhan dengan 32 miliar parameter aktif.

Peningkatan tolok ukur berbanding model K2.6 sebelumnya sukar untuk diabaikan. Moonshot AI melaporkan peningkatan 21.8% pada Kimi Code Bench v2, peningkatan 11.0% pada Program Bench, dan lompatan 31.5% pada MLS Bench Lite.

Nombor terakhir itu sangat menarik. MLS Bench Lite menguji kemampuan sokongan pelbagai bahasa, bermakna model ini menangani tugas-tugas di sepanjang bahasa pengaturcaraan seperti Python, Rust, dan Go dengan ketepatan yang jauh lebih baik daripada sebelumnya.

Pengurangan 30% dalam token penalaran menangani apa yang disebut para penyelidik sebagai “membuat fikiran berlebihan,” satu masalah biasa dalam persekitaran pengkodean automatik. Apabila model AI menghabiskan terlalu banyak token untuk menalar masalah, ia menghabiskan komputasi, meningkatkan latensi, dan meningkatkan kos API untuk pembangun.

Dari permulaan chatbot kepada kuasa sumber terbuka

Moonshot AI ditubuhkan pada tahun 2023 oleh Zhilin Yang, seorang alumni Universiti Tsinghua yang membina syarikat ini di sekitar chatbot Kimi. Peralihan kepada pelepasan model berat terbuka bermula dengan siri K2 pada pertengahan 2025, dan laju iterasi sejak itu tidak pernah berhenti.

Model asas K2 dilancarkan pada Julai 2025. K2 Thinking menyusul pada November 2025, menambahkan kemampuan penalaran yang ditingkatkan. K2.5 tiba pada Januari 2026, dan K2.6 datang pada April 2026. Kini K2.7-Code tiba pada Jun 2026, menjadikannya rilis utama kelima dalam masa kurang dari setahun.

Syarikat telah menempatkan modelnya di sekitar tiga pilar: kemampuan agen, penanganan konteks yang diperluas, dan input multimodal. K2.7-Code sangat bergantung pada dua yang pertama, direka untuk skenario di mana agen AI perlu merancang, melaksanakan, dan membaiki kod di sepanjang urutan panjang.