Rilis K2.6 dan Kenaikan Harga Moonshot Dilihat sebagai Pra-IPO

Tulis oleh Xiang Xianzhi

Dua malam lalu, Moonshot merilis Kimi K2.6 dan menaikkan harga input API dari $0.60 per juta token menjadi $0.95.

Naik 58%. Pertama kalinya harga naik sejak peluncuran seri K2.

Tetapi tampaknya tidak ada yang memperhatikan hal ini.

Empat bulan lalu, dalam surat internal pada hari terakhir 2025, Yang Zhilin menulis bahwa Yue Zhi An Mian "tidak terburu-buru untuk IPO dalam jangka pendek". Pada saat itu, prospektus Zhipu dan MiniMax sudah diajukan ke Bursa Saham Hong Kong, yang jelas merupakan upaya sengaja untuk membedakan posisi mereka.

Dia juga menulis dalam surat itu bahwa cadangan kas perusahaan melebihi 1,4 miliar dolar AS, dan putaran C sebesar 500 juta dolar AS mengalami over-subscription—implikasinya adalah, potensi pasar primer belum sepenuhnya terwujud, sehingga pasar sekunder tidak perlu terburu-buru.

Tiga bulan kemudian, Bloomberg melaporkan bahwa ia mulai berhubungan dengan CICC dan Goldman Sachs. Tiga minggu kemudian, K2.6 diluncurkan.

Seseorang yang tidak suka "terburu-buru" menyelesaikan hal yang sebelumnya dikatakan tidak akan dilakukannya dalam empat bulan.

K2.6 bukanlah rilis produk terakhir sebelum peluncuran Moonlight Dark Side. Namun, rilis versi ini adalah presentasi pertama Yang Zhilin setelah rencana peluncuran Moonlight Dark Side.

Kimi belum pernah merilis versi model seperti ini

Kimi sebelumnya memiliki serangkaian tindakan tetap saat merilis model.

Rilis laporan teknis, buka bobot sumber terbuka, dan naikkan peringkat di HuggingFace, lalu tunggu tinjauan dari komunitas teknis. K1.5 menargetkan o1 dalam metodologi inferensi, dengan detail teknis lebih banyak daripada angka benchmark; K2 Thinking langsung mempublikasikan bobotnya di HuggingFace agar pengembang dapat menjalankan pengujian sendiri. Tindakan-tindakan ini ditujukan khusus untuk pengembang dan peneliti.

Pendekatan yang sama dari komunitas teknis: kami menyelesaikan masalah apa, mengapa metode kami lebih baik, selamat mencoba replikasi.

Aksi K2.6 sedikit berbeda.

Pertama, bicarakan kenaikan harga. Dalam denominasi RMB, harga input untuk K2.6 adalah 6,5 yuan per juta token (cache miss), sedangkan K2.5 adalah 4 yuan. Harga output naik dari 21 yuan menjadi 27 yuan. Harga cache hit adalah 1,1 yuan.

Ini adalah kenaikan terstruktur. Secara tampak, semua tingkatan mengalami kenaikan, tetapi kenaikan pada tingkat cache hit paling kecil—dari 0,7 yuan menjadi 1,1 yuan, atau setara 0,16 dolar AS per juta token.

Harga 0,16 dolar ini adalah kunci untuk memahami kenaikan harga ini.

Untuk pengguna perusahaan yang menggunakan prompt sistem yang sama dalam jangka panjang: asisten kode, kerangka pengaturan agen, dan layanan pelanggan cerdas, prefix mereka sangat sering digunakan ulang, tingkat keberhasilan cache mencapai 75% hingga 83%. Moonshot memberikan harga yang hampir seimbang kepada pelanggan ini.

Untuk pelanggan sporadis yang menggunakan prompt berbeda setiap kali, kenaikan harga kali ini sepenuhnya ditanggung oleh mereka.

Ini adalah penyesuaian harga yang ramah terhadap "perusahaan yang sudah terikat pada Kimi" dan penyesuaian harga yang tidak ramah terhadap "pelanggan individu yang masih membandingkan harga". Yang pertama adalah "pelanggan korporat yang terkunci" dalam cerita peluncuran, sementara yang kedua adalah "pengguna long tail" yang tidak akan muncul di presentasi路演. Moonshot sangat jelas siapa saja yang menjadi aset valuasi mereka.

Struktur komputasi di era Agent berbeda dengan era dialog. Model dialog melibatkan pertukaran puluhan token, sedangkan Agent mengonsumsi ribuan panggilan alat dan ratusan ribu token. Dalam contoh resmi K2.6—deploy lokal Qwen3.5 di Mac melakukan 4.000+ panggilan alat selama 12 jam, merekonstruksi mesin pertukaran exchange-core terbuka dengan 1.000+ panggilan alat dalam 13 jam, dan yang lebih ekstrem lagi, berjalan mandiri selama 5 hari untuk pemantauan, alert, dan respons gangguan—konsumsi token untuk tugas-tugas tunggal ini adalah ratusan hingga ribuan kali lebih besar daripada skenario dialog di era K2.5.

Of course, this case is used to illustrate long-range reasoning capabilities, but with the addition of K2.6's 300-agent cluster, the token consumption must be staggering.

Pada harga lama $0,60, panggilan tugas Agent ini mungkin merugi. Pada harga $0,95, biaya inferensi hampir tertutupi.

Jadi, kenaikan harga bukanlah tanda kepercayaan, melainkan keharusan. Moonshot telah mengumpulkan dana sebesar $2,5 miliar, dengan cadangan kas $1,4 miliar dari putaran C hingga C+, tetapi jika K3 generasi berikutnya benar-benar memiliki skala parameter 3-4 triliun, satu putaran pelatihan awal mungkin akan menghabiskan separuh dari dana tersebut.

Tidak ada kenaikan harga, data laba kotor untuk beberapa kuartal terakhir sebelum go public akan terlihat buruk. Prospektus harus mengungkapkan margin laba kotor.

Sisi gelap bulan

Hal ini seharusnya bisa dijelaskan secara terbuka—Era Agent membutuhkan model penetapan harga baru. Namun, Moonshot tidak membahasnya. Karena pengguna akhir baru saja berpindah dari era gratis K2 Thinking, sekarang mengatakan kepada mereka “saya menaikkan harga” bukanlah cerita produk yang baik.

Ini adalah cerita yang ditujukan untuk audiens lain—Kimi sudah memiliki sejumlah klien bisnis yang tidak bisa lepas darinya, meskipun harganya lebih mahal, mereka tetap akan menggunakannya. (Misalnya saya sendiri)

Hal kedua adalah benchmarking. Referensi yang dipilih resmi oleh K2.6 adalah GPT-5.4, Claude Opus 4.6, dan Gemini 3.1 Pro. Ketiganya adalah flagship generasi sebelumnya.

Pada minggu yang sama, Anthropic meluncurkan Claude Mythos, dan Opus 4.7 baru saja dirilis—keduanya lebih unggul satu generasi dibanding Opus 4.6. K2.6 tidak menyaingi keduanya.

Ini sebenarnya merupakan pilihan aktif. Dibandingkan dengan Mythos, K2.6 berada di posisi "pengejar"; dibandingkan dengan Opus 4.6, K2.6 berada di "kelompok teratas". Evaluasi senilai $18 miliar memerlukan yang terakhir.

Kimi sebelumnya tidak sering melakukan hal semacam ini. Saat K2 Thinking dirilis, pihak resmi langsung menjalankan benchmark penuh, menampilkan semua hasil—baik yang baik maupun yang buruk—agar pengembang dapat menilai sendiri. Itulah cara komunitas teknis bekerja—komunitas memahami kekuatan dan kelemahan Anda, dan bersedia menerima model yang memiliki kelemahan jelas tetapi memiliki arah yang jelas.

Bukan PPT roadshow. PPT roadshow memerlukan kesimpulan yang bisa dipahami manajer dana dalam 30 detik: "setara atau lebih unggul daripada model tertutup teratas internasional." Kalimat ini adalah teks asli dari blog resmi K2.6.

Hal ketiga adalah klaster Agent dan jalur ganda open-source. K2.6 meningkatkan sesuatu yang disebut Claw Groups—ekosistem Agent heterogen, di mana Agent dengan perangkat berbeda, model berbeda, dan rantai alat berbeda berjalan dalam ruang kolaborasi yang sama, dengan K2.6 bertindak sebagai pengatur. 300 sub-Agent berjalan paralel, 4.000 langkah kolaboratif, berjalan mandiri selama 5 hari.

Angka-angka ini ditujukan untuk klien perusahaan, bukan untuk pengembang. Bagi seorang pengembang, "300 Agent berjalan secara paralel" tidak memiliki makna praktis—dia tidak akan menjalankan 300 Agent dalam proyek lokal. Konfigurasi ini hanya bermakna bagi satu jenis klien: perusahaan besar yang perlu mengotomatisasi seluruh proses operasional dengan matriks Agent.

The story being referenced is that of Salesforce, not HuggingFace.

Sementara itu, K2.6 sepenuhnya bersifat open source. Yang Zhilin mengatakan di Forum Zhongguancun pada 26 Maret bahwa open source akan menjadi kemenangan mutlak.

Open-source + enterprise-grade agent cluster, ini berada di tengah antara DeepSeek dan Anthropic, masing-masing mode menempati setengahnya. Terdengar seperti cerita yang bagus. Tetapi, mengambil kedua sisi berarti harus membuktikan keduanya.

Pasar modal sebenarnya tidak peduli apakah masalah-masalah ini memiliki jawaban. Yang dimintanya hanyalah setiap garis memiliki cerita.

Kenaikan harga, pembandingan, dan klaster Agent—ketiga hal ini jika digabungkan memiliki satu kesamaan yang tidak biasa: tidak ada satupun yang ditujukan untuk komunitas teknis.

Logika dasar yang dulu digunakan Kimi adalah—jika pengembang menyukai saya, pelanggan perusahaan pada akhirnya akan mengikuti, dan pasar modal pasti akan mengikuti. Strategi ini memiliki nama, yaitu ketulusan teknis.

K2.6 Tidak perlu menunggu lagi. Kenaikan harga adalah deklarasi langsung atas kekuatan penetapan harga oleh pihak B, penetapan posisi valuasi lebih awal terhadap GPT-5.4, dan cluster Agent serta Claw Groups adalah contoh penerapan layanan perusahaan.

Setiap hal berkaitan dengan satu pertanyaan di slide路演 PPT: Kemampuan komersialisasi Anda apa? Posisi kompetitor Anda di mana? Hambatan B2B Anda apa?

Dari Preview ke GA dipersingkat menjadi 8 hari, dengan logika yang sama. Versi sebelum seri K2 semuanya melewati periode preview 2-3 bulan, agar komunitas bisa menguji, memberikan umpan balik, dan beriterasi cukup. K2.6 tidak memberi dirinya ruang semacam itu. Bukan karena teknologinya menjadi lebih cepat matang, tetapi karena jendela waktunya tidak menunggu.

IPO pada paruh kedua 2026, berdasarkan proses Bursa Saham Hong Kong, diperlukan waktu 4 hingga 6 bulan untuk pengajuan, pertanyaan, sidang, roadshow, penetapan harga, dan masa pendinginan. Peluncuran roadshow pada September berarti produk harus sudah siap pada bulan April.

Tidak ada GA pada bulan April, tidak akan ada jendela lagi setelahnya.

K3 adalah penutup yang sebenarnya

Namun, K2.6 bukanlah kartu terkuat yang bisa dikeluarkan oleh Moon's Dark Side.

Di blog resmi, ada satu kalimat yang sangat terkendali—K2.6 adalah "runway" untuk K3.

Pengkodean jangka panjang 12 jam, kluster 300 agen, kompresor konteks—ini bukan bentuk akhir dari seri K2, melainkan infrastruktur lapisan eksekusi yang dapat ditanggung oleh model dasar yang lebih besar. Yue Zhi An Mian tidak akan menghabiskan usaha untuk menjalankan这套 sistem kecuali sangat yakin ada model yang lebih besar yang akan mengonsumsi kemampuan-kemampuan ini.

Reddit sebelumnya pernah mengungkapkan informasi tentang K3, dengan target parameter berukuran 3-4 triliun. Dibandingkan dengan skala triliun pada seri K2, ini merupakan lompatan dasar.

Jika K3 bisa merilis sebelum jendela roadshow—itu adalah jawaban yang sebenarnya. Runway yang telah disiapkan K2.6, K3 lepas landas.

Masalahnya adalah apakah bisa mengejar waktu. Berapa lama waktu yang dibutuhkan untuk melatih model dengan 3-4 triliun parameter? GPT-5 dan Claude Opus 4.6 memiliki siklus pra-pelatihan sekitar 6-9 bulan, ditambah beberapa bulan lagi untuk pasca-pelatihan dan evaluasi keamanan. Berdasarkan kerja sama dengan Alibaba Cloud dan cadangan kas saat ini, apakah Moonshot AI mampu memperpendek siklus ini menjadi 5-6 bulan?

Taruhan ditempatkan pada K2.6.

Delapan hari Preview hingga GA, klaster Agent langsung diperluas dari 100 menjadi 300, eksekusi jangka panjang dinaikkan dari ratusan langkah menjadi 4.000 langkah—setiap tindakan memperpendek waktu, membuka ruang bagi kemungkinan K3.

Jika K3 dapat dirilis sebelum Agustus atau September—itu adalah penutup utama dari roadshow.

Jika tidak bisa tepat waktu—K3 menjadi model yang hanya bisa dirilis setelah listing, K2.6 harus menanggung seluruh narasi valuasi sendirian.

MoonDarkSide bertaruh bahwa hal itu bisa dilakukan.

Perkiraan nilai 18 miliar dolar AS mengacu pada apa?

Kembali ke valuasi.

Tiga bulan lalu, valuasi Moonshot adalah 4,3 miliar dolar AS, dua bulan lalu 5,5 miliar dolar AS, sekarang 18 miliar dolar AS.

Bukan berarti Moonshot menjadi empat kali lebih kuat dalam tiga bulan terakhir. Harga naik empat kali setelah Zhipu dan MiniMax go public, sehingga meningkatkan batas atas seluruh sektor ini. Pasar kapitalisasi Zhipu di Hong Kong mencapai 305 miliar HKD, MiniMax 309,2 miliar HKD—kapitalisasi kedua perusahaan ini melebihi puncak tertinggi SenseTime.

Logika kapitalisasi pasar kedua perusahaan bukanlah "apa yang bisa dicapai teknologi generasi berikutnya", melainkan "seberapa tinggi aset AI dapat dinilai di dalam kolam HKEx ini".

Nilai evaluasi $18 miliar dari Moonshot berpegang pada hal yang sama. Ini bukan lagi tentang membuktikan dirinya sebagai perusahaan AI Tiongkok terkuat, melainkan membuktikan bahwa ia adalah perusahaan AI Tiongkok yang dapat dinilai.

K2.6 Semua tindakan—kenaikan harga, penyesuaian, klaster Agent, jalur terbuka ganda—merespons pernyataan ini.

Namun, ada satu hal yang belum dibuktikan oleh K2.6. Apakah pengguna akhir Kimi bersedia membayar untuk K2.6 yang harganya naik? Apakah pengguna langganan berbayar akan beralih ke DeepSeek atau MiniMax? Berapa banyak klien perusahaan yang benar-benar menjalankan Claw Groups, dan berapa banyak yang hanya menandatangani POC?

Angka-angka ini pasti akan ditanyakan oleh investor saat roadshow. K2.6 saat ini hanya bisa menampilkan produknya. Apakah produk ini bisa menjadi angka, tergantung pada tiga bulan ke depan.

Saat ZhiPu go public, prospektus yang diajukan masih menunjukkan laba yang belum berbalik positif, begitu pula dengan MiniMax. Para investor menerima cerita ini karena pada saat itu narasi besar "aset AI Tiongkok" baru saja terbuka. Yue Zhi An Mian datang terlambat enam bulan. Dengan masalah yang sama, ZhiPu dan MiniMax bisa mengatakan "Kami sedang menguji validasi," sementara Yue Zhi An Mian harus mengatakan "Kami sedang menghasilkan pendapatan."

Tekanan ini seluruhnya jatuh pada tiga bulan antara K2.6 dan K3.

Jadi, kembali ke pertanyaan awal—Apakah K2.6 adalah路演 terakhir sebelum peluncuran MoonShadow?

Tidak.

Jika K3 bisa memanfaatkan jendela roadshow, maka K3 lah puncak sejatinya. K2.6 hanyalah landasan yang disiapkan untuknya. Jika K3 tidak bisa memanfaatkan jendela roadshow, maka K2.6 harus menanggung seluruh narasi peluncuran. Itu akan menjadi pertunjukan pertama yang dipaksakan oleh Yang Zhi Lin untuk dibuka lebih awal.

Hasil mana pun, empat bulan lalu bukan yang diinginkan oleh Yang ZhiLin.

Namun semua yang terjadi dalam empat bulan ini—peluncuran Zhipu MiniMax, atap valuasi terdorong naik, jendela waktu menyempit—membuat seseorang yang tidak suka "terburu-buru" harus segera bertindak.

K3 saat diluncurkan adalah pertandingan kedua.