Rilis K2.6 Moonshot dan Kenaikan Harga Dilihat Sebagai Langkah Sebelum IPO

Tulisan | Xiang Xianzhi

Pada malam sebelum semalam, Moonshot melancarkan Kimi K2.6 dan menyesuaikan harga input API dari $0.60 per juta token kepada $0.95.

Naik 58%. Pertama kalinya meningkat sejak pelancaran siri K2.

Tetapi tampaknya tidak ada yang memperhatikan perkara ini.

Empat bulan yang lalu, dalam surat dalaman pada hari terakhir 2025, Yang Zhilin menulis bahawa "Moon Shadow tidak tergesa-gesa untuk IPO dalam jangka pendek". Pada masa itu, prospektus Zhipu dan MiniMax sudah dihantar ke Bursa Hong Kong, yang jelas merupakan tindakan sengaja untuk membezakan diri.

Dia juga menulis dalam surat itu bahawa simpanan tunai syarikat melebihi US$1.4 bilion, dan pembiayaan Siri C sebanyak US$500 juta mengalami permintaan berlebihan—implikasinya, potensi pasaran primer belum sepenuhnya dimanfaatkan, dan pasaran sekunder tidak perlu tergesa-gesa.

Tiga bulan kemudian, Bloomberg melaporkan bahawa beliau mulai berhubung dengan CICC dan Goldman Sachs. Tiga minggu kemudian, K2.6 dilancarkan.

Seseorang yang tidak suka “tergesa-gesa” telah menyelesaikan perkara yang sebelumnya dikatakan tidak akan dilakukannya dalam masa empat bulan.

K2.6 bukanlah pelancaran produk terakhir sebelum pelancaran Moonshot. Namun, pelancaran versi ini adalah perjalanan promosi pertama Yang Zhi Lin selepas pelancaran Moonshot.

Kimi belum pernah mengeluarkan versi model seperti ini

Kimi sebelum ini mempunyai satu set gerakan tetap untuk modelnya.

Terbitkan laporan teknikal, buka sumber bobot, dan naikkan tangga dalam senarai HuggingFace, kemudian tunggu tinjauan komuniti teknikal. K1.5 menandingi o1 dalam metodologi penalaran, dengan butiran teknikal yang lebih banyak daripada nombor benchmark; K2 Thinking secara langsung memuatkan bobot ke HuggingFace, membolehkan pembangun menjalankan ujian sendiri. Tindakan-tindakan ini ditujukan kepada pembangun dan penyelidik.

Pendekatan yang sama dari komuniti teknikal: kami menyelesaikan masalah apa, mengapa kaedah kami lebih baik, dan kami menyambut anda untuk mereplikasi.

Tindakan K2.6 berbeza.

Mari kita mulakan dengan kenaikan harga. Dalam istilah yuan, harga input untuk K2.6 ialah 6.5 yuan setiap juta token (cache tidak berjaya), manakala K2.5 ialah 4 yuan. Harga output meningkat dari 21 yuan kepada 27 yuan. Harga cache berjaya ialah 1.1 yuan.

Ini adalah kenaikan harga yang terstruktur. Secara zahir, semua peringkat mengalami kenaikan, tetapi kenaikan pada peringkat cache hit adalah yang paling kecil—dari RM0.70 kepada RM1.10, atau setara dengan $0.16 per juta token.

Harga 0.16 dolar ini adalah kunci untuk memahami kenaikan harga ini.

Untuk pengguna perusahaan yang menggunakan prompt sistem yang sama dalam jangka panjang: pembantu kod, kerangka pengaturan Agen, dan perkhidmatan pelanggan pintar, awalan mereka digunakan semula secara tinggi, kadar kejayaan cache boleh mencapai 75% hingga 83%. Moonshot memberikan harga hampir sama kepada pelanggan ini.

Untuk pelanggan yang jarang menggunakan dan setiap prompt berbeza, kenaikan harga kali ini ditanggung sepenuhnya oleh mereka.

Ini adalah penyesuaian harga yang ramah terhadap "perusahaan yang telah terikat pada Kimi" dan penyesuaian harga yang tidak ramah terhadap "pelanggan individu yang masih membandingkan harga". Yang pertama adalah "pelanggan korporat yang terkunci" dalam cerita pelantikan, sementara yang kedua adalah "pengguna long tail" yang tidak akan muncul dalam PPT promosi. Yue Zhi An Mian sangat jelas siapa saja yang menjadi aset valuasi mereka.

Struktur pengiraan pada era Agent berbeza dengan era dialog. Model dialog melibatkan perjalanan pulang-pergi beberapa puluh token, manakala Agent menghabiskan ribuan panggilan alat dan ratusan ribu token. Dalam kes rasmi K2.6 — pemasangan tempatan Qwen3.5 di Mac melakukan 4,000 lebih panggilan alat selama 12 jam, membangunkan semula mesin pertukaran sumber terbuka exchange-core dengan lebih dari 1,000 panggilan alat dalam 13 jam, dan yang lebih ekstrem ialah pemerhatian serta respons gangguan yang berjalan secara autonomi selama 5 hari — penggunaan token bagi tugas-tugas tunggal ini adalah ratusan hingga ribuan kali ganda berbanding skenario dialog pada era K2.5.

Tentu, kes ini digunakan untuk menjelaskan kemampuan penalaran jangka panjang, tetapi dengan penambahan kluster 300 agen K2.6 ini, penggunaan token pasti sangat besar.

Pada harga lama 0.60 dolar AS, tugas agen ini mungkin mengalami kerugian setiap panggilan. Pada harga 0.95 dolar AS, ia hanya cukup menutupi kos inferensi.

Jadi, kenaikan harga bukanlah tanda keyakinan, tetapi keperluan. Moonshot telah mengumpulkan pembiayaan sebanyak $2.5 bilion, dengan simpanan tunai $1.4 bilion dari rangkaian Putaran C hingga C+, tetapi jika K3 generasi seterusnya benar-benar berukuran 3-4 trilion parameter, satu sesi latihan pra-pelatihan mungkin akan menghabiskan separuh daripadanya.

Tanpa kenaikan harga, data keuntungan kasar untuk beberapa kuartal terakhir sebelum pelancaran akan kelihatan buruk. Prospektus perlu mengesahkan kadar keuntungan kasar.

The Dark Side of the Moon

Perkara ini seharusnya boleh dibincangkan dengan terus terang—Era Agent memerlukan model penentuan harga yang baru. Tetapi Moonshot tidak membincangkannya. Kerana pengguna akhir baru sahaja berpindah dari era percuma K2 Thinking, kini mengatakan “saya menaikkan harga” kepada mereka bukanlah cerita produk yang baik.

Ia adalah cerita yang ditujukan kepada pendengar lain—Kimi telah memiliki sejumlah pelanggan perusahaan yang tidak dapat lepas darinya, walaupun lebih mahal, mereka tetap akan menggunakannya. (Seperti diri saya sendiri)

Perkara kedua ialah perbandingan rujukan. Rujukan yang dipilih secara rasmi oleh K2.6 ialah GPT-5.4, Claude Opus 4.6, dan Gemini 3.1 Pro. Ketiga-tiganya adalah model unggul generasi sebelumnya.

Pada minggu yang sama, Anthropic melancarkan Claude Mythos, dan Opus 4.7 baru sahaja dilancarkan—kedua-duanya lebih unggul satu generasi berbanding Opus 4.6. K2.6 tidak menandingi keduanya.

Ini sebenarnya adalah pilihan aktif. Dibandingkan dengan Mythos, K2.6 berada di posisi "pengejar"; dibandingkan dengan Opus 4.6, K2.6 berada di "golongan teratas". Penilaian $18 bilion memerlukan yang terakhir.

Kimi sebelum ini tidak sering melakukan perkara seperti ini. Semasa K2 Thinking dilancarkan, pihak rasmi terus menjalankan benchmark penuh, memaparkan semua keputusan—baik yang baik mahupun yang buruk—supaya pembangun boleh membuat penilaian sendiri. Itulah cara komuniti teknikal berfungsi—komuniti memahami kekuatan dan kelemahan anda, dan bersedia menerima model yang mempunyai kekurangan jelas tetapi arah yang jelas.

Bukan PPT路演. PPT路演 memerlukan kesimpulan yang boleh difahami oleh pengurus dana dalam 30 saat: "sama rata atau lebih baik daripada model tertutup terkemuka antarabangsa." Ayat ini adalah teks asal daripada blog rasmi K2.6.

Perkara ketiga ialah kluster Agent dan dua landasan sumber terbuka. K2.6 meningkatkan sesuatu yang dipanggil Claw Groups—ekosistem Agent heterogen, di mana Agent dengan peranti berbeza, model berbeza, dan rantai alat berbeza beroperasi dalam ruang kolaborasi yang sama, dengan K2.6 bertindak sebagai pengendali. 300 Agent anak berjalan secara serentak, 4000 langkah kerjasama, dan beroperasi secara bebas selama 5 hari.

Nombor-nombor ini ditujukan kepada pelanggan korporat, bukan kepada pembangun. Bagi seorang pembangun, “300 Agent berjalan secara serentak” tidak mempunyai makna praktikal—dia tidak akan menjalankan 300 Agent dalam projek tempatan. Konfigurasi ini hanya bermakna untuk satu jenis pelanggan: perusahaan besar yang perlu menggunakan matriks Agent untuk mengautomasi keseluruhan proses operasi.

Yang dibandingkan adalah cerita Salesforce, bukan cerita HuggingFace.

Sementara itu, K2.6 dibuka sepenuhnya. Yang Zhilin mengatakan di Forum Zhongguancun pada 26 Mac bahawa open-source akan menjadi kemenangan mutlak.

Agen sumber terbuka + perusahaan, ini berada di tengah-tengah antara DeepSeek dan Anthropic, dengan masing-masing model menyumbang separuh. Mendengar seperti cerita yang baik. Tetapi memihak kedua-dua belah bermakna perlu membuktikan kedua-duanya.

Pasar modal sebenarnya tidak peduli sama ada masalah-masalah ini ada jawapan atau tidak. Ia hanya meminta anda memiliki cerita di setiap garis.

Kenaikan harga, penyesuaian dengan pembanding, dan kluster Agent—ketiga perkara ini apabila digabungkan, mempunyai satu persamaan yang tidak biasa. Tiada satu punnya ditujukan untuk komuniti teknikal.

Logik asas model yang dikeluarkan oleh Kimi sebelum ini ialah—jika pembangun menyukai saya, pelanggan korporat akannya menyusul, dan pasaran modal pasti akan menyusul. Pendekatan ini mempunyai nama, iaitu ketulusan teknologi.

K2.6 Tidak perlu tunggu lagi. Kenaikan harga adalah pengumuman langsung kuasa penetapan harga pihak B, penempatan nilai awal dibandingkan GPT-5.4, dan kumpulan Agent serta Claw Groups adalah contoh pameran perkhidmatan perniagaan.

Setiap perkara berkaitan dengan satu soalan dalam PPT perjalanan promosi: Apakah kemampuan komersial anda? Di manakah kedudukan perbandingan anda? Apakah rintangan B2B anda?

Dari Preview ke GA dipadatkan menjadi 8 hari, dengan logik yang sama. Versi sebelum K2 sering melalui tempoh preview 2-3 bulan, membolehkan komuniti menguji, memberi maklum balas, dan mengitersi secukupnya. K2.6 tidak memberi ruang sendiri untuk ini. Bukan kerana teknologi menjadi lebih matang lebih cepat, tetapi kerana jendela masa tidak menunggu.

IPO pada suku kedua tahun 2026, mengikut prosedur Bursa Hong Kong, perlu menyediakan 4 hingga 6 bulan untuk penghantaran permohonan, soal jawab, dengar pendapat, perjalanan promosi, penetapan harga, dan tempoh penenangan. Memulakan perjalanan promosi pada bulan September bermakna produk perlu disiapkan pada bulan April.

Tiada GA pada bulan April, tiada lagi jendela selepas ini.

K3 adalah penutup sebenar

Namun, K2.6 bukanlah kartu terkuat yang boleh dikeluarkan oleh Moon's Dark Side.

Dalam blog rasmi, terdapat satu pernyataan yang sangat berhati-hati—K2.6 adalah "runway untuk K3".

Kod jangka panjang 12 jam, kluster 300 agen, kompresor konteks—ini bukan bentuk akhir siri K2, tetapi infrastruktur lapisan pelaksanaan yang boleh ditanggung oleh model dasar yang lebih besar. Yue Zhi An Mian tidak akan membuang usaha untuk menjalankan sistem ini kecuali sangat yakin bahawa model yang lebih besar akan menggunakannya.

Reddit sebelum ini mengeluarkan maklumat mengenai K3, dengan sasaran parameter berukuran 3-4 trilion. Berbanding dengan skala trilion siri K2, ini merupakan lompatan asas.

Jika K3 boleh dilancarkan semasa jendela路演—itu adalah jawapan sebenar. Runway yang telah disediakan oleh K2.6, K3 akan terbang.

Masalahnya ialah sama ada ia boleh dikejar. Berapa lama masa yang diperlukan untuk melatih model dengan 3-4 trilion parameter? GPT-5 dan Claude Opus 4.6 semuanya mempunyai tempoh latihan awal sekitar 6-9 bulan, ditambah beberapa bulan lagi untuk latihan lanjutan dan penilaian keselamatan. Berdasarkan kerjasama dengan Alibaba Cloud dan simpanan tunai semasa, adakah Moonshot mempunyai kekuatan pengiraan yang cukup untuk memendekkan tempoh ini kepada 5-6 bulan?

Taruhan ini diletakkan pada K2.6.

Pra-pandangan selama lapan hari hingga GA, cluster agen dinaikkan secara serentak dari 100 kepada 300, tugas jangka panjang diperpanjang dari beberapa ratus langkah kepada 4,000 langkah—setiap tindakan memampatkan masa dan membuka ruang untuk kemungkinan K3.

Jika K3 boleh dikeluarkan sebelum bulan Ogos dan September—itu akan menjadi lagu penutup di perarakan promosi.

Jika tidak dapat mengejarnya—K3 akan menjadi model yang hanya boleh dikeluarkan selepas pelancaran, dan K2.6 perlu menanggung seluruh naratif penilaian sendirian.

MoonDarkSide bertaruh bahawa ia mampu melakukannya.

Nilai pasaran US$18 bilion ditetapkan berdasarkan apa?

Kembali kepada penilaian.

Tiga bulan lalu, penilaian Moonshot ialah US$4.3 bilion, dua bulan lalu US$5.5 bilion, sekarang US$18 bilion.

Bukan bererti Yin Zhi An Mian meningkat empat kali ganda dalam tiga bulan ini. Ia meningkat empat kali ganda selepas Zhipu dan MiniMax disenaraikan, yang mengangkat had keseluruhan pasaran. Pasar modal Zhipu di Hong Kong ialah 305 bilion dolar Hong Kong, MiniMax ialah 309.2 bilion dolar Hong Kong—nilai pasaran kedua-duanya melebihi titik tertinggi sejarah SenseTime.

Logik nilai pasaran kedua-dua syarikat bukanlah “apa yang teknologi generasi seterusnya boleh capai”, tetapi “berapa banyak aset AI boleh dinilai dalam pasaran Hong Kong ini”.

Penilaian US$18 bilion pihak gelap bulan merujuk kepada perkara yang sama. Ia bukan lagi membuktikan bahawa ia adalah syarikat AI China yang paling kuat, tetapi membuktikan bahawa ia adalah syarikat AI China yang boleh dinilai.

K2.6 Semua tindakan — kenaikan harga, penyesuaian, kluster Agent, dan sumber terbuka dwi-trak — adalah respons terhadap proposisi ini.

Tetapi ada satu perkara yang belum dibuktikan oleh K2.6. Adakah pengguna C-end Kimi bersedia membayar untuk K2.6 yang telah dinaikkan harganya? Adakah pengguna langgan berbayar akan berpindah ke DeepSeek atau MiniMax? Berapa ramai pelanggan korporat benar-benar menjalankan Claw Groups, dan berapa ramai hanya menandatangani POC?

Nombor-nombor ini adalah perkara yang pelabur akan tanya semasa路演. K2.6 sekarang hanya boleh memaparkan produk. Samada ia boleh menjadi nombor atau tidak, bergantung pada tiga bulan ke depan.

Pada masa pelantikan, Zhigong mengemukakan prospektus yang belum menunjukkan keuntungan, begitu juga MiniMax. Pelabur menerima cerita ini kerana naratif besar “aset AI China” baru sahaja dibuka. Yue Zhi An Mian datang terlambat selama separuh tahun. Dengan masalah yang sama, Zhigong dan MiniMax boleh berkata, “Kami sedang mengesahkan,” tetapi Yue Zhi An Mian perlu berkata, “Kami sedang menghasilkan pendapatan.”

Tekanan ini berlaku sepenuhnya dalam tempoh tiga bulan antara K2.6 dan K3.

Jadi, kembali kepada soalan awal—adakah K2.6 merupakan路演 terakhir sebelum pelancaran Moonlight?

Tidak.

Jika K3 berkesempatan memasuki jendela roadshow, maka K3 adalah penutup sejati. K2.6 hanyalah landasan yang disediakan untuknya. Jika K3 gagal memasuki jendela roadshow, maka K2.6 harus menanggung seluruh narasi pelantikan. Ia akan menjadi pertunjukan pertama yang dipaksa dibuka oleh Yang Zhi Lin lebih awal.

Hasil mana-mana, empat bulan yang lalu bukanlah yang diinginkan oleh Yang Zhilin.

Namun, semua yang berlaku dalam empat bulan ini—pelancaran Zhipu MiniMax, batas penilaian dinaikkan, tempoh jendela dipendekkan—membuat seseorang yang tidak suka “cepat” terpaksa segera bertindak.

K3 dipancarkan pada pertandingan kedua.