ByteDance, Alibaba, Tencent Memperluas Agregasi Model dalam Perkhidmatan Awan

Mesin Volcano ByteDance, Rancangan Coding Plan Ark, baru sahaja dilancarkan GLM-5.1, dengan pihak rasmi menyatakan "selaras sepenuhnya dengan kemampuan asal, tanpa had pembelian". Sebelum ini, Rancangan Coding Plan Volcano hanya menyediakan model lama seperti GLM-4.7. Kemas kini ini tidak hanya memperkenalkan GLM-5.1, tetapi juga mengintegrasikan beberapa model besar tempatan terkini termasuk Minimax M2.7, Kimi k2.6, dan DeepSeek-V3.2.

Kimi

Ini bermakna, pembangun hanya perlu membayar satu bayaran langganan untuk memanggil pelbagai model terkemuka secara serentak. Berdasarkan maklum balas pasaran, "model pakej" ini secara besar-besaran mengurangkan kos percubaan dan kesilapan pembangun. Semasa ini, harga pakej Lite ialah RM40 sebulan, manakala harga pakej Pro ialah RM200 sebulan, menjadikan ramai pembangun bersedia untuk "membeli terlebih dahulu untuk menyimpan tempat".

GLM-5.1 oleh Zhipu sendiri telah menunjukkan kemampuan kejuruteraan yang mengesankan dalam kemas kini awal April 2026. Dalam dua video rasmi yang dikeluarkan oleh Zhipu, “Membina desktop Linux dari sifar dalam 8 jam” dan “655 lelaran, meningkatkan throughput carian pangkalan data vektor kepada 6.9 kali ganda versi rasmi asal”, telah memperbaharui persepsi awam mengenai “pelaksanaan berkesan 8 jam” oleh model besar.

Wartawan mengunjungi komuniti pembangun; kebanyakan pengguna menyatakan "tidak tahan lama"

Seorang wartawan memasuki kumpulan perbincangan pengembang Ark Coding dan mendapati bahawa selain post yang berkongsi pengalaman, ramai pengguna melaporkan perbezaan antara pengalaman sebenar dengan janjian. Selepas menggulir beberapa halaman komuniti perbincangan, akan ditemui banyak post aduan dan permohonan pengembalian dana, dengan ramai netizen secara terus menyatakan “rasa seperti ditipu”.

Kimi

Perkara utama yang dipersoalkan ialah:

Satu perkara berkaitan penggunaan had yang terlalu pantas. Seorang pengguna bernama “Hakimi” memposting bahawa “tugasan beberapa sesi perbualan, had 5 jam hampir habis”, dan seorang pengguna lain memaparkan sebab had 5 jam mereka dipicu kerana akaun mereka terus-menerus menggelongsor jendela selama 5 jam berterusan, dengan jumlah permintaan sebenar melebihi 6004 kali, melebihi had sistem.

Kimi

Kedua, pengalaman yang menurun disebabkan oleh tekanan pada pengagihan daya pengiraan. Banyak pengguna melaporkan mengalami ralat 429 (permintaan berlebihan) serta "kelambatan huruf pertama lebih dari satu minit adalah biasa" semasa jam puncak. Seorang pengguna secara terus terang berkata: "Had 5 jam terlalu kerap dipicu, tidak boleh digunakan untuk pembangunan serius."

Sementara itu, di sebalik harga rendah sebanyak RM40 sebulan dalam rancangan Coding Plan, terdapat "arus bawah" mengenai "satu permintaan panggilan" yang membawa kepada faktor pengurangan yang berbeza dalam pakej tersebut. Sebagai contoh, seorang pengguna telah memuat naik gambar "perbezaan faktor pengurangan untuk panggilan model yang berbeza" dalam kumpulan komuniti pembangun. Sebagai contoh, faktor pengurangan untuk keseluruhan siri DouBao dan siri Qwen ialah 1, siri DeepSeek ialah 2, manakala siri MiniMax-M2.7, Kimi-K2.6 dan GLM-5.1 ialah 5.

Kimi

Ini juga menunjukkan bahawa pembinaan "pasar model" tidak semudah yang dibayangkan; pembangun tertarik oleh "nilai untuk wang", tetapi kekurangan awal dalam pengurusan kuasa pengiraan dan aspek lain menyebabkan banyak pembangun berhenti mencuba setelah mencuba. Ini juga mengungkapkan kesakitan awal model "pakej". Dengan masuknya pengguna, kapasiti platform kuasa pengiraan menghadapi cabaran. Bagaimana mencapai keseimbangan berterusan antara tarikan harga rendah dan kualiti perkhidmatan akan menjadi tugas jangka panjang yang perlu diselesaikan oleh Volcano Engine dan pesaing seterusnya.

Pembekal awan secara bersama-sama berpindah ke “pasar model”, dengan pengkategorian dan pemantapan awal mula muncul

Kemas kini "terpadu" ini oleh Volcano Engine Coding Plan bukanlah satu peristiwa yang berasingan.

Sejak awal 2026, penyedia awan utama seperti Alibaba Cloud, Baidu Intelligent Cloud, dan Tencent Cloud semuanya sedang memajukan pelaksanaan integrasi pelbagai model. Sebagai pelopor industri, Alibaba Cloud telah lebih awal melancarkan pakej langganan pelbagai model, "Bailian Coding Plan". Saat ini menyokong siri Qwen serta model seperti kimi-k2.5, glm-5, dan MiniMax-M2.5. Harga Pro kini ialah RM200 sebulan, manakala pakej Lite telah dihentikan untuk pembelian baharu bermula 20 Mac, dan dihentikan untuk pembaharuan serta peningkatan bermula 13 April.

Kimi

Layanan langganan Coding Plan model besar Tencent Cloud akan dilancarkan sepenuhnya pada Mac 2026, menyokong beberapa model terkini seperti Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5, dsb. Baidu Qianfan secara rasmi melancarkan perkhidmatan langganan AI Coding Plan pada Februari 2026, menjadikannya salah satu penyedia awan pertama di negara ini yang menawarkan perkhidmatan semacam ini.

Model Supermarket" bukan lagi pilihan tunggal, tetapi sedang menjadi medan persaingan yang diperjuangkan oleh penyedia awan. Namun, setelah membongkar lapisan strategi agregasi penyedia awan, siapa yang mampu menyediakan perkhidmatan yang lebih stabil, peraturan kuota yang lebih telus, mekanisme kegagalan yang lebih fleksibel, serta mampu memperluas kemampuan perkhidmatan perniagaan di luar pemrograman, dan sama ada kadar pengekalan pelanggan mampu mengekori, semuanya menjadi inti persaingan baru.

Secara antarabangsa, platform pengumpulan model Amazon Bedrock dan Microsoft Azure berbeza dengan skenario langganan Coding di dalam negara, tetapi sama-sama mengikuti tren integrasi.

Kimi

Secara keseluruhan, persaingan industri juga berpindah dari "perbandingan kemampuan model tunggal" kepada "perbandingan kemampuan integrasi platform + perkhidmatan ekosistem", dan tahap pengumpulan industri akan meningkat dengan cepat.

Penganalisis utama pengaturan aset Guoxin Securities, Wang Kai, memberitahu bahawa walaupun perbezaan industri semakin cepat, penilaian bahawa industri sedang dalam fasa penggabungan mungkin terlalu awal. “Lebih tepatnya, ini adalah penghalusan dan pengulangan pembahagian tugas dalam rantai industri. Pengilang model berfokus pada algoritma, sementara pengilang awan berfokus pada penghantaran kejuruteraan, masing-masing memanfaatkan kekuatan utama mereka.” Beliau percaya, sama ada pengilang awan lain mengikuti atau tidak,格局 persaingan akan berubah daripada persaingan individu kepada pemisahan peranan ekosistem.

Tekanan "penghujan" terhadap syarikat model besar semakin meningkat?

Yang dimaksud dengan “penghujungan” bukanlah bererti syarikat model hilang, tetapi kehilangan premium produk, hak penyambungan pengguna, dan suara, dengan keuntungan berpindah kepada pihak platform pengiraan, menjadikannya peranan “yang dikuasai”.

Di bawah gelombang penggabungan penyedia awan, "pipelining" kini menjadi pedang Damokles yang menggantung di atas syarikat model besar bebas. Dalam permainan senyap ini, pemain utama seperti Zhipu AI, Moonshot (Kimi), dan MiniMax tidak memilih untuk berkompromi secara pasif, tetapi berkembang dari gen mereka masing-masing, memberikan jalan keluar yang berbeza.

Dalam perbincangan awam pada 8 April, CEO Zhipu AI, Zhang Peng, dengan jelas menyatakan bahawa matlamat akhir Zhipu bukanlah menjadi "alat panggilan yang boleh diganti dengan mudah", tetapi membina agen autonomi penuh (Autonomous Agent). Posisi ini cuba mengangkat Zhipu dari "pembekal model" kepada "pelaksana tugas", dengan itu mengelakkan perangkap harga rendah saluran API semata-mata.

Moonshot (Kimi) mengambil strategi "penyebaran teragih + pengembangan mendalam teks panjang". Secara serentak mengintegrasikan pelbagai platform awan utama seperti Volcano Engine dan Alibaba Cloud, untuk menyediakan kekuatan pengiraan dari sumber pelbagai dan tidak bergantung pada saluran tunggal, memastikan kestabilan perkhidmatan dan kawalan kos. Kimi K2.6 yang dilancarkan pada April 2026 menggunakan arsitektur Mixture of Experts (MoE), dengan jendela konteks standard sebanyak 256K token.

MiniMax akan mengalokasikan sumber daya utama kepada bidang-bidang khusus seperti penciptaan kandungan, perkhidmatan pelanggan pintar, pendidikan, perkhidmatan perniagaan, dan hiburan sosial, dengan penekanan khusus pada skenario seperti AI permainan, digital human, dan intermoda multimodal, untuk membina "keupayaan tersuai yang tidak boleh digantikan oleh platform awan".

Kimi

Akankah integrasi platform oleh syarikat besar mempercepat pemerosotan syarikat model menjadi “saluran”? Menurut Wang Kai, Analis Utama Aset Allocation di Guoxin Securities, perlu dibezakan antara perspektif jangka pendek dan jangka panjang.

“Dalam jangka pendek, saluran distribusi dikendalikan oleh platform, kuasa penetapan harga sebahagian diserahkan, dan keuntungan model beralih kepada pihak akses merupakan hukum perniagaan. Namun dalam jangka panjang, model umum mudah menjadi homogen; model pembelajaran mendalam untuk skenario khusus seperti kewangan, kesihatan, dan undang-undang, memiliki rintangan profesional yang tidak dapat dihapuskan hanya dengan pengumpulan terpusat,” katanya.

Dalam menghadapi risiko platformisasi, strategi OpenAI dan Anthropic boleh dirujuk: satu sisi, kuatkan saluran terus kepada pengguna akhir, seperti operasi bebas ChatGPT dan Claude yang sebenarnya membina sambungan pengguna yang mengelakkan platform. Di sisi lain, kelajuan peningkatan teknologi dan kesedaran jenama pengguna adalah dua parit perlindungan yang berkesan, oleh itu syarikat model perlu menyeimbangkan penyelidikan dan pembangunan dengan pelaburan dalam penerapan produk.

Permainan akhir antara "pengilangan dan pelantar" mungkin bukan tentang siapa yang menelan siapa, tetapi tentang pengelompokan peranan yang semakin jelas. Penyedia awan menjalankan peranan saluran, sementara syarikat model fokus pada teknologi; kedua-dua pihak secara beransur-ansur menemui sempadan kehidupan masing-masing dalam permainan ini.

Mengenai siapa yang akan memakan siapa, pada peringkat sekarang ini, masih jauh dari penghujung cerita.

Artikel ini berasal dari akaun WeChat "Borang Pencatatan Sains dan Teknologi", penulis: Wang Nai