Esensi berlangganan AI adalah mengubah biaya komputasi yang tidak terkendali menjadi struktur pendapatan yang dapat diprediksi, yang juga akan menjadi pertanyaan inti yang terus diajukan kepada perusahaan AI di masa depan.
Penulis artikel, sumber: Wu Duidui
AI domestik akhirnya sampai pada tahap ini: tidak cukup hanya membahas pengguna, harus membahas cara menghasilkan uang.
Tahap akuisisi pengguna gratis telah berakhir, dan aplikasi AI mulai memasuki tahap "pemisahan biaya + pemisahan pengguna + validasi komersial".
Baru-baru ini, halaman App Store DouBao menampilkan informasi langganan berbayar: selain versi dasar gratis, kemungkinan ada versi standar 68 yuan/bulan, versi ditingkatkan 200 yuan/bulan, dan versi profesional 500 yuan/bulan, dengan biaya tahunan tertinggi 5.088 yuan.
Respons DouBao akan tetap tersedia sebagai layanan gratis, sementara paket layanan tambahan masih dalam pengujian, dan hak terkait belum ditampilkan secara resmi dalam produk saat ini.
Peristiwa ini dapat dilihat dari beberapa sudut pandang.
Ini terkait dengan biaya, terutama "biaya pengguna berat"
Masalah terbesar dengan produk DouBao adalah: semakin sering pengguna menggunakannya, semakin tinggi biaya platform.
Seorang pengguna biasa yang sesekali bertanya beberapa kalimat, biayanya mungkin terkendali.
Tetapi jika pengguna mulai melakukan hal-hal ini:
Menulis artikel panjang, membuat PPT, melakukan analisis data, penelitian mendalam, generasi gambar, generasi video, percakapan suara real-time, dan tugas multi-langkah Agent.
Maka itu sama sekali bukan tingkat biaya yang sama.
Kemampuan utama versi Mac DouBao selain obrolan adalah "pencarian, pengeditan gambar, penulisan, terjemahan, PPT, analisis data", dan menekankan alur kerja all-in-one seperti generasi gambar dan video, penelitian mendalam, notulen rapat, serta pemrosesan dokumen dan tabel. Fitur-fitur ini pada dasarnya membutuhkan lebih banyak token, lebih banyak daya inferensi, dan lebih banyak daya komputasi multimodal dibandingkan obrolan biasa.
Jadi, kemungkinan besar DouBao memungut biaya bukan karena "kalah terus dalam obrolan biasa", melainkan karena:
Kemampuan bernilai tinggi dan pengguna intensif tidak lagi dapat disediakan secara gratis tanpa batas.
Versi gratis tetap dapat tersedia sebagai pintu masuk, aktivitas harian, dan kesadaran merek; namun, fitur-fitur yang memakan sumber daya besar harus dibedakan melalui langganan, kuota, prioritas, dan versi profesional.
Tantangan komersialisasi AI adalah "pendapatan tetap, tetapi biaya fluktuatif"
Langganan memiliki kontradiksi alami:
Biaya yang dibayar pengguna setiap bulan tetap, tetapi jumlah token yang dikonsumsi pengguna tidak tetap.
Ini berbeda dengan Netflix, Tencent Video, atau iQIYI. Di platform video, setelah sebuah serial selesai diproduksi, pengguna dapat menontonnya beberapa kali, dengan biaya marjinal yang relatif terbatas. Berbeda dengan AI, setiap percakapan mendalam, setiap pembuatan video, dan setiap analisis konteks panjang memerlukan sumber daya inferensi baru.
Model perangkat lunak tradisional dan model Netflix lebih seperti:
Riset sekali → Salin tanpa batas → Biaya marjinal tambahan penjualan mendekati 0
Tetapi layanan model besar lebih seperti:
Model pengembangan sekali → setiap panggilan memerlukan daya komputasi → semakin banyak pengguna dan semakin dalam penggunaannya, biaya inferensi semakin tinggi.
API seperti OpenAI dan Azure OpenAI semuanya dibebankan berdasarkan token, yang pada dasarnya menunjukkan hal ini: token input, token output, konteks panjang, dan cache input memiliki harga yang berbeda, dengan token output biasanya jauh lebih mahal.
Di halaman penetapan harga resmi OpenAI, GPT-5.5 untuk konteks singkat adalah $2,5 per juta token input, $15 per juta token output, sedangkan input cache jauh lebih murah.
Ini bukan model ekonomi yang sama dengan menjual Office, menjual Photoshop, atau menjual sistem operasi.
Mesin mesin ByteDance sendiri juga menunjukkan logika serupa: Harga model Doubao untuk pengembang juga dibebankan per juta token, misalnya Doubao-Seed-2.0-pro ditampilkan mulai 3,2 yuan per juta token masukan, 16 yuan per juta token keluaran.
Ini menunjukkan masalah mendasar:
Produk AI tampak seperti langganan anggota, tetapi di backend dikonsumsi berdasarkan penggunaan. Namun, itu juga tidak sepenuhnya sama seperti restoran.
Lebih tepatnya adalah:
AI adalah gabungan dari "perusahaan perangkat lunak + perusahaan komputasi awan + perusahaan industri padat energi".
Jika seorang pengguna membayar 68 yuan per bulan, tetapi secara berlebihan membuat PPT, video, dan laporan panjang, biaya tersebut bisa menghabiskan sebagian besar pendapatan.
Jika seorang pengguna membayar 500 yuan per bulan, tetapi terutama digunakan untuk pekerjaan bernilai tinggi dengan konsumsi yang terkendali, itu adalah bisnis yang baik.
Jadi, langganan AI pada dasarnya melakukan satu hal:
Ubah biaya daya komputasi yang tidak terkendali menjadi struktur pendapatan yang dapat diprediksi.
Beralih dari "persaingan skala pengguna" ke "persaingan ARPU"
Sebelumnya, persaingan aplikasi AI di dalam negeri sebagian besar adalah merebut pengguna secara gratis.
Mengapa DouBao bisa tumbuh besar? Selain karena produknya unggul, tentu saja karena ByteDance memiliki lalu lintas, kemampuan produk yang kuat, dan ambang batas gratis yang rendah. DouBao adalah aplikasi chat AI paling banyak digunakan di Tiongkok; data QuestMobile menunjukkan pengguna aktif mingguannya sekitar 155 juta, sementara DeepSeek sekitar 81,6 juta; sementara itu, Alibaba juga mendorong pertumbuhan pengguna Qwen melalui subsidi besar-besaran.
Namun, mode gratis memiliki satu masalah:
Semakin besar skala pengguna, semakin nyata tekanan biaya.
Terutama produk AI Tiongkok saat ini masih mengalami perang harga. DeepSeek menurunkan perkiraan biaya model secara signifikan, sementara Alibaba, ByteDance, Tencent, dan Baidu tidak ingin kehilangan akses masuk. Akibatnya, AI konsumen mudah terjebak dalam situasi yang memalukan:
Pengguna merasa AI seharusnya gratis; platform tahu AI tidak mungkin gratis tanpa batas; investor ingin melihat pertumbuhan; perusahaan internal ingin melihat siklus bisnis yang tertutup.
DouBao meluncurkan versi berbayar, yang berarti ia ingin menguji sebuah pertanyaan:
Apakah pengguna Tiongkok bersedia membayar untuk alur kerja AI?
Bukan membayar untuk "obrolan", tetapi membayar untuk "menghemat waktu saya, membuat PPT, menulis laporan, melakukan penelitian, memproses data, menghasilkan video".
Perbedaan ini sangat penting.
Pengguna sulit membayar 500 yuan per bulan untuk "kamu menemani saya ngobrol".
Namun, jika itu benar-benar dapat membantu seorang profesional konten, penjual, guru, siswa, operator, atau konsultan menghemat 1—2 jam setiap hari, maka tingkat penerimaan terhadap harga 68 yuan, 200 yuan, atau 500 yuan akan sangat berbeda.
Ini juga menunjukkan: versi gratis AI akan tetap tersedia, tetapi versi gratis akan semakin "terbatas"
Masa depan, aplikasi asli AI domestik kemungkinan besar tidak akan menerapkan biaya seragam, melainkan struktur empat lapisan:
Lapisan pertama: Versi gratis
Untuk akuisisi pelanggan, membangun kebiasaan penggunaan, dan mempertahankan pangsa pasar. Obrolan biasa, pertanyaan dasar, dan pencarian ringan akan tetap gratis.
Lapisan Kedua: Anggota Harga Rendah
Untuk pengguna frekuensi tinggi umum, seperti limit lebih tinggi, kecepatan lebih cepat, antrian lebih sedikit, dan model yang lebih baik.
Tingkat Ketiga: Versi Profesional
Menjual PPT, analisis data, penelitian mendalam, pemrosesan dokumen, kode, dan konteks panjang untuk kreator konten, pengguna profesional, siswa, programmer, dan peneliti.
Lapisan keempat: Layanan Perusahaan/API/Agent
Dibayar berdasarkan penggunaan, atau paket + biaya berlebih. Di sinilah bagian sebenarnya yang dapat menjalankan model bisnis.
Tiga tingkatan 68, 200, dan 500 yang kini disebarkan oleh DouBao pada dasarnya adalah uji coba terhadap lapisan ini.
Versi gratis menyelesaikan "skala pengguna"; versi standar menyelesaikan "pembayaran ringan"; versi diperkuat dan versi profesional menyelesaikan "pemulihan biaya pengguna berat".
ChatGPT, Claude, Gemini, Kimi, Tongyi, Zhipu, DouBao, semuanya telah atau akan bergerak menuju struktur serupa. Perbedaannya hanya terletak pada: versi gratis siapa yang terkuat, manfaat berbayar siapa yang paling terasa, dan siapa yang mengendalikan biaya paling baik.
Mengapa langganan AI lebih sulit daripada SaaS tradisional?
Setiap tambahan pengguna, percakapan, ringkasan panjang, atau tugas yang dijalankan oleh Agent, akan meningkatkan konsumsi GPU inference, listrik, memori GPU, bandwidth, penyimpanan, dan operasi teknis.
Jadi masalah paling inti bagi perusahaan aplikasi AI bukanlah:
Apakah ada pengguna?
sebaliknya:
Semakin banyak pengguna, semakin untung, atau semakin boros?
Ini sangat berbeda dengan SaaS tradisional. Dalam SaaS tradisional, setelah sistem dibangun, margin kotor dari pelanggan baru biasanya tinggi; namun, jika pengguna sangat gemar menggunakan produk AI, justru dapat menimbulkan biaya inferensi yang lebih tinggi. Kekhawatiran pasar terhadap pengembalian investasi AI dari Big Tech pada dasarnya juga merupakan masalah ini. Alphabet, Microsoft, Meta, Amazon, dan perusahaan besar lainnya mengalokasikan dana besar untuk AI tahun ini, sehingga investor mulai lebih memperhatikan kapan pengeluaran AI ini akan menghasilkan pengembalian yang cukup.
Namun, langganan AI tentu tidak bisa disamakan secara sederhana dengan restoran, karena restoran sulit menurunkan biaya "sepiring mie" sebesar 80% per tahun.
Tetapi AI bisa.
Karena biaya inferensi model terus ditekan oleh beberapa hal:
Pertama, chip menjadi lebih kuat. Kedua, model menjadi lebih kecil, distilasi, kuantisasi, dan routing MoE menjadi lebih halus. Ketiga, caching, batching, dan pemanfaatan ulang konteks akan mengurangi biaya perhitungan berulang. Keempat, banyak tugas tidak memerlukan model terkuat dan dapat diselesaikan dengan model kecil. Kelima, perusahaan akan beralih dari "mengumpulkan token secara sembarangan" menjadi "mengonsumsi lebih sedikit token per hasil bisnis".
Jadi, biaya marjinal AI bukan 0, tetapi ia juga bukan biaya bahan tetap.
Ini lebih seperti awal komputasi awan: awalnya mahal, tetapi skala, optimasi perangkat keras dan perangkat lunak akan terus menekan biaya.
Ini juga alasan mengapa "cache input" dalam penetapan harga OpenAI jauh lebih murah daripada input biasa. Keberadaan mekanisme cache menunjukkan bahwa penyedia AI berusaha mengubah perhitungan berulang menjadi bagian yang lebih murah dan mirip perangkat lunak.
Hal ini menyebabkan perusahaan AI perlu menjawab tiga pertanyaan sekaligus:
Pertama, berapa banyak yang bersedia dibayar pengguna? Ini adalah sisi pendapatan.
Kedua, berapa banyak token yang akan dikonsumsi pengguna setiap bulan? Ini adalah sisi biaya.
Ketiga, apakah kecepatan penurunan biaya model bisa lebih cepat daripada pertumbuhan penggunaan? Ini terkait margin keuntungan.
Jika jawabannya adalah:
Pengguna bersedia membayar 200 yuan, tetapi biaya bulanan sebesar 150 yuan, sehingga bisnis ini biasa saja.
Jika jawabannya adalah: Pengguna bersedia membayar 200 yuan; biayanya hanya 20 yuan, dan dapat turun menjadi 10 yuan seiring optimasi model.
Aplikasi AI kembali mendekati bisnis perangkat lunak yang baik.
Jadi, indikator inti sebenarnya dari model bisnis AI bukanlah DAU, bukan pula jumlah unduhan, melainkan:
Pendapatan per pengguna berbayar / Biaya inferensi per pengguna berbayar.
Artinya model ekonomi unit versi AI.
Ini akan berdampak sebaliknya pada pasar AI
Terkait dengan pasar saham, hal ini sebenarnya sangat penting.
Sekarang pasar memperdagangkan AI, tahap pertama melihat:
Apakah permintaan daya komputasi akan meledak?
Jadi, NVIDIA, TSMC, Broadcom, penyimpanan, peralatan listrik, dan pusat data naik.
Tahap kedua pasar akan bertanya:
Apakah aplikasi AI memiliki pengguna?
Jadi, jumlah pengguna ChatGPT, DouBao, Kimi, Qwen, Copilot, dan Gemini akan menjadi perhatian.
Tahap ketiga, yang merupakan tahap paling krusial berikutnya, pasar akan bertanya:
Apakah pengguna ini bisa membayar? Setelah membayar, apakah mereka bisa mendapatkan keuntungan?
Doubao dikabarkan akan dikenakan biaya, yang sebenarnya merupakan awal tahap ketiga.
Jika di masa depan melihat sinyal-sinyal ini, pasar AI akan lebih sehat:
Tingkat konversi berbayar cukup baik; pengguna tidak mengalami penurunan besar akibat biaya; ada yang membeli versi profesional harga tinggi; klien perusahaan mulai melakukan pembelian skala besar; biaya inferensi terus menurun; fitur AI memberikan kemampuan peningkatan harga yang nyata.
Tetapi jika melihat sinyal sebaliknya:
Pengguna hanya bersedia menggunakan versi gratis; versi berbayar memiliki reputasi buruk; platform terus menurunkan harga dan melakukan promosi; pengguna frekuensi tinggi membuat biaya melonjak; pendapatan aplikasi AI tumbuh cepat tetapi marjin kotor buruk;
Maka pasar akan mulai meragukan:
Apakah lapisan aplikasi AI merupakan bisnis yang baik?
Ini akan lebih lanjut ditransmisikan ke hulu. Karena jika lapisan aplikasi tidak menghasilkan uang, penyedia cloud dan pabrikan model akan ditanya: Mengapa Anda terus meningkatkan capex?
Berbagai perusahaan AI memiliki model ekonomi yang sama sekali berbeda
Masih ada masalah lain, yaitu tidak bisa menggabungkan semua perusahaan AI menjadi satu.
1. NVIDIA, TSMC, penyimpanan, peralatan listrik
Ini adalah penjual sekop. Semakin banyak orang menggunakan AI, semakin banyak keuntungan yang mereka dapatkan.
Mereka tidak secara langsung menanggung biaya token pengguna akhir, melainkan menikmati pengeluaran modal yang dihasilkan dari ekspansi inferensi dan pelatihan AI.
2. Penyedia cloud: Microsoft, Google, Amazon
They are in between.
Di satu sisi, AI membawa pertumbuhan pendapatan cloud; di sisi lain, mereka sendiri harus menanggung biaya capex, penyusutan, listrik, dan pusat data yang besar. Reuters Breakingviews menyebutkan, pengeluaran AI oleh perusahaan besar sedang meluas secara signifikan, tetapi pasar semakin khawatir apakah investasi ini akan menghasilkan pengembalian yang jelas.
Jadi masalah penyedia cloud adalah:
Pertumbuhan pendapatan cloud AI, bisakah menutupi biaya pusat data, GPU, penyusutan, dan listrik?
3. Perusahaan aplikasi AI: Copilot, ChatGPT, berbagai Agent
Semakin banyak pengguna menggunakan, semakin tinggi biayanya. Jika berlangganan tetap, misalnya dikenakan biaya tetap per bulan, tetapi pengguna menggunakan secara berlebihan, maka marjin kotor akan terkikis.
Jadi, keadaan paling ideal untuk aplikasi AI bukanlah "pengguna mengobrol tanpa batas", melainkan:
Pengguna bersedia membayar lebih tinggi, tetapi konsumsi token sebenarnya dapat dikendalikan.
Misalnya, perusahaan bersedia membayar 30, 50, atau 100 dolar AS per bulan untuk asisten penjualan AI, asisten kode AI, atau asisten hukum AI, tetapi biaya inferensi di baliknya hanya beberapa dolar, itu adalah bisnis yang menguntungkan.
4. Perusahaan perangkat lunak tradisional ditambah AI
Misalnya perusahaan seperti Microsoft, Adobe, dan Salesforce, jika dapat menambahkan fitur AI ke perangkat lunak mereka yang sudah ada, meningkatkan ARPU, tanpa membuat biaya menjadi tak terkendali, mereka dapat menjadikan AI sebagai alat untuk menaikkan harga.
AI bukanlah startup ulang bagi mereka, melainkan saluran distribusi perangkat lunak yang sudah ada ditambah paket tambahan AI.
Jadi, perbedaan valuasi terbesar AI ada di sini
Tidak perlu diperdebatkan apakah AI berguna atau memiliki masa depan, AI jelas adalah masa depan.
Masalah yang lebih dalam adalah: Apakah AI sebenarnya perangkat lunak dengan marjin tinggi, atau industri padat modal?
Para optimis percaya:
Biaya AI akan turun cepat, aplikasi akan meledak, ARPU akan naik, dan pada akhirnya tetap bisnis perangkat lunak dengan marjin tinggi.
Pihak pesimis berpendapat:
AI akan menjadi perlombaan senjata, semua orang harus membeli GPU, membangun pusat data, dan membayar listrik, tetapi pengguna mungkin tidak bersedia membayar harga yang cukup tinggi untuk setiap token, sehingga keuntungan akan termakan oleh biaya infrastruktur.
Saya merasa kebenarannya ada di tengah:
Model dasar dan infrastruktur cloud akan semakin menyerupai industri bermodal berat; hanya aplikasi AI yang memiliki distribusi, skenario, dan daya tawar harga yang memiliki peluang untuk kembali menjadi bisnis perangkat lunak.
Ini juga menjelaskan mengapa pasar AI bisa berbeda-beda
Pada tahap pertama, pasar membeli:
Siapa pun yang berhubungan dengan AI, harganya naik.
Pada tahap kedua, pasar akan bertanya:
Siapa yang bisa mengubah AI menjadi pendapatan?
Tahap ketiga, pasar akan terus bertanya:
Siapa yang bisa mengubah pendapatan AI menjadi laba dan arus kas bebas?
AI tidak seperti perangkat lunak tradisional yang "menghasilkan satu unit tambahan hampir tanpa biaya", karena setiap layanannya memerlukan daya komputasi, sehingga secara alami memiliki sifat biaya seperti restoran, komputasi awan, dan perusahaan industri.
Namun AI tidak selinear restoran, karena optimasi model, cache, kemajuan chip, batch processing, dan routing model kecil akan terus menurunkan biaya per unit.
Jadi yang benar-benar perlu dilihat dari model bisnis AI bukanlah "apakah ada pendapatan", melainkan:
Berapa banyak biaya GPU, listrik, dan token yang dibutuhkan di balik setiap dolar pendapatan AI.
Ini akan menjadi pertanyaan inti yang terus diajukan kepada perusahaan AI oleh pasar ke depan.
Berapa banyak margin keuntungan masa depan AI.
