DeepSeek Secara Permanen Menurunkan Harga API di Tengah Meningkatnya Biaya AI

Tulis oleh Saluran Luo Chao

DeepSeek mengumumkan akan mempermanenkan diskon 75% untuk API V4-Pro, berlaku secara global serentak.

Sistem harga akhir: Harga masukan dasar turun dari $1,74 per juta Token menjadi $0,435 per juta Token, dan harga keluar turun dari $3,48 per juta Token menjadi $0,87 per juta Token. Untuk cache hit masukan pada seluruh lini produk API, DeepSeek memberikan diskon lebih besar: $0,003625 per juta Token, seluruhnya mengikuti model harga lantai ala Pinduoduo.

Liang Wenfeng

Media sosial, termasuk X, langsung dipenuhi seruan: Liang Wenheng adalah Bodhisattva siber, Shen Feng, dan Liang Sheng di dunia AI. Emosi ini bukan berasal dari harga murah itu sendiri—DeepSeek selalu disebut sebagai "Pinduoduo AI", gratis untuk pengguna akhir, murah untuk bisnis, dan seluruh dunia sudah terbiasa dengan harganya yang murah, tetapi tantangan dalam penurunan harga kali ini terletak pada fakta bahwa seluruh dunia AI sedang mengalami kenaikan harga.

Laporan menyebut bahwa Liang Wenhong akan menginvestasikan hingga 20 miliar yuan RMB secara pribadi dalam putaran pendanaan Seri A rekord yang sedang berlangsung oleh DeepSeek, menyumbang 40% dari total pendanaan. Sebagian besar perusahaan saat memperoleh pendanaan pertama kali berfokus pada penguatan arus kas untuk meningkatkan kinerja keuangan, tetapi Liang Wenhong tidak berniat menarik investor dengan janji-janji komersial; sebaliknya, ia tetap berkomitmen pada open-source dan pencapaian AGI, dan penurunan harga ini benar-benar dilaksanakan. Terakhir kali seseorang dengan berani menyatakan tidak ingin menghasilkan uang adalah Pinduoduo, di mana co-founder-nya pada panggilan investor tahun 2024 secara jelas menyatakan: “Mulai Q3, laba kami akan secara bertahap menurun dan tidak akan pulih dalam jangka pendek. Dalam jangka panjang, penurunan profitabilitas tidak dapat dihindari.” Sahamnya anjlok.

Sam Altman terus-menerus berbicara tentang demokratisasi AI, tetapi perusahaan OpenAI sedang bergerak cepat menuju lawan dari namanya: CloseAI. Namun, Liang Wenheng sedang secara aktif memastikan bahwa setiap orang dan setiap perusahaan dapat mengakses AI secara sebesar-besarnya. Apakah Liang Wenheng benar-benar seorang bodhisattva? Tidak. Ia adalah seorang pengusaha, dan open source yang inklusif hanyalah pilihan model bisnis—yang saat ini sangat berharga dan akan semakin langka di masa depan.

Karena: AI semakin mahal.

Minggu ini, Microsoft membatalkan lisensi Claude Code internal karena biaya berbasis token terlalu tinggi untuk ditanggung. Microsoft sebelumnya telah memberikan dukungan besar kepada OpenAI dan menyediakan layanan cloud Azure untuk A, memiliki sumber daya cloud yang menjadi idaman semua perusahaan, namun biaya token tetap membuatnya merasa sakit hati. Tidak hanya itu, CTO Uber melaporkan situasi yang memalukan kepada manajemen pada April tahun ini: anggaran AI yang disiapkan untuk seluruh tahun 2026 habis dalam empat bulan, di mana 95% insinyur menggunakan alat pemrograman AI setiap bulan, dan 70% kode yang dikirimkan dihasilkan oleh AI, dengan kata-kata mereka: “Saya kembali ke papan gambar karena anggaran yang saya perkirakan sudah habis.”

Anggaran token perusahaan besar terbakar jauh lebih cepat dari yang diperkirakan, memang ada alasan karyawan perusahaan yang memperlakukan token seolah-olah bukan barang berharga, tetapi inti masalah anggaran token yang ketat adalah bahwa AI semakin mahal. Harga perangkat lunak AI di Amerika Serikat naik 20% hingga 37% dalam satu tahun terakhir. Tiga raksasa AI—Anthropic, OpenAI, dan Google—secara diam-diam telah menaikkan harga aktual untuk output AI yang sama dalam enam bulan terakhir.

Liang Wenfeng

(Sumber gambar: X)

Dulu suara yang populer adalah “Semakin luas penerapan AI, semakin tinggi tingkat industrialisasi, semakin rendah biaya, semakin senang perusahaan”, ternyata terlalu naif.

Dan tren ini tidak akan berbalik. Harga ditentukan oleh permintaan dan penawaran, bukan biaya, tetapi permintaan dan penawaran AI telah berbalik total sejak tahun 2026. Dulu, perusahaan besar berusaha meyakinkan orang untuk menggunakan AI, harus mendidik pasar dan mempromosikan teknologi; AI selalu mendapat subsidi. Berapa banyak teh susu Qwen yang sudah kamu minum? Sekarang bagaimana? Semakin banyak orang yang secara aktif menggunakannya—“setelah mencicipi pertama kali, tidak bisa berhenti.” Pemrograman AI, dokumen AI, AIGC, bahkan pencarian AI semakin meluas. Era subsidi AI telah berakhir sepenuhnya.

Semakin banyak orang yang menggunakan, semakin besar permintaan, semakin ketat sumber daya token, sehingga kekurangan daya komputasi meluas dari GPU ke CPU, penyimpanan, bahkan bandwidth. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk, serta perusahaan domestik seperti江波龙 dan Liangchang ikut serta bersama NVIDIA menikmati keuntungan. Dari mana datangnya pendapatan yang meningkat dua kali lipat pada tahun 2026 bagi raksasa semikonduktor? Bukankah sama sekali bukan dari investasi segitiga OpenAI-Oracle-Microsoft? Ini baru permulaan dari penderitaan perusahaan! Sementara produk AI seperti ChatGPT, Claude, Gemini, dan DouBao menekankan “hierarki ketat” antara gratis dan berbayar, pengguna pribadi akan semakin bingung.

Ini seperti layanan taksi online: di saat-saat sibuk, Anda bisa naik mobil mewah gratis ke kantor dan pulang, dengan modal yang membayar. Setelah kebiasaan pengguna terbentuk, subsidi dihentikan, harga kembali ke level normal—yang harus naik kereta bawah tanah tetap harus naik kereta bawah tanah. AI juga sama. Jadi, dalam konteks semua token industri besar naik, DeepSeek tetap memotong harga lebih rendah, tindakan ini bukan lagi sekadar keberanian pribadi "Bodhisattva siber," tetapi menunjukkan kekuatan penetapan harga terbalik: Saya bisa sangat murah, tetap berjalan normal, dan kualitas tetap stabil.

Jika Liang Wenheng bersedia, DeepSeek sama sekali tidak perlu semurah ini. Maka orang-orang mulai khawatir: Apakah DeepSeek akan menjadi Linux di era AI? Berdampak besar, tetapi sulit menghasilkan keuntungan besar. Kontribusi Linux terhadap industri TI jauh lebih besar daripada Windows atau Android (Android sendiri berbasis kernel Linux), namun ia bersifat open source dan tidak melahirkan raksasa komersial seperti Microsoft atau Google. Saat ini, pengaruh DeepSeek sangat besar, tetapi kemampuan komersialnya jauh kalah dibanding tiga raksasa Silicon Valley, bahkan tidak mampu bersaing dengan tiga perusahaan domestik: Kimi, MiniMax, dan Zhipu. Urutan pendapatan empat unicorn tahun 2025: Zhipu (pendapatan 724 juta yuan pada 2025) > MiniMax (pendapatan sekitar 560 juta yuan pada 2025) > Moonshot (sekitar 200 juta yuan) > DeepSeek (tidak diketahui, tetapi lebih rendah).

Liang Wenfeng menghasilkan uang melalui kuantifikasi AI, mampu menginvestasikan 20 miliar pribadi ke DeepSeek, tetapi kisah "mengandalkan cinta untuk menghasilkan listrik" tidak bisa bertahan lama.

Dalam mode open source, pihak lain juga dapat melakukan distilasi, deployment, dan pelatihan ulang, sehingga dinding pertahanan teknologi DeepSeek akan semakin menipis. Oleh karena itu, Anda selalu melihat berita seperti ini: “GLM-5.1 dari Zhipu AI membuka sumbernya dan memecahkan rekor global di benchmark SWE-bench Pro; MiMo-V2.5-Pro dari Xiaomi menduduki peringkat pertama global untuk model besar open source…” Laporan bersama Massachusetts Institute of Technology dan Hugging Face menunjukkan bahwa dalam setahun terakhir, model open source yang dikembangkan di Tiongkok menyumbang 17,1% dari total unduhan global, melewati 15,8% dari Amerika Serikat, dan menjadi yang teratas di dunia.

Tidak heran semakin banyak suara di Silicon Valley mengatakan: Amerika harus memiliki DeepSeek versi sendiri, tidak boleh diam saja menyaksikan industri AI lagi mengulang kisah Shein, Temu, atau TikTok. "Jika Amerika tidak melahirkan juara open-source, dunia akan dikuasai oleh negara mana pun yang mampu menghasilkan model dan perangkat lunak open-source terkuat, paling stabil, termurah, dapat disesuaikan, dapat diskalakan, dan cocok untuk kebutuhan pribadi maupun bisnis." Topik yang menyangkut persaingan antar negara besar sering terdengar sangat besar, tetapi persaingan di baliknya sangat nyata.

Di balik bangkitnya DeepSeek, memang sudah ada narasi substitusi mandiri. Dukungan V4 terhadap Ascend membuat semangat, di bawah dorongan daya komputasi dalam negeri, daya tarik harga yang ditunjukkan DeepSeek saat ini baru merupakan hidangan pembuka. Dalam laporan teknis, DeepSeek menyatakan bahwa setelah node super Ascend 950 mulai diproduksi massal pada paruh kedua tahun ini, harga V4-Pro akan turun signifikan lagi, hari-hari yang lebih baik masih menanti.

Masih ada keunggulan dalam sumber daya AI tingkat lanjut; tenaga ahli AI harganya mahal hingga level "mewah", tetapi di Tiongkok relatif lebih murah. Gaji Rp10 juta per tahun yang ditawarkan Lei Jun untuk merekrut Luo Fuli dari DeepSeek menjadi berita, sementara pada periode yang sama, Zuckerberg harus mengeluarkan US$1 miliar untuk merekrut orang-orang, termasuk melalui akuisisi berbasis tenaga kerja (Acqui-hire). Namun, produk yang dihasilkan oleh orang-orang dengan gaji US$1 miliar dan mereka yang bergaji Rp10 juta per tahun jelas tidak memiliki perbedaan sebesar 700 kali lipat. Selisih harga dalam tenaga ahli AI sebenarnya akan berubah menjadi perbedaan sistemik dalam sistem produksi Token.

Daya saing yang lebih besar adalah sistem energi, yang merupakan lapisan pertama dari kue lima lapis AI Jensen Huang.

Ujung dari AI adalah daya komputasi, ujung dari daya komputasi adalah listrik. Pada April 2026, DeepSeek merekrut insinyur operasi dan pemeliharaan tingkat tinggi serta manajer pengiriman tingkat tinggi di pusat data Wulanchabu, Inner Mongolia, yang menunjukkan bahwa mereka akan membangun pabrik Token di barat, mendorong keunggulan biaya dari lapisan perangkat lunak ke lapisan fisik. Terakhir kali saya menulis tentang Wulanchabu dalam artikel saya ketika Kuaishou membangun pusat data di sana: dekat dengan pembangkit listrik, iklimnya cocok untuk pendinginan. Selain itu, harga listrik hijau di wilayah barat Tiongkok sekitar 0,2-0,3 yuan per kWh, hanya 1/5 hingga 1/4 dari harga di Eropa dan Amerika.

Bukan hanya listrik hijau barat yang kompetitif. Data Badan Energi Internasional tahun 2025 menunjukkan bahwa kapasitas terpasang total pembangkit listrik Tiongkok telah melebihi 2300 GW, menyumbang sekitar 22% dari global, peringkat pertama di dunia; Amerika Serikat sekitar 1300 GW. Yang lebih penting lagi, Tiongkok memiliki struktur listrik paling lengkap di dunia: pembangkit listrik tenaga batu bara, hidro, angin, nuklir, dan fotovoltaik semuanya tersedia. Data menunjukkan bahwa tarif listrik industri Tiongkok secara konsisten bertahan di kisaran 0,06 hingga 0,08 dolar/kWh, sementara tarif listrik industri di California, Amerika Serikat, sudah mendekati 0,18 dolar/kWh, dan di beberapa wilayah Jerman bahkan melebihi 0,25 dolar/kWh, yang berarti bahwa untuk melatih kluster sepuluh ribu GPU yang sama, Tiongkok secara alami lebih murah puluhan persen dibanding Eropa dan Amerika.

Dalam biaya operasional model AI besar, biaya listrik menyumbang hingga 60%-70% dari total biaya operasional. Tidak hanya model yang membutuhkan listrik, tetapi juga pendinginan yang menjadi komponen besar. Bahkan "raksasa infrastruktur" telah membangun pusat data langsung di bawah laut, dengan energi angin laut yang diinput secara lokal dan sirkulasi air laut yang menyediakan pendinginan gratis. Selain itu, ada inisiatif besar seperti "Pengiriman Listrik dari Timur ke Barat" dan "Penghitungan Data dari Timur ke Barat", yang menunjukkan kemampuan pengaturan daya dan komputasi antar wilayah yang sangat kuat. Provinsi Guizhou, Inner Mongolia, dan Ningxia sejak awal merupakan simpul utama dalam "Penghitungan Data dari Timur ke Barat", sehingga jalur pemindahan pusat komputasi AI ke wilayah barat sudah disiapkan sejak lama.

Menggunakan AI Tiongkok pada dasarnya berarti menggunakan AI yang dilatih dengan sistem energi yang lebih kompetitif—AI yang lebih ekonomis dan lebih inklusif. Ini adalah salah satu alasan mengapa pendapatan luar negeri Kimi, Minimax, dan lainnya melonjak setelah Tahun Baru Imlek, bukan hanya karena algoritmanya lebih kuat, tetapi karena mereka menggunakan “bonus tarif listrik”.

NVIDIA mampu menentukan harga kekuatan komputasi kelas atas, tetapi DeepSeek dan sejenisnya menguasai penetapan harga Token. Anda mungkin mengatakan bahwa AI murah tidak berkualitas baik. Memang benar AI sebanding dengan harganya; DeepSeek V4 hanya mempersempit kesenjangan antara open-source dan closed-source ke tingkat terendah dalam sejarah, pihak resmi secara terbuka mengakui adanya kesenjangan objektif dengan model unggulan seperti GPT, dan model ini bahkan belum mendukung multimodal—mampu mengenali gambar, tetapi tidak dapat menghasilkannya.

Namun, ini tidak menghentikan komunitas beralih ke DeepSeek. Alasannya: sebagian besar skenario bisnis nyata tidak memerlukan pemanggilan model terkuat di dunia setiap saat. Konsultasi, layanan pelanggan, ringkasan, terjemahan, pelengkapan kode, basis pengetahuan perusahaan, dan otomatisasi proses—semua ini tidak membutuhkan kecerdasan tertinggi, melainkan “cukup bisa dipakai + cukup murah + cukup stabil”. Ketika biaya inferensi DeepSeek V4 hanya sekitar 1% (Flash) hingga 11% (Pro) dari GPT-5.5, sebuah perusahaan dapat memanggil token puluhan kali lebih banyak dengan anggaran yang sama, mencoba lebih banyak rantai prompt, dan mengiterasi lebih banyak alur kerja agent—akhirnya, hasil yang dihasilkan justru berpeluang lebih baik, mengingat AI sendiri adalah permainan “probabilitas”; selama cukup murah, mengapa tidak menggunakan versi yang cukup baik untuk mendapatkan hasil?

Jadi, semakin mahal AI, semakin berharga keunggulan DeepSeek, semakin berharga perusahaan DeepSeek, dan Liang Wenheng beserta investorinya memahami hal ini lebih jelas daripada siapa pun.