Meningkatnya Biaya Token AI Mendorong Perusahaan untuk Fokus pada Pengendalian Biaya

Berita CoinWorld:

Setelah perusahaan secara besar-besaran mengadopsi alat AI, masalah baru mulai muncul secara terkonsentrasi: bukan karena modelnya tidak cukup kuat, tetapi karena tagihan meningkat terlalu cepat. Beberapa perusahaan teknologi dan internet menemukan bahwa meskipun harga per Token turun, total konsumsi terus meningkat pesat akibat meluasnya penggunaan alat AI untuk pemrograman, asisten otomatis, dan agen cerdas.

Beberapa perusahaan telah menghabiskan anggaran mereka lebih awal

TechCrunch melaporkan bahwa beberapa perusahaan telah menghabiskan anggaran AI mereka jauh lebih awal pada tahun 2026. Uber telah menghabiskan seluruh anggaran AI coding tahunan hingga bulan April; Microsoft mencabut izin penggunaan Claude Code untuk sebagian pengembang setelah terbuka selama beberapa bulan; seorang karyawan Priceline menyatakan bahwa penawaran perpanjangan rutin untuk Cursor meningkat 4 hingga 5 kali lipat dibanding sebelumnya.

Perubahan ini terkait dengan peluncuran model yang lebih kuat dalam beberapa bulan terakhir. Anthropic, OpenAI, dan Google secara bertahap meluncurkan model baru yang lebih cocok untuk skenario agen setelah November tahun lalu, mendorong volume pemanggilan terus meningkat. Sebuah perusahaan bahkan menghadapi tagihan Claude sebesar 5 miliar dolar AS karena tidak menetapkan batas penggunaan oleh karyawan.

Peningkatan produktivitas tidak selalu menutupi biaya

Alexander Embr, kepala bisnis perusahaan OpenAI, menyatakan bahwa enam bulan lalu pelanggan lebih peduli pada apakah kemampuan model cukup, sekarang fokus diskusi telah beralih ke visibilitas pengeluaran, kemampuan audit, kendali Token, dan efisiensi model. Masalah pembelian AI oleh perusahaan sedang berubah dari "dapat melakukan apa" menjadi "berapa banyak yang dihabiskan dan apakah sepadan".

Di sektor ini, perhitungan ulang terhadap return on investment dari alat coding berbasis AI juga mulai dilakukan. Survei Faros AI terhadap 20.000 pengembang pada bulan Maret menunjukkan bahwa produktivitas pengembangan meningkat, tetapi jumlah bug dan pekerjaan ulang juga meningkat. Penelitian dari platform manajemen teknik Jellyfish menunjukkan bahwa insinyur yang secara intensif menggunakan AI memiliki produktivitas sekitar dua kali lipat dibandingkan pengguna rendah, tetapi konsumsi token mereka 10 kali lebih tinggi.

Pengguna AI berat memiliki produktivitas sekitar dua kali lipat dibandingkan pengguna rendah
Token yang sesuai terpakai sekitar 10 kali lebih banyak
Penggunaan oleh satu pengembang meningkat sekitar 18,6 kali dalam 9 bulan

Alat manajemen biaya semakin cepat terbentuk

Seiring membesarnya masalah tagihan, pasar alat pengelolaan biaya AI juga mulai memanas. Linux Foundation minggu ini mengumumkan pembentukan Tokenomics Foundation, dengan harapan dapat menciptakan bahasa dan standar manajemen yang seragam untuk pengeluaran AI Token, sebagaimana FinOps di bidang pengelolaan biaya cloud.

Organisasi ini berencana untuk mengembangkan standar terbuka untuk penggunaan dan penagihan Token, metrik terpadu, serta metrik baru terkait efisiensi biaya, seperti "biaya cerdas per unit" atau "jumlah Token per watt". Peluncuran resmi dijadwalkan pada bulan Juli, dan lebih banyak anggota akan diumumkan di konferensi FinOps X minggu depan.

Sementara itu, perusahaan rintisan dan produsen mapan sedang mempercepat peluncuran. Perusahaan seperti Pay-i dan Paid menonjolkan pelacakan, pengukuran, dan optimasi biaya AI; Jellyfish, Waydev, dan Faros AI menyediakan layanan pemantauan agen AI; Ramp, Datadog, dan New Relic juga menambahkan fitur manajemen pengeluaran AI, observabilitas tingkat token, dan pemantauan GPU.

Routing model menjadi arah pengurangan biaya

Beberapa investor dan eksekutif perusahaan memperkirakan bahwa kemampuan semacam ini akan semakin sering muncul di lapisan aplikasi atau lapisan routing model. Misalnya, perusahaan rintisan AI Factory minggu ini meluncurkan model router yang secara otomatis memilih model yang lebih sesuai berdasarkan tugas untuk mengurangi biaya pemanggilan. Beberapa tagihan perusahaan juga telah menerapkan pendekatan serupa, di mana meskipun memanggil model高端, sistem tetap akan mendistribusikan sebagian permintaan ke model yang lebih murah untuk diproses.

Informasi tambahan: Goldman Sachs memperkirakan bahwa penggunaan token global akan meningkat 24 kali lipat hingga tahun 2030. Bagi perusahaan yang telah memasuki tahap investasi tinggi, bagaimana mengendalikan biaya sambil memperluas penggunaan AI menjadi masalah nyata dalam penerapan tahap berikutnya.