Kenaikan kos token AI mendorong syarikat untuk fokus pada kawalan kos

Laman web berita kripto melaporkan:

Selepas perusahaan secara besar-besaran mengadopsi alat AI, masalah baru mulai muncul secara terkumpul: bukan sama ada model cukup kuat, tetapi bil meningkat terlalu cepat. Banyak syarikat teknologi dan internet mendapati bahawa walaupun harga setiap Token turun, jumlah penggunaan keseluruhan terus meningkat pantas akibat keluasan penggunaan alat AI untuk pengaturcaraan, pembantu automatik, dan agen.

Anggaran banyak syarikat telah dikeluarkan lebih awal

TechCrunch melaporkan bahawa beberapa syarikat telah menghabiskan anggaran AI mereka untuk tahun 2026 sejak awal. Uber telah menggunakan keseluruhan anggaran AI untuk pengkodean pada bulan April; Microsoft menarik balik kebenaran penggunaan Claude Code untuk beberapa pembangun selepas dibuka selama beberapa bulan; seorang pekerja Priceline menyatakan bahawa tawaran perpanjangan biasa untuk Cursor meningkat sebanyak 4 hingga 5 kali ganda berbanding sebelumnya.

Perubahan ini berkaitan dengan pelancaran model yang lebih canggih dalam beberapa bulan terakhir. Anthropic, OpenAI, dan Google secara berturut-turut melancarkan model baru yang lebih sesuai untuk skenario agen selepas November tahun lalu, mendorong penggunaan panggilan terus meningkat. Sebuah syarikat bahkan mengalami bil Claude sebanyak 500 juta dolar AS akibat tidak menetapkan had penggunaan oleh pekerja.

Peningkatan produktiviti tidak semestinya menutupi kos

Alexander Embr, ketua urusan perniagaan OpenAI, menyatakan bahawa enam bulan yang lalu, pelanggan lebih prihatin sama ada kemampuan model mencukupi, tetapi kini fokus perbincangan telah berpindah kepada kebolehan melihat perbelanjaan, kemampuan audit, kawalan Token, dan kecekapan model. Masalah pembelian AI oleh perusahaan sedang berubah dari "boleh buat apa" kepada "berapa banyak yang dibelanjakan dan adakah ia bernilai".

Pengembalian atas alat pengkodean AI juga sedang dikira semula oleh industri. Survei Faros AI terhadap 20,000 pembangun pada bulan Mac menunjukkan bahawa output pembangunan meningkat, tetapi ralat dan kerja semula juga meningkat. Kajian daripada platform pengurusan kejuruteraan Jellyfish pula menunjukkan bahawa jurutera yang menggunakan AI secara intensif mempunyai produktiviti kira-kira dua kali ganda berbanding pengguna rendah, tetapi penggunaan Token 10 kali lebih tinggi.

Pengguna AI berat mempunyai produktiviti kira-kira dua kali ganda berbanding pengguna rendah
Token yang sepadan menghabiskan kira-kira 10 kali lebih banyak
Penggunaan seorang pembangun tunggal meningkat sebanyak 18.6 kali dalam 9 bulan

Alat pengurusan kos semakin pesat terbentuk

Seiring dengan meluasnya masalah bil, pasaran alat pengurusan kos AI juga mula memanas. Yayasan Linux mengumumkan minggu ini pembentukan Tokenomics Foundation, dengan harapan mencipta bahasa dan piawaian pengurusan yang seragam untuk perbelanjaan AI Token, seperti FinOps dalam bidang kos awan.

Organisasi ini merancang untuk mengembangkan standard terbuka dan metrik seragam untuk penggunaan dan penagihan Token, serta metrik baru berkaitan kecekapan kos, seperti “kos pintar setiap unit” atau “bilangan Token setiap watt”. Pelancaran rasmi dijangka pada bulan Julai, dengan lebih banyak ahli akan diumumkan di perjumpaan FinOps X minggu depan.

Sementara itu, syarikat mula-mula dan pengeluar matang sedang mempercepatkan pelaburan. Syarikat-syarikat seperti Pay-i dan Paid menekankan pelacakan, pengukuran, dan pengoptimuman kos AI; Jellyfish, Waydev, dan Faros AI menyediakan perkhidmatan pemantauan agen AI; Ramp, Datadog, dan New Relic juga menambah fungsi pengurusan perbelanjaan AI, keterlihatan pada tahap Token, dan pemantauan GPU.

Pemulaan model menjadi arah pengurangan kos

Sebahagian pelabur dan pengurusan perniagaan menilai, kemampuan semacam ini akan semakin banyak muncul di lapisan aplikasi atau lapisan penghalaan model. Sebagai contoh, syarikat rintisan AI perniagaan Factory baru-baru ini melancarkan penghala model yang secara automatik memilih model yang lebih sesuai mengikut tugas untuk mengurangkan kos panggilan. Beberapa bil perniagaan juga telah mengamalkan pendekatan serupa, di mana walaupun memanggil model高端, sistem akan mengalihkan sebahagian permintaan kepada model yang lebih murah untuk diproses.

Maklumat tambahan: Goldman Sachs meramalkan bahawa penggunaan token global akan meningkat 24 kali ganda pada tahun 2030. Bagi perusahaan yang telah memasuki peringkat pengeluaran tinggi, bagaimana mengawal kos sambil memperluaskan penggunaan AI telah menjadi masalah praktikal dalam peringkat penghantaran seterusnya.