Membakar bilangan USD500 juta dalam 1 bulan!
Baru-baru ini, dunia teknologi dikejutkan oleh kesilapan besar. Menurut Axios, sebuah syarikat telah menghabiskan sebanyak $500 juta di Claude dalam tempoh hanya satu bulan!
Sebabnya membuat orang tertawa sekaligus menangis: pengurusan lupa menetapkan had penggunaan semasa memberikan akses kepada staf untuk akaun Claude.

Sebenarnya, bukan hanya satu perusahaan sahaja yang mengalami kegagalan penagihan AI.
Pada bulan April tahun ini, seorang pengguna Google Cloud menerima bilangan sebanyak $18,000 dalam semalam kerana kunci API yang tersisa dalam perkhidmatan awam disalahgunakan, padahal anggaran akaunnya hanya $7.

Nama pengguna sial ini ialah Jesse Davies, seorang penasihat AI Australia dan pendiri Agentic Labs. Dia memasang dua langkah perlindungan untuk akaun Google Cloud miliknya: amaran anggaran sebanyak 10 dolar Australia (kira-kira 7 dolar AS) dan had perbelanjaan tetap sebanyak 1,400 dolar AS.
Menurut Tom's Hardware, penyerang menemukan perkhidmatan Cloud Run yang dipublikasikan beberapa bulan lalu daripada AI Studio, menghantar lebih daripada 60,000 permintaan, dan kedua-dua langkah keselamatan gagal menghalangnya: pengiraan bil mengalami kelewatan, dan apabila sistem sedar, jumlahnya telah melonjak ke $18,000.
Pada pertengahan Mei, pendiri projek sumber terbuka OpenClaw, Peter Steinberger, memuatkan tangkapan skrin di X: 30 hari, bil API OpenAI sebanyak $1.3 juta.

Timmnya hanya terdiri daripada tiga orang, tetapi 100 agen Codex yang mereka kendalikan berjalan secara serentak: membakar 60.3 bilion token dalam 30 hari, menghasilkan 7.6 juta permintaan. Untunglah, USD1.3 juta ini bukan dikeluarkan dari saku sendiri.
Steinberger menyertai OpenAI pada Februari tahun ini, dan USD1.3 juta ini dianggap sebagai satu eksperimen dalaman:
Menguji tanpa mempertimbangkan kos token, sejauh mana pengaturcaraan AI boleh berjalan. Beliau menambah, ini adalah hasil Codex 'Fast Mode' (tarif laju), dan apabila dimatikan, ia kira-kira US$300,000.
Lebih awal, CTO Uber, Praveen Neppalli Naga, juga mengakui kepada The Information bahawa syarikat itu telah menghabiskan anggaran Claude Code tahunan pada bulan April, dan COO mereka juga secara terbuka menyatakan bahawa kos AI semakin "sukar untuk dibenarkan".
500 juta, 1.3 juta, 18 ribu, walaupun jumlahnya berbeza beberapa peringkat, semuanya menunjukkan fakta yang sama:
Di era agen, kunci yang tidak terkawal, pasukan agen yang beroperasi 24/7, akaun yang lupa menetapkan had: mana-mana satu saja boleh menyebabkan bil token anda melonjak dalam semalam.
Mengapa bil AI mengalami kegagalan?
Jawapan terutamanya tersembunyi dalam perubahan cara penagihan.
Sejak April tahun ini, cara penagihan berlangganan OpenAI beralih kepada penagihan berdasarkan penggunaan Token.
Pada 2 April, penagihan Codex berubah dari pengiraan berdasarkan pesan kepada penyesuaian berdasarkan penggunaan Token: Token masukan, cache masukan, dan keluaran dihitung secara terpisah. Pada 23 April, peraturan ini diperluaskan kepada semua plan Enterprise, Edu, Health, dan Gov: diskaun tersembunyi dalam bayaran bulanan telah ditarik balik.
GitHub juga mengikuti langkah ini, baru saja mengumumkan: Semua paket Copilot akan beralih ke model penagihan berdasarkan penggunaan mulai 1 Juni 2026. Logika permintaan tingkat lanjut lama dibatalkan dan diganti dengan kuota AI, yang akan dibayar berdasarkan konsumsi aktual Token masukan, Token keluaran, dan Token cache, sesuai dengan tarif API setiap model.

GitHub menjelaskan sebab-sebabnya:
Sekarang, pengguna menghabiskan jumlah wang yang sama untuk soalan chat pantas dan tugas pengkodean mandiri yang berjalan selama berjam-jam. GitHub telah membayar untuk pengguna yang menjalankan tugas berat, tetapi model ini tidak lagi berterusan.
Sebelum kemunculan agen AI, kos perbualan dan pelengkapan hampir sama, cukup terkendali dengan bayaran bulanan.
Selepas kemunculan agen pintar, satu tugas boleh berjalan berjam-jam secara berterusan dan mengubah keseluruhan kod sumber. Perbezaan kos antara pengguna berat dan pengguna ringan boleh mencapai beberapa peringkat. Sistem bayaran bulanan runtuh sepenuhnya di hadapan perbezaan ini.
Setelah berita itu dikeluarkan, ramai berpesta di Reddit dan X.
Seorang pembangun dengan ID JBusu memaparkan tangkapan skrin bil, secara terus menyatakan bahawa harga baharu itu "hanya sebuah jenaka". Belanjawan asal sebanyak $28.12 sebulan kini meningkat kepada $746.01 mengikut sistem baharu; beliau telah memutuskan untuk membatalkan langganannya, "Pada harga ini, saya lebih murah menyewa pelayan awan sendiri."


Pengguna lain menangkap skrin yang lebih ekstrem, di mana caj naik dari $50 sehingga melonjak ke $3000; dia mengatakan tidak menyangka harga begitu tidak masuk akal, “Adakah masih ada orang yang terus berlanggan?”

Namun, beberapa pengguna lama Copilot keluar untuk membantah: bilangan ekstrem ini sebahagiannya besar disebabkan oleh vibe-coder yang tidak menganggap serius pembakaran Token, dan mungkin tidak mewakili penggunaan biasa.
Seorang pengguna lama berkomen: "Saya gunakan sepanjang hari, hampir tidak pernah melebihi had akhir bulan, susah percaya ini perbezaan kompleksiti kerja." Seorang lagi lebih terus terang: "Ada orang yang mahu pembangunan mod YOLO automatik penuh, biarkan AI berjalan bebas. Penghapusan pembaziran ini sebenarnya bermanfaat kepada orang lain."
Satu perkara yang perlu dipahami: GitHub tidak menghapus yuran bulanan, harga langganan asas tidak berubah. Yang benar-benar berubah ialah penggunaan tambahan, tugas agen, dan pemanggilan model yang lebih mahal, yang kini memasuki model penagihan berdasarkan penggunaan.
Pengguna agen berat yang bergantung pada Copilot untuk tugas rantai panjang adalah yang paling terkesan.
Papan pemeringkatan yang dirusak oleh orang sendiri
Bayaran bulanan gagal dipertahankan, satu sisi platform mengubah peraturan penagihan, sisi lainnya, pengguna AI juga sedang berusaha habis-habisan menghabiskan.
Pada Mei, Business Insider melaporkan bahawa Amazon menarik balik papan pemimpin AI dalaman bernama KiroRank.
Laporan tersebut mengutip orang yang berpengetahuan yang mengatakan senarai ini secara diam-diam telah mencetuskan cara kerja yang aneh: sebahagian pekerja membelanjakan Token yang tidak menyelesaikan masalah sebenar semata-mata untuk meningkatkan kedudukan mereka dalam senarai.

Selepas perkara ini terbongkar, Presiden Tinggi Amazon, Dave Treadwell, secara langsung berucap kepada semua orang: "Jangan gunakan AI hanya kerana ingin menggunakannya. Gunakan ia untuk menyelesaikan masalah pelanggan, masalah perniagaan, dan untuk berinovasi."
Walaupun perkara ini agak konyol, ia tidak mengejutkan. Apabila "membakar Token" boleh masuk senarai, pekerja pasti akan membakar Token.
Silicon Valley memberikan nama khas kepada fenomena ini: Tokenmaxxing, di mana penggunaan token dianggap sebagai produktiviti.
Laporan Axios juga menyebutkan, seorang CTO mendapati pekerja menggunakan model AI untuk memeriksa cuaca dan menulis e-mel harian—perkara yang sangat mudah—tetapi menggunakan model canggih termahal, maka bil boleh meningkat tanpa disedari.
KiroRank bukan sistem penilaian rasmi Amazon, tetapi alat tidak rasmi yang dibina oleh kakitangan sendiri. Namun, ia dengan jelas memaparkan satu hukum pengurusan klasik: apabila KPI salah ditetapkan, orang akan menggunakan cara paling bijak untuk memanfaatkan celah.
Menganggap “berapa banyak yang digunakan” sebagai ukuran “sejauh mana ia dilakukan dengan baik”—inilah punca sistematik pembaziran AI dalam gelombang ini.
Orang yang mengira token sudah mendapat keuntungan
Di sebalik kecemasan bilangan token, ada yang diam-diam menjadikannya sebagai perniagaan.
Jalan pertama: Beri makan AI dengan konteks.
Glean ialah syarikat sendiri Arvind. Ia menghasilkan pembantu AI perniagaan: menggabungkan pengetahuan yang tersebar di seluruh syarikat, membolehkan AI pekerja mendapatkan konteks secara langsung tanpa perlu mencari-cari di mana-mana. AI kurang berputar-putar, jadi token yang digunakan juga berkurang.
Mekanisme ini menjadikan pendapatan tahunan Glean meningkat tiga kali ganda dalam 15 bulan, melepasi $300 juta, dengan pelanggan termasuk Databricks, Reddit, dan Samsung.
Jalan kedua: Bahagikan tugas kepada model yang tepat.
Perusahaan startup pemula Factory AI melakukan perkara ini: secara automatik menghantar setiap tugas kepada model yang paling sesuai—tugas ringan melalui pakej murah, tugas kompleks melalui pakej tertinggi. Arvind juga pernah menyatakan: jika routing dilakukan dengan betul, ia boleh menjimatkan sehingga 10 kali ganda.
Dua jalan ini berakhir di tempat yang sama: biarkan AI bekerja, tetapi jangan biarkan ia membazir.
Penyelidikan dalam kalangan akademik juga sedang meletakkan asas kepada peralihan ini.

https://arxiv.org/pdf/2604.22750
Sebuah kertas arXiv pada April 2026, pertama kali menguraikan secara sistematis bagaimana tugas pengkodean agen benar-benar memakan biaya.
Kesimpulan satu: Penggunaan Token untuk tugas agen boleh mencapai ribuan kali ganda berbanding penalaran kod dan perbualan kod, dengan token input menjadi punca utama peningkatan kos.
Kesimpulan dua: Apabila tugas yang sama dijalankan berulang kali, penggunaan token boleh berbeza sehingga 30 kali.
Kesimpulan tiga: Penggunaan token yang lebih tinggi tidak secara pasti membawa kepada ketepatan yang lebih tinggi. Ketepatan sering mencapai puncaknya pada kos sederhana—membazirkan lebih banyak wang seterusnya tidak meningkatkan kesan, malah ia menjadi jenuh.
Kertas kerja tersebut juga mendapati bahawa model terkini tidak mampu meramalkan berapa banyak token yang akan mereka gunakan, dan secara umum meremehkan kos sebenar.
Kamu menyangka semakin banyak belanja, semakin banyak perkara yang boleh dilakukan. Sebenarnya, wang telah dibelanjakan, tetapi kerja tidak semestinya lebih baik, dan bajet masih tidak tepat.
Apabila bil AI mula melebihi kos tenaga manusia
Ini adalah kali pertama dalam ingatan saya, kos teknikal mula seimbang dengan kos tenaga kerja.
Pada 29 Mei, CEO Glean, Arvind Jain, berkata demikian semasa diwawancara oleh jururakam CNBC, Deirdre Bosa.

Pemerhatian Bryan Catanzaro, Naib Presiden Aplikasi Pembelajaran Mendalam di NVIDIA, juga mengesahkan perkara ini.
Dalam temu bual dengan Axios, beliau menyebut: Bagi pasukannya, kos pengiraan telah jauh melebihi gaji pekerja.
Fenomena serupa sedang muncul di pelbagai syarikat: daripada Glean yang berfokus pada AI perniagaan, hingga NVIDIA yang menjual kuasa komputasi AI, dan lagi Uber yang menggunakan AI, semuanya sedang meninjau semula perhitungan ini.
Menurut Arvind, sejarahnya teknologi hanyalah sebahagian kecil daripada kos keseluruhan perusahaan, tetapi kini kos AI telah menyamai gaji, dan anggaran AI tahunan banyak perusahaan biasanya habis dalam satu hingga dua bulan.

Dalam setahun terakhir, penggunaan AI adalah indikator yang diagungkan: semakin banyak digunakan, semakin maju; membakar Token adalah merangkul masa depan. Kini, banyak perusahaan mulai merefleksikan perkataan sederhana itu: Apa yang sebenarnya diperoleh dari Token yang dibakar itu?
Jendela masa untuk penggunaan bulanan percuma kini ditutup.
Seterusnya, masalah yang dihadapi oleh semua pembangun ialah bagaimana mengurus sumber dengan bijak supaya setiap Token mencapai nilai maksimum.
Pemenang sebenarnya di masa depan, tanpa diragukan lagi, akan menjadi yang pertama belajar mengira akaun Token.
Rujukan:
https://x.com/dee_bosa/status/2060791500049613306%20
https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20
https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20
https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5
Artikel ini berasal daripada akaun微信公众号 "Sinzhiyuan", penulis: Wahyu ASI
