Patay ang mga AI Token: 500M, 1.3M, at 18K sa Isang Gabi

500 milyong dolyar ang utang sa loob ng isang buwan!

Kahapon, isang malaking kamalian ang naging balita sa mundo ng teknolohiya. Ayon sa Axios, isang kumpanya ang nag-spent ng $500 milyon sa Claude sa loob ng isang buwan lamang!

Ang dahilan ay nakakatawa at nakakalungkot: ang pamamahala ay nakalimutan magtakda ng limitasyon sa paggamit nang magbigay sila ng pahintulot sa mga empleyado para gamitin ang Claude.

GitHub

Sa katotohanan, higit pa sa isang kumpanya ang nagkakaroon ng AI billing liquidation.

Noong Abril ng taong ito, isang gumagamit ng Google Cloud ay nakatanggap ng taksil na pagsasagawa ng isang API key na natirang sa isang pampublikong serbisyo, at ang kanyang account na may budget na lamang ng $7 ay nakatanggap ng taksil na $18,000 sa isang gabi.

GitHub

Ang masamang username ay si Jesse Davies, isang Australian AI consultant at founder ng Agentic Labs. Ipinaglagay niya ang dalawang pag-iingat sa kanyang Google Cloud account: isang budget alert na 10澳元 (halos 7 dolyar) at isang katatagan na limitasyon sa paggastos na 1,400 dolyar.

Ayon sa Tom's Hardware, natuklasan ng mga hacker ang isang Cloud Run service na ipinahayag niya ilang buwan na ang nakalipas, at nagpadala ng higit sa 60,000 na kahilingan; ang dalawang pagsisiguro ay hindi nakapigil: may pagkakalantad sa pagkalkula ng taksil, at habang naghihintay ang sistema na tumugon, tumataas na ang halaga hanggang $18,000.

Mid-May, ang tagapagtaguyod ng open-source project na OpenClaw, si Peter Steinberger, ay nag-post ng isang screenshot sa X: 30 araw, $1.3 milyon ang taksil ng OpenAI API.

GitHub

Mayroon lang siyang tatlong miyembro sa kanyang tim, ngunit ang 100 na Codex agents na pinag-uupahan nila ay tumatakbo nang paralelo: 60.3 bilyong token ang nasunog sa 30 araw, at 7.6 milyong request ang nagawa. Mas mainam, ang $1.3 milyong ito ay hindi kanyang pinagbayaran sa sarili niyang bulsa.

Sumali si Steinberger sa OpenAI noong Pebrero ng taong ito, at ang $1.3 milyon ay ginamit bilang isang panloob na eksperimento:

Subukan kung anong limitasyon ang maaabot ng AI programming kung hindi isinasaalang-alang ang gastos ng Token. Dagdag niya, ito ay resulta ng Codex na “Fast Mode” (fast billing mode), at kapag isarado, umabot ito sa halos $300,000.

Mas maaga, tinanggap rin ni Uber CTO, Praveen Neppalli Naga, sa The Information na kinonsumo ng kumpanya ang buong taong budget para sa Claude Code noong Abril, at binigkas din ng kanilang COO na ang mga gastos sa AI ay lalong 'hindi madaling ipaliwanag'.

500 milyon, 1.3 milyon, 18,000, bagaman iba ang dami ng mga antas, nagtuturo sila sa iisang katotohanan:

Sa panahon ng mga agent, ang walang kontrol na key, ang armada ng mga agent na gumagawa nang walang pahinga, at ang account na nakalimutan mag-set ng limitasyon: anumang isa sa kanila ay maaaring magpa-brush ng iyong token bill sa isang gabi.

Bakit nagkakaroon ng margin call ang AI billing?

Ang sagot ay nakatago sa pagbabago ng paraan ng pagbabayad.

Mula sa Abril ng taong ito, ang monthly subscription plan ng OpenAI ay nagsimulang lumipat sa pagbabayad batay sa paggamit ng Token.

Noong Abril 2, binago ang pagbabayad ng Codex mula sa pagtatantiya batay sa mensahe patungo sa pagkakasunod sa paggamit ng Token: hihiwalay na binabawas ang mga Token para sa input, cached input, at output. Noong Abril 23, ipinalawig ang sistemang ito sa lahat ng mga plano ng Enterprise, Edu, Health, at Gov: tinanggal ang nakatago na diskwento sa monthly fee.

Sumunod ang GitHub, at kamakailan ay inanunsyo: Ang lahat ng Copilot plans ay magiging pay-per-use mula Hunyo 1, 2026. Ang lumang logika para sa mga premium request ay ipapalit ng AI credits, na iisang-isa ay babayaran batay sa tunay na paggamit ng input Token, output Token, at cached Token, ayon sa API rate ng bawat model.

GitHub

Ipinaliwanag ng GitHub ang dahilan kung bakit ginawa ito:

Sa isang mabilis na tanong sa chat at isang autonomous na coding task na tumatagal ng ilang oras, parehong halaga ang ginastos ng user. Patuloy na binabayaran ng GitHub ang mga user na nagpapatakbo ng mga mabigat na task, ngunit hindi na makabuluhan ang ganitong modelo.

Bago umusbong ang mga AI agent, ang gastos sa pag-chat at pag-complete ay magkakapareho, at sapat ang monthly fee.

Pagkatapos ng pag-usbong ng mga agent, isang task ay maaaring mag-run nang ilang oras nang tuloy-tuloy at baguhin ang buong codebase; ang pagkakaiba sa gastos sa pagitan ng malalim at maliit na gumagamit ay maaaring umabot sa ilang hanay ng pwersa. Ang sistema ng monthly fee ay bumagsak nang direkta sa harap ng pagkakaiba na ito.

Agad na nagkaron ng ingay sa Reddit at X.

Isinulat ng isang developer na may ID na JBusu ang isang screenshot ng kanyang bill at sinabi na ang bagong pricing ay "isang joke." Mula sa dating gastos na $28.12/mo, magkakahalaga ito ng $746.01 batay sa bagong sistema, at nagsiyasat na siya na i-cancel ang kanyang subscription: "Sa presyong ito, mas mura pa ako kung aariin ko ang sarili kong cloud server."

GitHub

Mas nakakaloka ang screenshot ng ibang user, kung saan tumataas ang bayarin mula sa $50 patungo sa $3,000; sinabi niya na hindi niya inaasahan na ganoon kahalata ang presyo, “Mayroon pa ba kayong nagpapakasal sa subscription?”

GitHub

Gayunpaman, may mga lumang user ng Copilot na nagtanggol: ang mga ekstremong bill na ito ay karamihan ay gawa ng mga vibe-coder na hindi nag-aalala sa pag-burn ng Token, at hindi ito maaaring kumatawan sa karaniwang paggamit.

Isang matandang user ang nag-comment: "Ginagamit ko ito araw-araw, at sa kabanata ng buwan ay halos hindi ako lumampas sa limitasyon, mahirap paniniwalaan na ito ay pagkakaiba sa kumplikadong trabaho." Isang iba naman ay mas direkta: "Mayroon lang talagang nangangailangan ng全自动 YOLO mode na pag-unlad, para pabayaan ang AI. Ang pagkalupit na ito ay tinanggal, at para sa iba naman ay mas mabuti."

Dapat malinaw: Hindi nila inalis ang monthly fee ng GitHub, at hindi nagbago ang presyo ng basic subscription. Ang tunay na pagbabago ay ang karagdagang paggamit, mga gawain ng agent, at mas mahal na pagtawag sa mga model, mula ngayon ay papasok sa pagbabayad batay sa paggamit.

Ang pinakamalaking epekto ay naranasan ng mga matinding user ng agent na nag-iisip ng mahabang mga gawain gamit ang Copilot.

Ang listahan na nasira ng sariling tao

Nawala ang monthly fee, isa sa mga dahilan ay ang pagbabago ng platform sa patakaran sa pagbabayad, at isa naman ay ang mga gumagamit ng AI ay mismo ay nagpapalabas ng maraming pera.

Sa Mayo, ayon sa Business Insider, tinanggal ng Amazon ang isang loob na AI usage leaderboard na tinatawag na KiroRank.

Ayon sa ulat, sinipi nito ang mga kaalaman ng mga taong may kaalaman na nagbigay-daan sa isang kakaibang paraan ng paggawa: ang ilang empleyado ay nag-iisip ng mga Token na hindi naglulutas ng tunay na problema, lamang para sa pagtaas sa listahan.

GitHub

Pagkatapos maipahayag ang balita, direktang umapela si Dave Treadwell, Senior Vice President ng Amazon, sa lahat ng empleyado: “Huwag gamitin ang AI para lang gamitin ito. Gamitin ito upang lutasin ang mga problema ng customer, ang mga problema sa negosyo, at upang makabago.”

Kahit medyo kakaiba ang sitwasyong ito, hindi ito nakakagulat. Kapag ang pagpapalit ng Token ay nakakapasok sa listahan, natural lamang na gagawin ng mga empleyado ang pagpapalit ng Token.

Ibinigay ng Silicon Valley ang isang espesyal na pangalan sa ganitong pangyayari: Tokenmaxxing, kung saan ang pagkonsyumo ay itinuturing na produktibidad.

Sa ulat ng Axios, binanggit din na may CTO na nagsabing nakakita siya ng mga empleyado na gumagamit ng AI model para hanapin ang panahon, isulat ang pang-araw-araw na email—mga simpleng bagay na ginagamit ang pinakamahal na advanced model, kaya tumataas nang tahimik ang taksil.

Hindi ito opisyal na sistema ng pagtataya ng Amazon, kundi isang di-pormal na kasangkapan na itinayo ng mga empleyado. Ngunit ito ay nagpapakita nang malinaw ng isang klasikong prinsipyo sa pagpaplano: kapag mali ang KPI, gagamitin ng mga tao ang pinakamatalinong paraan upang magmaneho.

Isang pagkakapantay-pantay ng "gaano karaming ginamit" sa "gaano kahusay na ginawa" — iyon ang pambansang ugat ng pagkalansing sa mga AI na ito.

Ang mga taong nagsasagawa ng pagkalkula sa mga token, ay naghahabol na ng kita

Sa kabilang panig ng pagkabahala sa token bill, may ilan na nagawa ito bilang negosyo.

Unang paraan: Pagsasalita sa AI gamit ang konteksto.

Glean ay sariling kumpanya ni Arvind. Ito ay nagbibigay ng enterprise AI assistant: pinagsasama nito ang mga natitirang kaalaman sa buong kumpanya, upang makakuha agad ng konteksto ang AI ng mga empleyado, nang hindi na kailangang maghanap-hanap. Mas kaunti ang paglalakbay ng AI, kaya mas kaunti rin ang mga Token na ginagamit.

Ang mekanismo na ito ay nagdulot ng pagtaas na tatlong beses ng taunang kita ni Glean sa loob ng 15 buwan, lampaos ang $300 milyon, kasama ang mga kliyente tulad ng Databricks, Reddit, at Samsung.

Ikalawang daan: Ibahagi ang trabaho sa tamang modelo.

Ang Factory AI, isang startup na nagtatrabaho sa model routing, ay gumagawa nito: awtomatikong ipinapadala ang bawat gawain sa pinakamahusay na modelo—mga simpleng gawain sa mas mura, at mga kumplikadong gawain sa premium. Sinabi rin ni Arvind: kung tama ang routing, maaaring i-save ang 10 beses.

Magkakasama ang dalawang daan: pahintulutan ang AI na magtrabaho, ngunit huwag pahintulutan itong mag-spending nang walang kontrol.

Ang mga pag-aaral sa akademikong komunidad ay nagpapahanda rin sa ganitong pagbabago.

GitHub

https://arxiv.org/pdf/2604.22750

Isang papel sa arXiv noong Abril 2026, unang sistematikong inanalisa kung paano nagkakahalaga ang mga gawain sa pag-encode ng agent.

Konklusyon uno: Ang pagkawala ng Token sa mga gawain ng agent ay maaaring umabot sa libo-libong beses ang dami ng karaniwang code reasoning at code dialogue, at ang pangunahing dahilan ng pagtaas ng gastos ay ang input Token.

Kongklusyon 2: Kapag isinagawa ang iisang gawain nang maraming beses, maaaring magkaiba ang pagkakagamit ng Token ng 30 beses.

Kongklusyon 3: Mas mataas na paggamit ng Token ay hindi nangangahulugan ng mas mataas na akurasi. Ang precision ay karaniwang nakakamit sa katamtamang gastos—kung mas marami pang babayaran, mas maraming pera ang ginagastusin, ngunit ang epekto ay nagsasatura na.

Natuklasan din ng papel na ang mga modelo sa harap ay hindi kayang makapagpalaya kung gaano karaming Token ang gagastusin, at karaniwang kinukubra ang totoong gastos.

Isinasaalang-alang mo na ang paggastos ng higit pang pera ay magdudulot ng higit pang gawain. Sa katotohanan, kahit na nagastos ka, ang gawain ay hindi laging mas mabuti, at ang budget ay hindi pa rin tama.

Kapag ang mga tinda ng AI ay nagsisimulang lalampas sa gastos ng paggawa ng tao

Ito ang unang beses sa aking alaala kung saan ang teknikal na gastos ay nagsimulang magkasinghalaga sa gastos ng paggawa.

Noong Mayo 29, sinabi ni Glean CEO na si Arvind Jain sa isang interbyu kay CNBC reporter na si Deirdre Bosa.

GitHub

Ang mga obserbasyon ni Bryan Catanzaro, Vice President for Deep Learning sa NVIDIA, ay nagpapatotoo dito.

Sinabi niya sa isang interbyu sa Axios: Para sa kanyang team, ang gastos sa computing power ay naging mas mataas kaysa sa sahod ng mga empleyado.

Kumikilala ang iba’t ibang kumpanya sa katulad na pangyayari: mula sa Glean na nagtatrabaho sa enterprise AI, hanggang sa NVIDIA na nagbebenta ng AI computing power, at pati na ang Uber na gumagamit ng AI, lahat ay nagre-reexamine ang kanilang accounting.

Sa pananaw ni Arvind, sa kasaysayan ay maliit na bahagi lamang ng teknolohiya sa kabuuang gastos ng isang kumpanya, ngunit ngayon ang gastos sa AI ay nakakasabay na sa payroll, at karaniwan ang taunang budget para sa AI ng maraming kumpanya ay nasusunog sa loob ng isang hanggang dalawang buwan.

GitHub

Sa nakalipas na taon, ang paggamit ng AI ay isang indikador na pinapuri: mas maraming paggamit ay mas advanced, ang pagbuburn ng Token ay pagtanggap sa hinaharap. Ngayon, maraming kumpanya ay nagsisimula na mag-isip muli sa simpleng pahayag na ito: Ano nga ba ang natanggap nila sa mga napuburn na Token?

Ang libreng panahon para sa buwan na walang bayad ay nagtatapos ngayon.

Susunod, ang hamon na nakaharap sa lahat ng mga developer ay: paano magmaliit-maliit at gawing maksimo ang halaga ng bawat Token.

Ang totoong mananalo sa hinaharap, walang pag-aalinlangan, ay ang unang makakatutok sa pagkalkula ng mga token.

Mga sanggunian:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Nakukuha ang artikulong ito mula sa WeChat public account na “New Intelligence Yuan”, may-akda: ASI Revelation