AI Token Bilişleri Patlıyor: Bir Gecede 500M, 1,3M ve 18K

1 ayda 500 milyon dolarlık fatura yakıldı!

Son zamanlarda teknoloji dünyasında büyük bir yanlışlık ortaya çıktı. Axios'a göre, bir şirket bir ay içinde Claude üzerinde 500 milyon dolar harcadı!

Neden gülümsetici ve ağlatıcı: Yöneticiler, çalışanlara Claude hesap erişimi verirken kullanım limitini ayarlamayı unuttu.

GitHub

Aslında, AI fatura patlaması sadece bu şirketle sınırlı değil.

Bu yıl Nisan ayında, bir Google Cloud kullanıcısı, açık hizmette kalan bir API anahtarının kötüye kullanılması nedeniyle, orijinal olarak 7 dolarlık bütçesi olan hesabında bir gece içinde 18.000 dolarlık bir fatura aldı.

GitHub

Bu şanssız kullanıcı adı Jesse Davies, Avustralyalı bir AI danışmanı ve Agentic Labs'in kurucusudur. Google Cloud hesabına iki koruma katmanı ayarladı: 10 Avustralya doları (yaklaşık 7 dolar) bütçe uyarısı ve 1400 dolarlık üst sınır.

Tom's Hardware'a göre, saldırgan, birkaç ay önce AI Studio'dan yayınladığı bir Cloud Run hizmetini keşfetti ve 60 binin üzerinde istek gönderdi; iki güvenlik katmanı da engelleyemedi: fatura hesaplama gecikmeliydi ve sistem tepki verdiğinde tutar 18.000 dolara sıçramıştı.

Mayısın ortasında, açık kaynak projesi OpenClaw'un kurucusu Peter Steinberger, X üzerinde bir ekran görüntüsü paylaştı: 30 gün içinde OpenAI API faturası 1,3 milyon dolar.

GitHub

Takımı sadece üç kişiden oluşuyor, ancak yönettikleri 100 Codex akıllı aracının paralel olarak çalışması sonucu 30 gün içinde 60,3 milyar token yakıldı ve 7,6 milyon istek gönderildi. İyi ki bu 1,3 milyon dolar kendi cebinden çıkmadı.

Steinberger, bu 1.3 milyon doları bir dahili deney olarak kullanmak üzere Şubat'ta OpenAI'ye katıldı:

Token maliyetini göz önünde bulundurmadan AI programlama hangi sınıra kadar ulaşabilir? Ek olarak, bu, Codex'in "Fast Mode" (Hızlı Mod) ücretlendirmesinin sonucudur ve kapatıldığında yaklaşık 300.000 dolar olur.

Daha önce Uber'in CTO'su Praveen Neppalli Naga, The Information'a şirketin Nisan ayında yıllık Claude Code bütçesini tükettiğini itiraf etmişti; COO'su da AI maliyetlerinin giderek "açıklanması zor" hale geldiğini açıkça ifade etti.

500 milyon, 1,3 milyon, 18 bin; tutarlar birkaç büyüklük sırası fark ediyor olsa da, aynı gerçeği gösteriyor:

Akıllı sistemler çağında, kayıp anahtarlar, 24 saat çalışan akıllı sistemler ordusu, üst sınır ayarlamayı unutmuş hesaplar: Bunlardan herhangi biri, Token faturanızı bir gece içinde patlatabilir.

AI faturaları neden patlar?

Cevap, faturalandırma yöntemindeki değişikliklerde gizlidir.

Nisan ayından itibaren OpenAI'nin aylık abonelik modeli, Token kullanımına göre ücretlendirilmeye başlamıştır.

2 Nisan'da Codex faturalama sistemi, mesaj bazlı tahmine değil, Token kullanımına göre hizmet vermek üzere değiştirildi: Girdi, önbellek girdisi ve çıktı olmak üzere üç Token türü ayrı ayrı hesaplanacak. 23 Nisan'da bu kural, tüm Enterprise, Edu, Health ve Gov planlarına uygulandı: Aylık ücretteki görünmeyen indirim kaldırıldı.

GitHub de hemen ardından açıkladı: Tüm Copilot paketleri 1 Haziran 2026 itibarıyla kullanım tabanlı fiyatlama modeline geçecektir. Eski üst düzey istek mantığı geçersiz kılınacak ve girdi Token, çıktı Token, önbellek Token gerçek tüketimine göre her modelin API ücretlendirmesiyle hesaplanan AI kredileriyle değiştirilecektir.

GitHub

GitHub, bunu yapma nedenini açıkladı:

Şimdi bir hızlı sohbet sorusu ve birkaç saat süren bağımsız kodlama görevi için kullanıcı aynı miktarda para harcıyor. GitHub, yoğun görevleri çalıştıran kullanıcılar için masrafı ödemeye devam ediyor, ancak bu model sürdürülemez hale geldi.

Yapay zeka ajanlarının yükselişinden önce, sohbet ve tamamlama maliyetleri neredeyse aynıydı, aylık ücretle karşılanabilirdi.

Akıllı ajanların yükselişinden sonra, bir görev saatlerce çalışabilir ve tüm kod tabanını değiştirebilir; yoğun ve hafif kullanıcılar arasındaki maliyet farkı birkaç sıralık büyüklüğe ulaşabilir. Bu fark karşısında aylık abonelik modeli tamamen çöker.

Mesajın duyurulmasıyla Reddit ve X'te büyük tepki wyarıldı.

ID'si JBusu olan bir geliştirici, fatura ekran görüntüsünü paylaşıp yeni fiyatlandırmayı "bir mizah" olarak nitelendirdi. Aylık 28,12 dolarlık harcama, yeni sistemde 746,01 dolara yükseliyor; geliştirici, aboneliğini iptal etmeye karar verdi: "Bu fiyata kendi bulut sunucumu kiralamak daha ucuz olur."

GitHub

Diğer bir kullanıcı, ücretin 50 dolarlık seviyeden 3000 dolara kadar sıçradığını gösteren bir ekran görüntüsü paylaştı ve bu fiyatlamayı beklemediğini, “Hâlâ abone olan var mı?” dedi.

GitHub

Ancak bazı Copilot eski kullanıcıları da şöyle itiraz etti: Bu aşırı faturalar çoğunlukla vibe-coder'ların (duyguya dayalı kodlayanların) Token yakmayı ciddiye almamasından kaynaklanıyor ve normal kullanımın bir göstergesi olmayabilir.

Bir eski kullanıcı yorumlarda yazıyor: “Tamamını kullanıyorum, ay sonunda neredeyse aşım yapmıyorum, bunun çalışma yoğunluğundaki fark olduğunu inanmak zor.” Başkası ise daha doğrudan: “Kimse tamamen otomatik YOLO modu geliştirmek istiyor, AI’nın rastgele koşmasını sağlıyor. Bu israf kaldırıldığında, diğerleri için iyi bir şey oluyor.”

Şunu net bir şekilde anlamalısınız: GitHub, aylık ücreti kaldırmadı, temel abonelik fiyatı değişmedi. Gerçekten değişen, ek kullanım, ajan görevleri ve daha pahalı model çağrıları; bundan sonra kullanım bazlı ücretlendirme başlıyor.

En çok etkilenenler, Copilot ile uzun zincir görevlerini çalıştıran yoğun aracılı kullanıcılar.

Kendi içinde bozulan sıralama

Aylık ücretler kaybedildi, bir taraftan platform ücretlendirme kurallarını değiştirdi, diğer taraftan AI kullananlar kendi kendilerini de yoğun bir şekilde harcıyor.

Mayıs'ta Business Insider, Amazon'ın iç bir AI kullanım sıralaması olan KiroRank'ı kaldırdığını bildirdi.

Haber, bilgili kaynaklara dayanarak, bu sıralamada biraz daha yukarı çıkmak için bazı çalışanların gerçek problemleri çözmeden sadece sıralama amaçlı Token tüketimini artırdığını ortaya koydu.

GitHub

Olay ortaya çıktıktan sonra Amazon'un üst düzey vice president'u Dave Treadwell, tüm personel için şöyle bir mesaj gönderdi: "AI'yi AI için kullanmayın. Müşteri sorunlarını, iş sorunlarını çözmek ve yenilik yapmak için kullanın."

Bu biraz tuhaf olsa da, beklenen bir şey. "Token yakmak"榜'a girerse, çalışanlar doğal olarak token yaktıkları için.

Silicon Valley, bu olaya özel bir isim verdi: Tokenmaxxing (Token'u极限 tüketmek), tüketimi üretkenlik olarak görüyor.

Axios'in haberinde, CTO'nun çalışanların AI modelini hava durumunu sormak ve günlük e-postalar yazmak için kullandığı, çok basit işler için en pahalı ileri modeli kullandıkları ve faturaların sessizce patladığı belirtildi.

KiroRank, Amazon'un resmi değerlendirme sistemi değil, çalışanlar tarafından gönüllü olarak oluşturulan resmi olmayan bir araçtır. Ancak bu, klasik bir yönetim ilkesini açıkça ortaya koyar: KPI'lar yanlış ayarlandığında, insanlar boşlukları en akıllıca şekilde doldurur.

Kullanılan miktarı, iyi yapıp yapmadığınızla eşitlemek—bu, bu AI dalgasının sistematik kökenidir.

Token hesaplarını tutanlar, zaten para kazanıyor.

Token fatura kaygısının diğer yüzü, bazıları bunu gizlice bir işe dönüştürdü.

İlk yol: AI'yi bağlamla doyurmak.

Glean, Arvind'in kendi şirketidir. İşletme AI yardımcı aracı olarak çalışır: şirket içinde dağılmış bilgileri birleştirerek çalışanların AI'larının bağlamı doğrudan elde etmesini sağlar ve her yerde arama yapmalarına gerek kalmaz. AI daha az yol alır, bu da harcanan Token miktarını doğal olarak azaltır.

Bu mekanizma, Glean'in yıllık gelirini 15 ay içinde üç katına çıkardı ve 3 milyar doları aştı; müşterileri arasında Databricks, Reddit ve Samsung yer alıyor.

İkinci yol: İşleri doğru modele vermek.

Model rota startup Factory AI, her görevi en uygun modele otomatik olarak atar; basit görevler ucuz seviyeye, karmaşık görevler ise üst düzey modele yönlendirilir. Arvind ayrıca, rota doğru yapıldığında %10 tasarruf sağlanabileceğini belirtti.

İki yol da aynı hedefe ulaşıyor: AI'ya iş yaptırmak, ama onun keyif için harcamasına izin vermemek.

Akademik çevrelerdeki araştırmalar da bu dönüşümü temellendirmektedir.

GitHub

https://arxiv.org/pdf/2604.22750

2026 yılının Nisan ayında yayınlanan bir arXiv makalesi, ajan kodlama görevlerinin nasıl para harcadığını ilk kez sistematik olarak analiz etti.

Sonuç 1: Akıllı sistem görevlerinin Token tüketimi, normal kod çıkarımı ve kod diyaloglarının binlerce katına ulaşabilir; maliyeti artıran ana neden girdi Token'larıdır.

Sonuç 2: Aynı görevi birden çok kez çalıştırmak, Token tüketiminde 30 katlık fark yaratabilir.

Sonuç 3: Daha yüksek Token tüketimi, mutlaka daha yüksek doğruluk anlamına gelmez. Doğruluk genellikle orta maliyetlerde zirveye çıkar—daha fazlasını harcarsanız, para harcanır ama etki doygunlaşır.

Çalışma, öncü modellerin kendi ne kadar token tüketeceğini bile tahmin edemediğini ve genellikle gerçek maliyeti altımsı kestirdiğini ortaya koydu.

Daha fazla para harcayarak daha fazla iş yapabileceğinizi düşünüyorsunuz. Aslında para harcandı, iş daha iyi olmayabilir ve bütçe hâlâ doğru tahmin edilemiyor.

AI faturaları insan maliyetlerini geçmeye başladığında

Bu, hatırladığım kadarıyla ilk kez teknoloji maliyetinin insan gücü maliyetiyle eşitlenmesi.

29 Mayıs'ta, Glean CEO'su Arvind Jain, CNBC muhabiri Deirdre Bosa'ya verdiği röportajda şöyle dedi.

GitHub

NVIDIA'nın Derin Öğrenme Uygulamaları Başkan Yardımcısı Bryan Catanzaro'nun gözlemleri de bunu doğrulamaktadır.

Axios röportajında, ekibinin için hesaplama maliyetlerinin çalışan maaşlarından çok daha yüksek olduğunu belirtti.

Benzer bir durum birçok şirkette ortaya çıkıyor: Kurumsal AI ile çalışan Glean'dan, AI hesaplama gücü satan NVIDIA'ya ve AI kullanan Uber'e kadar hepsi bu hesabı yeniden değerlendiriyor.

Arvind'e göre, tarihsel olarak teknoloji şirketlerin toplam maliyetlerinde çok küçük bir bölüm oluşturuyordu, ancak şimdi AI maliyetleri maaş listeleriyle eşitlenebilir hale geldi ve birçok şirketin yıllık AI bütçesi genellikle bir ila iki ay içinde tükeniyor.

GitHub

Geçen yıl, AI kullanım oranı takdir edilen bir göstergeydi: daha fazla kullanmak ileri gidiş, Token yakmak ise geleceğe açık olmak anlamına geliyordu. Şimdi birçok şirket, bu basit soruyu yeniden düşünmeye başlıyor: Bu yakılan Token'lar neye karşılık geldi?

Ücretsiz aylık kullanım fırsatı tam olarak şimdi kapanıyor.

Sonrasında tüm geliştiricilerin karşısına şu soru çıkıyor: Her bir Token'in maksimum değeri nasıl elde edilir?

Geleceğin gerçek kazananı, kesinlikle Token hesaplarını en önce öğrenen olacak.

Kaynaklar:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Bu yazı, WeChat hesabı "Yeni Akıl" tarafından yazılmıştır, yazar: ASI Vahiyleri