Şirketler büyük ölçekli AI araçları benimsettikten sonra yeni sorunlar ortaya çıkmaya başladı: modelin yeterince güçlü olup olmadığı değil, faturaların çok hızlı artması. Birçok teknoloji ve internet şirketi, tek bir Token fiyatının düşmesine rağmen, AI kodlama, otomatik asistanlar ve akıllı araçların yaygınlaşması nedeniyle toplam tüketimin hızla arttığını gözlemledi.
Birden fazla şirketin bütçesi erken tükendi
TechCrunch, 2026 yılı için AI bütçelerini erken tüketen bazı şirketleri rapor ediyor. Uber, Nisan ayına kadar yıllık AI kodlama bütçesini tamamen tüketti; Microsoft, birkaç ay açık tuttuktan sonra bazı geliştiricilerin Claude Code kullanım iznini iptal etti; Priceline'dan bir çalışan, Cursor'un düzenli yenileme tekliflerinin önceki tekliflere göre 4 ila 5 kat daha yüksek olduğunu belirtti.
Bu değişiklik, son aylarda daha güçlü modellerin piyasaya sürülmesiyle ilgilidir. Anthropic, OpenAI ve Google, Kasım ayından sonra agens senaryolarına daha uygun yeni modelleri sırayla çıkartarak talebi artırmaya devam etti. Bir şirket, çalışanların kullanımını sınırlamadığı için Claude faturasında 500 milyon dolarlık bir tutarla karşılaştı.
Verimlilik artışı maliyetleri karşılamayabilir.
OpenAI'nin kurumsal işleri sorumlu yöneticisi Alexander Embr, altı ay önce müşterilerin odak noktası model kapasitesiyken, şimdi tartışmaların merkezinde harcama görünürlüğü, denetim yeteneği, Token kontrolü ve model verimliliği yer aldığını belirtti. Kurumsal düzeyde AI satın alma sorunları, "ne yapabilir" yerine "ne kadar harcandı, değerli mi" yönüne doğru kaymaktadır.
AI kodlama araçlarının getirisi etrafında endüstri içinde yeniden hesaplamalar başlamıştır. Faros AI, Mart ayında 20.000 geliştirici üzerinde yaptığı bir ankette, geliştirme üretiminin arttığını ancak hataların ve yeniden çalışmanın da arttığını tespit etmiştir. Mühendislik yönetim platformu Jellyfish'in araştırması ise, AI'yi yoğun şekilde kullanan mühendislerin verimliliğinin düşük kullananlara göre yaklaşık iki kat olduğunu, ancak Token tüketiminin 10 kat daha yüksek olduğunu göstermektedir.
- Yüksek düzeyde AI kullananların verimliliği, düşük düzeyde kullananların yaklaşık iki katıdır.
- Karşılık gelen token tüketimi yaklaşık 10 kat daha yüksek
- Bir geliştirici, 9 ay içinde tüketimini yaklaşık 18,6 kat artırdı.
Maliyet yönetimi aracı hızla şekilleniyor
Fatura sorunları genişledikçe, AI maliyet yönetimi için araç pazarı da ısınmaya başlıyor. Linux Vakfı, bu hafta Tokenomics Foundation kurmayı duyurdu ve AI Token harcamaları için FinOps gibi bir dil ve yönetim standardı oluşturmayı hedefliyor.
Kuruluş, Token kullanım ve faturalandırma için açık standartlar, birleşik metrikler ve "her birim akıllı maliyet" veya "her watt başına Token sayısı" gibi maliyet verimliliğiyle ilgili yeni ölçümler geliştirmeyi planlıyor. Resmi başlatma, Temmuz'da bekleniyor ve gelecek hafta gerçekleşecek FinOps X konferansında daha fazla üye duyurulacak.
Aynı zamanda, startup'lar ve olgun firmaların yatırımı hızlanıyor. Pay-i ve Paid gibi şirketler, AI maliyet izleme, ölçüm ve optimizasyonu üzerinde odaklanıyor; Jellyfish, Waydev ve Faros AI, AI akıllı ajan izleme hizmetleri sunuyor; Ramp, Datadog ve New Relic ise AI harcama yönetimi, Token seviyesinde gözlenebilirlik ve GPU izleme özelliklerini artırıyor.
Model rota maliyet azaltma yönü haline geldi
Bazı yatırımcılar ve şirket yöneticileri, bu tür yeteneklerin gelecekte uygulama katmanında veya model rota katmanında daha fazla ortaya çıkacağını düşünüyor. Örneğin, şirket AI startup'ı Factory bu hafta, görevlere göre daha uygun modeli otomatik olarak seçerek çağrı maliyetlerini düşüren bir model rota sistemi sundu. Bazı şirketlerin faturalarında da benzer uygulamalar görülmeye başlandı; hatta yüksek performanslı modeller çağrıldığında bile sistem, bazı istekleri daha ucuz modellere yönlendiriyor.
Ek bilgi: Goldman Sachs, 2030 yılına kadar küresel token kullanımının 24 kat artacağını tahmin ediyor. Yüksek yatırım aşamasına girmiş şirketler için, AI kullanımını genişletirken maliyetleri kontrol etmek, sonraki aşama dağıtımının gerçek bir sorunu haline geliyor.
