Dış medya《Fortune》, şirket içi bir zamanlar popüler olan "tokenmaxxing"in soğumaya başladığını yorumladı. Tokenmaxxing, çalışanların veya ekiplerin AI modelini çağırırken kullandığı token miktarını yenilik düzeyi ve verimlilik için bir yaklaşık göstergesi olarak kabul etmektir. Ancak faturaların artması ve geçersiz çağrıların artmasıyla birlikte, bu uygulama giderek daha fazla şirket tarafından kısıtlanmaya başlandı.
Makale, Meta, Amazon, OpenAI gibi şirketlerin daha önce resmi veya resmi olmayan bir token sıralaması uyguladığını ve mühendislerin model kullanım miktarlarını yarıştırmaya teşvik ettiğini belirtiyor. Sorun, ölçütün kendisi bir değerlendirme hedefi haline geldiğinde orijinal amacından sapma yaşanmasıdır. British Financial Times, daha önce Amazon'da bazı çalışanların kullanım verilerini korumak amacıyla gerçek anlam taşımayan görevleri AI ajanlarına yaptırdığını rapor etmişti.
Maliyet baskıları ortaya başlıyor
Kurumsal ortamda üretken AI'nın geniş çapta yayılmasıyla model çağırma maliyetleri hızla artıyor. Makale, bazı şirketlerin çalışanların üçüncü taraf AI ajentlerini, özellikle üst düzey modelleri kullanan araçları kullanmasını kısıtlamaya başladığını belirtiyor. Meta, çalışanların kendi kendine oluşturduğu Token sıralamasını kaldırdı; The Verge, Microsoft'un birkaç kritik ürün departmanındaki çalışanların Claude Code aboneliklerini iptal ettiğini rapor ediyor.
Uber, 2026 yılının ilk dört ayında yıllık token bütçesini tamamen tükettiğini açıkladı ve bu harcamaların bir kısmı Claude Code'un yoğun kullanımından kaynaklandı. Salesforce CEO'su Marc Benioff, şirketin bu yıl Anthropic'a yaklaşık 3 milyar dolar ödediğini ve gelecekte farklı istekleri daha uygun maliyetli modellere yönlendirecek daha akıllı bir rota sistemi istediğini belirtti.
Şirketler iş sonuçlarına daha çok değer verir.
Makale, şirketlerin Token göstergelerini sıkılaştırmalarının temel nedeninin sadece harcamaları azaltmak olmadığını, daha çok yatırım ile geri dönüş arasındaki fark olduğunu belirtiyor. Uber'in Chief Operating Officer'ı Andrew Macdonald, şirketin bazı çalışanların verimliliğini artırmanın, kullanıcıya yönelik yeni özelliklerin teslimi veya genel işletme sonuçlarıyla doğrudan ilişkilendirmeyi zor bulduğunu ifade etti. Net bir iş sonucu oluşturulamazsa, model maliyetlerinin sürekli olarak mantıklı olduğu kanıtlanmasının zorluğu artar.
Bu, sadece token tüketimini takip etmenin artık etkili bir yönetim aracı olarak görülmesinin nedenidir. Ölçekleri yansıtabilir, ancak bu çağrıların ürününü, sürecini veya gelirini gerçekten iyileştirdiğini göstermez.
Gerçek getiri, süreç yeniden yapılandırmasından gelir.
Makale, Exponential View yazarı Azeem Azhar'ın görüşünü aktarıyor: Şu anda AI yatırımları ile verimlilik arasındaki uyumsuzluk, yeni genel bir teknolojinin erken aşamasında sıkça görülen bir “verimlilik J eğrisi” gibi. Şirketler, deneme aşamasında genellikle maliyetleri artırır, ancak kısa vadeli olarak açık bir getiri göremez; verimlilik artışı, iş süreçleri yeniden tasarlandıktan sonra yoğun bir şekilde ortaya çıkar.
Elektrik yenileme fabrikası örneğiyle açıklanan makale, şirketlerin başlangıçta yalnızca aydınlatmayı veya güç kaynağını değiştirdiğini, ancak gerçek verimlilik artışı, fabrika düzenlemesinin ve tekil ekipmanların yeni teknoloji etrafında yeniden yapılandırılmasıyla ortaya çıktığını gösteriyor. AI açısından bakıldığında, birçok şirket hâlâ kısmi denemeler veya araç biriktirme aşamasında olup, daha derin süreç yenilemesine henüz geçmemiştir.
Yorumlar, Token kullanım yarışmasının gerileşmesinin temel nedeninin, "ne kadar kullanıldı" sorusunu çözmek yerine "ne oluşturuldu" sorusunu çözmemesi olduğunu belirtiyor. Şirketler için AI'nın değeri nihayetinde model çağırma sıralamalarında değil, ürün teslimi, iş modeli ve gelir performansında ortaya çıkar.
