2026 yılının baharında, Kuzey Amerika'nın bulut hesaplama devi şirketlerinin kar raporları haftası, ortak bir "acı gün" haline geldi.
Microsoft Azure bölümünün kâr payı ilk kez 50 milyar doları aştı, Azure %39 büyüdü, rapor yayımlandıktan sonra hisse senedi yaklaşık %10 düştü; Amazon AWS geliri 13 çeyrektir en hızlı büyüme hızını kaydetti, bir sonraki gün hisse senedi %11 düştü; Google Cloud geliri %48 arttı, ancak hisse senedi hâlâ piyasa sonrası dönemde artıştan düşüşe döndü.
Tek neden: para. Ya da kontrolü kaybeden AI faturaları.
Büyük şirketlerin finansal raporlarına baktığınızda, Microsoft'un tek çeyreklik sermaye harcaması 37,5 milyar dolar olup, %66 artış gösterdi; yıllık bir rehber verilmese de, analistler, bu çeyreklik sermaye harcama eğilimi devam ederse, yıllık harcama 1 trilyon doların üzerinde olacağını belirtiyor; Amazon, 2026 yılında 200 milyar dolar harcama yapacağını duyurdu; Google ise 175-185 milyar dolar harcama planlıyor, bu miktar 2025 yılına göre neredeyse iki katı.
Üç büyük şirketin toplam harcaması 500 milyar doları aştı, bu da Norveç'in 2024 yılı yıllık GSYİH'sına eşdeğerdir.
Piyasa sermayesi neyi endişe ediyor? Bulut işi büyümesi yeterli değil mi? Kesinlikle değil. Daha fazla büyük müşteri kullanıldıkça, bulut sağlayıcılarının faturaları daha kolay “patlıyor”. Silicon Valley'de, "nasıl para alınacak" etrafında gizli bir savaş sürüyor. Kazanan ve kaybeden, tüm AI endüstri zinciri değer dağıtımını yeniden şekillendirecek.
01 Token modu derin kullanıcıları cezalandırıyor mu?
Bir göz ardı edilemez gerçek, Token ücretlendirme modelinin, AI'nın yaygınlaşmasında en büyük katkıda bulunanlardan biri olması.
2024 yılının başlarında Çin'de günlük ortalama token çağrısı 100 milyar idi; 2025 yılının sonuna kadar 100 trilyona yükseldi; bu yıl Mart'ta 140 trilyonu aştı, iki yıl içinde bin katın üzerinde artış sağlandı.
Aynı zamanda, “Küçük Karides”in popülerleşmesiyle birlikte AI, “oyuncak”tan “üretim aracına” dönüştü ve Token modelinin dezavantajları ortaya çıkmaya başladı.
Bir AI ajanı örneği olarak, geleneksel bir sohbet botu bir soruyu yanıtlamak için yüzlerce ila binlerce token tüketir. Ancak bağımsız görevleri yerine getirebilen bir AI ajanı, her yürütme sırasında çoklu çıkarımlar yapar, araçları tekrar tekrar çağırır ve büyük miktarda bağlam okur. Endüstri uzmanlarının hesaplamalarına göre, ajansların token tüketimi sıklıkla onlarca kat artar; karmaşık görevlerde bu oran normal diyalogların yüzlerce veya binlerce katına ulaşabilir.
OpenAI, 2026 Mart'ta video üretme aracını Sora'yı kapattı; bunun nedenlerinden biri gelirlerinin giderleri karşılamamasıydı. Xinjing Bao, SemiAnalysis analiz kuruluşunun hesaplamalarına dayanarak, Sora'nın günlük işletme maliyetinin yaklaşık 15 milyon dolar, yıllık maliyetinin ise 5,4 milyar dolar olduğunu bildirdi.
OpenAI projesinin lideri şu anda şunu açıkça ifade etti: "Mevcut ekonomik model tamamen sürdürülemez." Video üretimi, metin ve görüntü üretimiyle karşılaştırıldığında çok daha yüksek hesaplama gücü tüketiyor; bir video üretimi için gereken GPU kaynakları, ChatGPT'nin onlarca soruyu yanıtlaması için yeterli. Bu da temel iş kaynaklarını ciddi şekilde baskı altına alıyor.
Token modunda, ne kadar çok AI kullanılırsa, fatura o kadar kontrol dışına çıkar. NVIDIA CEO'su Jensen Huang, gelecekte NVIDIA mühendislerinin her birinin kendi "yıllık Token bütçesi" olacağını ve yüksek maaşlı bir mühendisinin bir yıl boyunca çok az Token tüketmesinin garip görüleceğini söyledi.
Bir sektör, "ne kadar çok kullanılırsa o kadar korkulur" aşamasına gelmişse, bu ücret modelinde temel bir sorun olduğunu gösterir.
Ne kadar çok kullanırsanız, o kadar çok kazanırım, çok iyi geliyor. Ancak büyük müşteriler, AI faturalarında büyük dalgalanmalarla karşılaştığında, CFO'lar ölçeklenebilir bütçeleri onaylamaktan çekiniyor. Token modeli, en çok korunması gereken kişileri, yani en çok kullanım yapan ve en derin senaryolara sahip olan başta gelen müşterileri cezalandırıyor. Bu, bulut sağlayıcıların uzun vadeli çıkarlarıyla tamamen çelişiyor.
Bu bağlamda, Kuzey Amerika bulut sağlayıcıları sırayla PTU: Önceden Atanan Bant Genişliği Birimi adlı yeni silahları çıkarttı.
Kısaca, müşteri belirli bir hesaplama kapasitesi miktarını önceden satın alır ve aylık, üç aylık veya yıllık sabit bir ücret öder; bu, gerçek Token tüketim miktarından bağımsızdır. Token modeli “ne kadar yersek öderiz” iken, PTU “aylık tüm-you-can-eat” modelidir. Müşteri maliyet belirginliği kazanır, bulut sağlayıcı ise müşteri bağlılığını sağlar.
Arka plandaki oyun mantığı tamamen değişti.
Token modunda, taraflar "sıfır toplamlı bir oyun"dur; müşteri para tasarrufu ettiğinde bulut üreticisi daha az kazanır, müşteri daha fazla harcadığında bulut üreticisi daha çok kazanır. Ancak büyük müşteriler, maliyet kontrolü kaybı korkusu nedeniyle kullanımını azaltır ve bu da bulut üreticisinin gelir artışının beklentilerin altında kalmasına neden olur.
PTU modunda oyun “pozitif toplam” hâline gelir, müşteriler bütçelerini kilitlendikten sonra AI kullanımını artırmaya cesaret eder ve bulut sağlayıcıların gelir artışı daha sürdürülebilir olur. Temelde, risk müşteri tarafından bulut sağlayıcı tarafına aktarılır ve müşteri ilişkilerinin derinlemesine bağlanmasını sağlar.
Guoxin Securities, Çin Mobile İnternet ücretlerindeki değişimi bir karşılaştırma ile açıkladı.
2G dönemi, veri kullanımı KB bazında ücretlendiriliyordu, 0,01 yuan/KB; kullanıcılar veri kullanırken kan damlası gibi harcıyorlardı. 3G dönemiyle birlikte ücretlendirme MB cinsinden hale geldi, 150 yuan ile 3 GB paketleri sunuldu ve kullanıcılar daha serbest hareket etmeye başladı. 4G dönemi, "hız artırma ve ücret düşürme" politikasıyla sınırsız veri paketlerinin patlamasını tetikledi; 2016 yılında Tencent'in "Daa Wang Kartı" gibi 19 yuan aylık paketler ve Tencent ailesi uygulamalarında veri kullanımı ücretsiz hale geldi ve kullanıcılar tamamen "veri satın alma"dan "hizmet satın alma"ya geçti. 5G dönemiyle birlikte ücretlendirme daha da "hız tabanlı sınıflandırma"ya dönüştü ve veri miktarı artık fiyatlandırma merkezi değil.
Her faturalama modeli değişikliği, bir zincirdeki güç dengesinin yeniden dağıtımıdır. Operatörler, KB başına ücretlendirme modelinden vazgeçerek kullanıcıların aylık veri kullanımını 30 MB'dan 10 GB'ın üzerine çıkarmıştır ve toplam pasta boyutu yüzlerce kat artmıştır.
Bugünki bulut sağlayıcı seçimleri, eski operatörlerinkinden farklı değil. Kısa vadeli brüt kar marjlarını feda ederek uzun vadeli sözleşmelerin kesinliğini kazanmayı tercih ediyorlar. Guoxin Securities raporu, PTU dönüşümünün bulut iş modeli brüt kar marjı yapısını “yüksek esneklikte dalgalanma”dan “yüksek dirençli” hale getireceğini belirtiyor; yani kısa vadeli baskı altında kalırken, uzun vadede daha sağlıklı ve daha istikrarlı hale gelecek.
02 Üç Büyüklerin Stratejilerindeki Farklılıklar
Microsoft, AWS ve Google, görünürde hepsi PTU'yu destekliyor, ancak içsel stratejileri tamamen farklı.
Microsoft, ekosistem entegrasyonuna dayanır. Microsoft'un silahı, Windows, Office 365 ve GitHub'dan oluşan geniş ekosistemdir. "Azure AI Taahhüt Programı"nı piyasaya sürerek kurumsal müşterilerden 1-3 yıllık tüketim taahhüt anlaşmaları imzalamayı teşvik eder. Bu çeyrekte, Microsoft'un ticari tamamlanmamış yükümlülükleri %100'den fazla artarak 625 milyar dolara ulaşmıştır. Bunun %45'i, OpenAI ile yapılan 250 milyar dolarlık yeni anlaşmalardan gelmektedir.
Microsoft'in hesapları çok iyi; en üst düzey fiyatlandırma gücü, müşterilerin AI maliyetlerini ayrı ayrı hesaplayamamasını sağlamaktır. AI, Word'te bir butona dönüşünce, bütçe doğal olarak yazılım abonelik ücretine dahil edilir. Ancak tek bir müşteriye aşırı bağımlılık, piyasa endişelerine yol açmaktadır; OpenAI iş yükü altında kalırsa, doğrudan Microsoft'u etkileyecek zincirleme tepkiler ortaya çıkar.
AWS, maliyet avantajına dayanır. AWS'nin temeli, kendi geliştirdiği Trainium ve Inferentia çipleri ile küresel ölçekli bulut altyapısıdır. AWS, müşterilere ihtiyaç duyulan fiyattan önemli ölçüde daha avantajlı fiyatlar sunmak için "AI/ML Tasarruf Planı"nı yoğun bir şekilde teşvik eder.
Amazon CEO Andy Jassy, gelir raporu toplantısında çok sert bir ifade kullandı: "Yıllık gelirin 142 milyar dolar temelinde %24'lük yıllık büyüme, rakiplerin çok daha küçük bir tabandan daha yüksek yüzde büyüme sağlamasıyla tamamen farklıdır."
AWS, uç düzey tedarik zinciri verimliliğiyle bir avantaj oluşturur ve birim hesaplama maliyeti endüstride en düşüktür, bu nedenle fiyat savaşlarından korkmaz. Finansal rapor toplantısında yöneticiler, "yeni hesaplama kapasitesinin hızlı bir şekilde gelir getirebileceğini" birkaç kez vurguladı. Bu da, ölçek ekonomisinin nihayetinde her şeyi ezdiğini öngördüğü anlamına gelir.
Google ise performans primiyle kazanç elde ediyor. Google, AI teknolojisi birikiminde en derin temele sahip olup, kendi geliştirdiği TPU'yu yedinci nesile kadar geliştirdi ve Gemini modelinin aylık etkin kullanıcı sayısı 750 milyona ulaştı. Dördüncü çeyrekte Google Cloud geliri %48 arttı ve bu artış hızı rakiplerini ciddi ölçüde geride bıraktı.
Google, performansa en yüksek düzeyde ihtiyaç duyan müşterileri çekmek için "indirim kullanımını taahhüt etme" özelliğini AI platformuna genişletiyor. En çok müşteriyi değil, en karlı üst düzey müşterileri kendi yanında tutmayı hedefliyor.
Apple ile olan iş birliği kritik bir adım daha: Google, Apple'ın tercih edilen bulut hizmet sağlayıcısı haline gelmiş ve her iki şirket de temel modeller geliştirmek için iş birliği yapıyor; bu da Google AI teknolojisinin Apple cihazları aracılığıyla küresel kullanıcılara ulaşmasını sağlayacak.
Üç strateji, üç farklı ekonomik koruma çemberini temsil eder: Microsoft dönüşüm maliyetiyle, AWS ölçek ekonomisiyle, Google ise teknolojik öncülükle. PTU dönüşümünden en çok kimin kazanacağını belirlemek, temel olarak bu koruma çemberlerinin uzun vadeli sözleşme kilitlenme süresi boyunca etkili kalıp kalmayacağını değerlendirmektir.
Ancak PTU dönüşümünün etkisi bulut sağlayıcılar ve büyük müşteriler arasında kalmayacak, tedarik zinciri boyunca üst akıma çip üreticilerine ve alt akıma uygulama sağlayıcılarına yayılacaktır.
Üst akış çip sağlayıcıları ilk olarak fayda sağlar. Token modelinde, bulut sağlayıcılarının hesaplama gücü satın alımı “pulsatiftir”—trafikte ani artış olduğunda acil sipariş verilir, düşük dönemlerde kaynaklar boş kalır. PTU modelinde, uzun vadeli sözleşmeler bulut sağlayıcılarının üst akışa daha düzgün ve öngörülebilir siparişler vermesini sağlar.
Microsoft, 2026 yılı içinde AI hesaplama gücünü %80'den fazla artırmayı planlıyor ve gelecek iki yıl içinde veri merkezi kapasitesini iki katına çıkarıyor. NVIDIA gibi çip üreticilerinin üretim planlamaları daha rahat hale gelecek ve tedarik zinciri verimliliği önemli ölçüde artacak.
Alt katman AI uygulama sağlayıcıları hızla yeniden yapılanıyor; PTU modeli altında büyük müşteriler kaynakları kilitledikten sonra, küçük ve orta ölçekli müşterilerin kaynak havuzları daralabilir. AI uygulama girişimi için engeller yükseliyor; geçmişte Token bazlı ihtiyaca göre ödemeyle başlatılabilecek projeler, gelecekte daha yüksek başlangıç maliyetleriyle karşı karşıya kalabilir. Bununla birlikte, müşterilerin PTU kullanımını optimize etmeye yardımcı olan araç katmanı şirketleri—AI yükü yönlendirme, maliyet yönetimi SaaS—yapısal fırsatlar yakalayacaktır.
Guoxin Securities raporu, fiyatlandırma modeli değişiminin dönüm noktasında olduğunu ve gelecek yıl içinde değişimin etkilerinin tamamen absorb edildikten sonra siparişlerin uzun vadeli anlaşmalaşma eğiliminin gelir ve kâr büyümesi açısından belirsizliği önemli ölçüde azaltacağını gösteriyor.
03 Sonuç
Token'dan PTU'ya geçiş, AI endüstrisinin "vahşi büyüme" deneme aşamasından "özenle geliştirme" ticari olgunluk aşamasına geçişini işaret eder.
KB bazlı faturalamadan sonsuz veri kullanımına kadar olan mobil internetin geçmişi, tarife modellerinin olgunlaşması sayesinde kısa videolar, canlı yayınlar ve bulut oyunları gibi trilyon dolarlık pazarların ortaya çıkmasına neden oldu. Bugünki AI faturalama ağrıları, bir sonraki “TikTok seviyesinde” AI-native uygulamaların yolunu açıyor.
Elbette, PTU son nokta olmayacak. Model-as-a-Service (MaaS)'in yükselişiyle, AI faturalandırma daha da "iş sonucuna göre ödeme" yönünde ilerleyebilir. Fiyatlandırma hakkının mücadelesi, AI endüstrisinin gelişimini gözlemlemenin temel ipucu olmaya devam edecektir.
Bu süreçte, gerçek kazananlar, "kilitli müşteriler"i "hizmet verilen müşteriler" haline getiren oyuncular olacaktır; fiyat belirleme gücü sıfır toplamlı oyunlardan pozitif toplamlı ortak kazançlara geçtiğinde, AI'nın ticarileştirilmesi gerçek yetişkinlik aşamasına ulaşmış olur.
Bu yazı, WeChat hesabından "Şirket Değeri Listesi" (ID: shizhibang2021) tarafından yayınlanmıştır, yazar: Şirket Değeri Listesi ekibi
