Yalancı adla Zeitgeist yazan bir araştırmacı, yapay zeka için bellek talebinin, dünyada şu anda üretilebilen miktardan katlarca daha fazla olduğunu söyledi. Onun görüşüne göre, bellek üreticilerinin hisseleri, tarihi yükseklerle değil, hesaplama ihtiyacının gerçek gereksinimleriyle değerlendirilirse mevcut seviyelerden on kat artabilir.
Zeitgeist verdi çarpıcı bir örnek: Geçen yıl Eylül'de Micron hisselerine yapılan 50.000 dolarlık bir yatırım bugün yaklaşık 489.000 dolar değerindedir. Ona göre bazı yatırımcılar bu hareketi kaçırdıklarını düşünürken, diğerleri "büyük oyuncuların pozisyonlarından çıkması için kullandığı likidite" olmaktan korkuyor. Analist, bu fırsatı bellek talebinin aritmetiği üzerinden farklı bir şekilde değerlendirmeyi öneriyor.
Neden Bellek Darboğaz Haline Geldi
Her hızlandırıcı, genişletilemeyen sabit bir miktar yüksek hızlı bellek olan HBM ile donatılmıştır. Analistlere göre, standart bir H100 çipi yalnızca 80 GB bellek taşır, daha yeni nesiller ise en fazla 192 GB sunar ve gelecekteki B300 ise 288 GB belleğe sahip olacak. Bu üst sınır, tek bir hızlandırıcının nasıl çok talebi işleyebileceğini belirler.
Ana yük, model ağırlıklarından değil, her üretilen kelimeyle büyüyen所谓的 KV önbelleğinden gelir. Zeitgeist’in hesaplamalarına göre, 128.000 tokenlik bir bağlamla bir oturum yaklaşık 20 GB bellek gerektirir. Sadece dört böyle oturum, tek bir H100’un kaynaklarını tamamen tüketecektir.
Oturum başına bellek kullanımı, bağlam penceresi boyutuna ve her H100 akseleratördeki oturum sayısına bağlıdır. Kaynak: Zeitgeist
Claude Opus 4.8 veya GPT-5.5 gibi gelişmiş modeller için gereksinim daha da yüksektir: tek bir uzun istek için 40 GB'dan 100 GB'a kadar. Analistlere göre, bu nedenle her ek gigabayt bellek, ağırlığı kadar altın değerindedir; Micron ve SK Hynix gibi üreticiler fiziksel olarak üretimi yeterince hızlı şekilde ölçeklendiremiyor.
Yapay Zeka Ajanı Etkisi ve Talep Farkı
Zeitgeist'e göre temel değişim, basit sohbet botlarından AI ajanlarına geçişdir. Normal bir soru hafızaya neredeyse hiçbir yük getirmese de, araçları bağımsızca çağırıp bağlam biriktiren bir ajan kolayca 100.000 token veya daha fazlasına ulaşabilir. Paralel olarak on tane böyle ajan çalıştıran tek bir bilgi çalışanı yaklaşık 152 GB hafıza gerektirecektir.
Paralel sohbetler ve agensiyon oturumları sırasında her bilgi çalışanı başına maksimum bellek kullanımı. Kaynak: Zeitgeist
Analist, dünya çapında yaklaşık 250 milyon bilgi işçisi olduğunu belirtti. Bu sayı, aynı anda çalışan ajan oturumları sayısı ile çarpıldığında bellek talebi sadece artmıyor, “patlıyor.” Onun tahminine göre, kişi başına günlük 100 ajan oturumu ile dünya, 2026 yılında üretilecek belleğin yaklaşık 60 katına ihtiyaç duyacaktır.
Zeitgeist, algoritmaların zamanla bellek kullanımını azaltacağını kabul etti, yeni “dikkat yöntemlerinin” yükü dört ila sekiz kat azaltma potansiyeline sahip olduğunu belirtti. Ancak onun görüşüne göre, talep çok daha hızlı bir şekilde artıyor: agenter basit sohbetleri yerine geçiriyor, bağlam pencereleri 128.000’den 10 milyon token’e doğru genişliyor ve her bir çalışan tarafından kullanılan AI kullanımı sıfırdan yüzlerce oturuma doğru ilerliyor.
Analiste göre, dil modellerinin "günlük yaşamın her yönüne işlendiği" bir dünyada hafıza kritik bir kaynak haline gelir. Tahminine göre, bunu üreten şirketler önceden görülmemiş gelirler elde edecektir.
SK Hynix, AI bellek talebinin artmasıyla Samsung'u geçti
AI hafıza patlamasının ölçeği, çip piyasasını zaten yeniden şekillendiriyor. Güney Koreli hafıza üreticisi SK Hynix, yapay zeka iş yükleri için kullanılan yüksek bant genişliğine sahip hafıza çiplerindeki güçlü pozisyonu sayesinde, ülkenin en değerli halka açık şirketi konumuna Samsung'u geçti.
Zeitgeist için bu değişim, hafıza üreticilerinin AI altyapı yarışının en büyük kazanıcılarından bazıları haline geldiğine dair daha geniş tezini destekliyor. HBM talebi, arzından daha hızlı arttıkça, gelişmiş hafıza çipleri üretebilen şirketler gelir ve değerlemelerinde keskin bir artış görebilir.
