DeepSeek, API maliyetlerini 100 kat azaltıyor ve Yapay Zeka Altyapısının Merkezileştirilmesi Üzerine Tartışmalar Yarattı

—— Gonka'nın LA Hacks 2026'daki konuşmasından başlayarak

26 Nisan'da DeepSeek, V4 serisi API'si için yeni fiyatlandırma duyurdu: Tüm giriş önbellek uyum fiyatları, ilk satış fiyatının onda birine indirildi; Pro sürümüne geçici indirim eklenince, milyon Token işleme maliyeti sadece 0,025 yuan oldu — bir yıl önceye göre neredeyse yüz kat daha ucuz. Aynı gün A hisse senedi hesaplama sektörü tümüyle sınır üstü artış yaptı ve piyasa ruhu yükseldi.

Ancak coşkunun ardında, kimse doğrudan tartışmadığı bir sorun var: Modeller giderek daha ucuza düşerken, modelleri çalıştırmak için gerekli hesaplama gücü giderek daha fazla merkezileşiyor.

Veriler yalan söylemez. 2025 dördüncü çeyrekte, Microsoft, Amazon, Meta ve Google'ın toplam sermaye harcamaları, 64% artarak 118,6 milyar dolara ulaştı; 2026 yılı boyunca toplam sermaye harcamalarının %53 daha artarak 570,8 milyar dolara ulaşması bekleniyor. Google, aynı dönemde 2026 yılı TPU çip teslim hedefini 50% artırarak 6 milyon adete çıkardı. NVIDIA H100 serisinin teslim süresi, bazı pazarlarda birkaç aya kadar uzamıştır.

Model katmanındaki fiyat belirleme gücü geliştiricilere doğru kayıyor, ancak hesaplama gücü katmanındaki kontrol, daha hızlı bir şekilde az sayıda devasa şirkete doğru yoğunlaşıyor. Bu, AI çağının gizli ama derin bir çelişkisidir.

Gonka

Bu bağlamda, 24 Nisan 2026'da Gonka protokolü ortak kurucusu Daniil ve David Liberman, LA Hacks 2026'nın ana konuşmacısı olarak sahneye çıktı. Bu yıl UCLA'nın en büyük üniversite hackathonu, Liberman kardeşlerin ana konuşmacı olarak yer aldığı bu etkinlikte, sektörüne girmek üzere olan yüzlerce üst düzey mühendis karşısında şu soruyu sundu: Merkeziyetsiz hesaplama gücü hâlâ zamanında mı?

Birinci: Fiyat indirim dalgasının diğer yüzü

DeepSeek V4'in fiyat düşürme mantığı, görünürde teknolojik ilerlemenin getirdiği verimlilik avantajıdır — yeni dikkat mekanizması, Token boyutunu sıkıştırır ve DSA seyrek dikkat ile birlikte hesaplama ve grafik bellek gereksinimlerini büyük ölçüde azaltır. Ancak fiyat düşüşünün devam edebilmesi, bir yerde yeterince fazla ve yeterince ucuz hesaplama gücü mevcut olmasına bağlıdır.

Gerçek şu ki, bu "yeterince yeterli" hesaplama gücü kaynağı, dünya çapında hızla az sayıda düğüme doğru birleşiyor. Fiber optik lideri Lumentum CEO'su Michael Hurlston, mevcut trendler doğrultusunda şirketin 2028 yılındaki üretimi neredeyse tamamen satıldığını belirtti. Bu, tek bir şirketin sorunu değil, tüm AI altyapısı tedarik zincirinin hızla artan talep karşısında yaşadığı ortak gerginliktir.

Daniil, LA Hacks'te yaptığı basit ancak güçlü karşılaştırmada, Bitcoin ağının hesaplama gücüyle Google, Microsoft ve Amazon'un üç bulut veri merkezinin toplam gücünü karşılaştırdı—ancak bu hesaplama gücü ne yapıyor? Kimse cevabını ihtiyaç duymayan bir hash bulmacasını çözüyor. Küresel boşta kalan GPU hesaplama gücü de aynı şekilde: Oyuncuların bilgisayarlarındaki ekran kartları, üniversite laboratuvarlarındaki sunucular, küçük ve orta ölçekli bulut sağlayıcıların elindeki fazla kapasite bir araya getirildiğinde büyük bir ölçek oluşturuyor, ancak koordinasyon mekanizması eksikliği nedeniyle AI çıkarımında kullanılamıyor.

Gonka, küresel olarak dağılmış boşta kalan GPU'ları, gerçek AI çıkarım görevlerini yerine getirebilecek bir ağa dönüştürmek için iş kanıtı teşvik mekanizmasını kullanarak bu koordinasyon sorununu çözmeye çalışıyor.

İkinci: Akıl yürütme yeni savaş alanı

DeepSeek'in fiyat indirimi, Çin internetinde "AI eşitliği" üzerine geniş bir tartışma yarattı. Ancak gözden kaçırılan bir detay var: indirim, "hesaplama maliyeti" değil, "çağrı fiyatı" üzerinde yapıldı. AI uygulamalarının ölçeklenmesiyle birlikte, çıkarım çağrılarının artışı üssel düzeyde — endüstri tahminlerine göre, 2026 yılına kadar çıkarımın, küresel AI hesaplama tüketiminin yaklaşık üçte ikisini oluşturacağı tahmin ediliyor.

Bu ne anlama geliyor? Her bir ölçek azalmasıyla çağrı fiyatı düştükçe, gereken toplam hesaplama gücü miktarı daha fazla olur, daha az olmaz. Büyük modellerin “demokratikleşmesi”,某种程度上 hesaplama katmanının merkeziyete doğru ilerlemesini hızlandırıyor—çünkü yalnızca büyük ölçekli hesaplama gücüne sahip oyuncular, çok düşük kar marjlarıyla çıkarım hizmetlerinin işletimini sürdürebiliyor.

Bu, yapısal bir kilitlenme halindedir: çıkarım tarafındaki fiziksel hesaplama gücünü kim kontrol ederse, AI çağındaki gerçek altyapı giriş noktasını o kontrol eder. Bu bakış açısıyla, merkeziyetsiz hesaplama ağı的意义, sadece %50 daha ucuz bir maliyet optimizasyonu değil, merkezi kilitlenme tamamlanmadan önce yapısal bir alternatif yol sunmaktır.

Üç: Genç yapımcılara yönelik gerçek sorular

LA Hacks katılımcıları — Kaliforniya'nın önde gelen üniversitelerinden gelen mühendisler ve ürün uzmanları — yakında kendi ürünlerini hangi hesaplama katmanına inşa edecekleri konusunda pek romantik olmayan bir mühendislik kararı ile karşı karşıya kalacaklar.

AI ürününüzün çıkarım işlemi hangi sunucuyu kullanıyor?

Bu platform fiyatlandırma veya erişim politikalarını değiştirdiğinde, taşıma yeteneğiniz var mı?

Oluşturduğunuz kullanıcı ölçeği, kendiniz için değer mi yaratıyor, yoksa platforma çip mi sağlıyor?

Bu sorunlar Web2 dönemi boyunca geliştiriciler tarafından zaten deneyimlenmişti: uygulamaların kaderi, platform algoritmaları veya dağıtım kurallarıyla derin bir şekilde bağlı olduğunda, “bağımsızlık” sürekli yeniden tanımlanması gereken bir kelimeye dönüşmüştür. AI dönemi hesaplama gücü bağımlılığı, aynı mantığı altyapı katmanına kopyalayacak ve geçiş maliyetleri daha yüksek olduğu için kilitlenme etkisi daha da artacaktır.

Gonka

Bir hackathon, içsel bir ironiye sahiptir: 36 saat içinde en az kaynakla en hızlı şekilde çalışır hale getirilebilir bir şey oluşturma—bu tam olarak dezentralize ağ teşvik mekanizmasının hedeflediği durumdur. Daniil, LA Hacks'te sahneye çıkarak sadece Gonka'yı anlatmak için değil, bu insanlara şunu sormak için çıkmıştır: Gelecekte yapacağınız iş, bu merkezi eğilimi hızlandırmak mı, yoksa yeni imkânlar mı yaratmak mı?

Dört: PoW 2.0: Bir mühendislik sorunu

Gonka, iş kanıtı teşvik yapısını hash hesaplamadan AI çıkarımına yeniden odaklayarak ağdaki neredeyse %100 hesaplama katkısını gerçek görevlere doğrudan bağlar. Bu mekanizmanın bir mühendisliksel kritik gereksinimi vardır: AI çıkarım görevleri doğrulanabilir ve tekrarlanabilir olmalıdır—aynı model ağırlıkları, aynı rastgele tohum ve giriş verildiğinde, herhangi bir düğüm hesaplama sonucunu yeniden oluşturup geçerliliğini doğrulayabilir. Bu, Gonka'nın akademik bir prototipten çalışır bir ağa dönüşmesinin temel mühendislik zorluğudur.

Ekonomik açıdan bu mekanizmanın önemi, token değerinin likidite duygusundan ziyade fiziksel hesaplama gücü maliyetine doğal olarak bağlanmasıdır. Hesaplama gücü sağlayan madenciye ödül verilir, hesaplama gücü kullanan geliştiriciler ücret öder ve tüm sistemin teşvik döngüsü, herhangi bir aracının iyi niyetine bağlı kalmaz.

Elbette, teknik mümkünlük sadece bir parçasıdır. Daha zor soru şudur: Hesaplama gücü talebinin hızla arttığı ve büyük oyuncuların sermaye harcamalarının milyarlarca dolarla ölçüldüğü bir dönemde, topluluk tarafından kendi kendine katkıda bulunularak kurulan dağıtılmış hesaplama gücü ağı, ölçek açısından gerçek bir rekabet oluşturabilir mi?

Gonka'nın erken verileri bir referans noktası sunuyor: ana ağın başlatılmasından bir yıl kadar sonra, ağın toplam hesaplama gücü 60 adet H100 eşdeğerinden daha fazla 10.000 adete ulaştı; bu hız, merkezi bir koordinasyon yerine küresel yüzlerce bağımsız düğümün kendi kendine bağlanmasıyla sağlandı. Bu, ölçek sorununun çözüldüğünü kanıtlamaz, ancak teşvik mekanizmasının erken büyüme için etkili bir şekilde çalıştığını gösterir.

Beşinci: Pencere süresi ile ilgili sorular

Tarihsel olarak, altyapının kontrolü genellikle erken aşamada hızla konsantre olur—demir yolu çağında böyleydi, internet çağında böyleydi, mobil internet çağında da böyleydi. Her seferinde, standartlar katılaşmadan önce bir yer bulanlar olmuş, bazıları ise merkezileşme tamamlandıktan sonra katılım hakkının büyük ölçüde daraldığını fark etmiştir.

AI hesaplama altyapısı şu anda hangi aşamada? Dört büyük bulut sağlayıcının 2026 yılı için beklentilerine göre 570,8 milyar dolarlık sermaye harcamasıyla merkezileşme hızlanıyor; ancak geliştiricilerin gerçek kullanım modellerine bakıldığında, tedarik tarafında hâlâ etkili bir şekilde entegre edilmemiş büyük miktarlarda kaynak bulunuyor. Bu boşluk, merkeziyetsiz ağların yapısal olarak var olabileceği alandır.

Daniil, konuşmasında bir karşılaştırma yaptı: 2000 yılında internet balonu patladıktan sonra kalan şeyler, çöpler değil, dünyanın dört bir yanına yayılmış fiber optik ağlar oldu ve bu ağlar, sonraki yirmi yıl boyunca dijital ekonominin çalışmasını sağladı. AI altyapı yatırımı dalgası çekildikten sonra kalan hesaplama protokolleri ve teşvik mekanizmaları, bir sonraki döngünün altyapısını oluşturacak—sorun ise, hangi protokollerin temel mantığı, baskı altında bile çalışmaya devam edebilecek kadar sağlam.

Bu, belirli bir projeye ilişkin bir soru değil, tüm merkeziyetsiz AI sektörünün doğrudan karşı karşıya gelmesi gereken bir sorudur: Yönetim tasarımı, tek bir noktadan kontrolün etkisini gerçekten engelleyebilir mi? Teşvik mekanizmaları ölçeklendikten sonra hâlâ etkili mi? Hesaplama ağı merkeziyetsizliği, teknik uygulama, token emisyonu ve yükseltme kararları olmak üzere üç boyutta aynı anda geçerli mi?

Sonuç

DeepSeek'in fiyat indirimi, "AI'nın demokratikleşmesi" hikayesini yeniden canlandırdı. Ancak demokratikleşen çıkarım çağrıları ve demokratikleşen hesaplama altyapısı, iki farklı şeydir. İlki şu anda gerçekleşiyor; ikincisinin gerçekleşip gerçekleşmeyeceği, önümüzdeki yıllarda bu konuyu sadece iyi bir hikaye olarak değil, çözülmesi değerli bir mühendislik sorunu olarak gören insanların sayısıyla ilgilidir.