Çinli AI modelleri maliyetleri düşürüyor ve eğitim ile çıkarım verimliliğinde ABD rakiplerini geride bırakıyor

DeepSeek, V3 modelini yaklaşık 5,58 milyon ABD dolarına eğitti. Bağlam olarak, ABD rekabetçileri genellikle öncü seviye modeller için onlarca milyondan yüzlerce milyon ABD dolarına kadar harcıyor.

May 2026'da DeepSeek, V4-Pro modeli üzerindeki fiyatları kalıcı olarak %75 indirdi. Önbelleğe alınmış giriş maliyetleri, milyon token başına RMB 0,025'e kadar düştü.

Bu aşağı doğru yarışta DeepSeek yalnız değil. Çinli firma 01.ai, milyon token başına yaklaşık 14 sentlik çıkarım sunuyormuş ve Çin API fiyatlandırmasını dünyadaki en düşük olarak konumlandırıyor.

OpenRouter'daki Çinli AI modelleri, ABD alternatiflerine kıyasla maliyet avantajları sayesinde hacimde 5 kat büyüme kaydetti.

Reklam

Bunu nasıl yapıyorlar

Çinli geliştiriciler, parametre etkinleştirmeyi 671 milyar'dan sadece 37 milyar'a düşüren seyrek MoE mimarileri inşa etti. Bu, çıkarım katmanında %90-97'ye kadar hesaplama maliyeti azalmasına yol açtı.

Mimariyi aşarak, Çin takımları her bir hesaplamanın hesaplama taleplerini azaltan FP8 gibi düşük hassasiyetli eğitim yöntemlerini benimsemiştir.

DeepSeek’in R1 akıl yürütme modeli, 80 saat boyunca 512 adet H800 çipi kullanılarak sadece 294.000 dolarla eğitildi.

Sınırlamadan doğdu

2023'ten beri ABD ihracat kontrolleri, Çinli şirketlerin yüksek performanslı Nvidia donanımına erişimini kısıtladı. H100 ve onun takipçileri etkili bir şekilde yasaklandı. Çinli geliştiriciler, ihracat kurallarına uygun şekilde tasarlanmış düşürülmüş bir çip olan H800 ile çalışıyor.

Bu verimlilik sınırını kapsayan büyük Çinli oyuncular arasında Alibaba’nın Qwen’i, Moonshot AI’nin Kimi’si, Zhipu AI’nin GLM’si ve ByteDance’ın Doubao’su ile DeepSeek yer alıyor.

Bu, yatırımcılar için ne anlama geliyor

Eğer öncü düzeyde AI performansı, 100 milyon doların üzerindeki maliyetler yerine 6 milyon doların altında eğitim maliyetleriyle elde edilebilirse, ABD AI liderlerini çevreleyen sermaye harcaması koruması daha ince görünmeye başlıyor.

Kripto ve Web3 ekosistemi için daha ucuz çıkarım, AI destekli dağıtık uygulamalar, orak ağları ve zincir içi analiz araçlarının çalıştırma maliyetini doğrudan azaltır.

Çinli geliştiricilerin seyrek MoE mimarileri aracılığıyla sağladığı %97 hesaplama azalmaları sadece teknik başarılar değil, aynı zamanda fiyat sinyalleridir ve piyasalar nihayetinde fiyat sinyallerine uyar.