Yapay Zeka Endüstrisi, Yedi Katmanlı Altyapıyla 'Token Dönemi'ne Giriyor

icon MarsBit
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
AI + kripto haber programı, artan AI çıkarım talebiyle endüstrinin 'model dönemi'nden 'Token endüstri dönemi'ne geçtiğini gösteriyor. GoodVision AI, enerji, GPU üretimi ve Token dağıtımını kapsayan yedi katmanlı bir altyapı detaylandırıyor. AI Agent kullanımının artmasıyla yeni Token listelemeleri bekleniyor ve Token tabanlı sistemler üretim ve tüketimde merkezi hale geliyor.

AI çağının gücü, modelden tokenlere geçti

Geçtiğimiz iki yıl boyunca AI endüstrisinin ilk sahnesi, büyük şirketlerin başlattığı “büyük model savaşları” etrafında döndü. Parametre sayısı yüz milyarlarca düzeyinden trilyonlara yükseldi, eğitim maliyeti on milyonlarca dolarlardan yüz milyonlarca dolara çıktı ve GPU kümeleri binlerce karttan on binlerce kata genişledi. Herkes, hangi modelin daha güçlü olduğunu, hangisinin AGI’ye daha yakın olduğunu tartışıyor, sanki AI rekabetinin son noktası büyük modellerin kendilerinin performansından ibaretmiş gibi.

Ancak zaman 2026 yılına gelir, AI endüstrisinin harekete geçiren mantığı değişir. JPMorgan'ın en son raporuna göre, gelecekte AI altyapısının sürekli genişlemesini harekete geçirecek olan, model eğitimi değil, küresel çapta yoğun AI çıkarımı (Inference) talepleri olacaktır. Gelecekte en çok hesaplama gücü tüketen, yalnızca büyük modellerin eğitimi değil, dünyanın dört bir yanındaki AI Ajanları olacaktır. Her çağrı, her etkileşim, her görev yürütümü temelde Token tüketimi anlamına gelir. AI endüstrisi, «model dönemi»nden «Token endüstrisi dönemi»ne geçmektedir.

Gelecekte AI dünyasını çalıştıracak olan, sadece model değil, Token etrafında oluşan üretim, dağıtım, planlama ve tüketim sistemidir. Özellikle AI Agent'ların büyük ölçekli olarak ortaya çıkmasından sonra, Token'ların nasıl gerçek zamanlı oluşturulacağı, bölgeler arasında dağıtılacağı, dinamik olarak planlanacağı ve verimli şekilde tüketileceği, tüm AI endüstrisinin en temel yeni sorusu olacaktır.

Huang Renxun'un yakın zamanda ortaya koyduğu gibi, AI sadece basit bir yazılım endüstrisi değil, elektrik ve internet gibi bir altyapı sistemidir. Onun “beş katlı kek” mimarisinde, AI endüstrisi enerji, çip, altyapı, model ve uygulama olmak üzere beş katmanlı bir yapıya ayrılır. AI endüstrisinin “eğitim dönemi”nden yavaş yavaş “çıkarım dönemi”ne geçmesiyle birlikte, GoodVision AI, tüm AI ekonomi zincirini bir Token etrafında dönen “yedi katlı kek yapısı” olarak anlar:

Birinci katman: Elektrik — AI çağı için enerji temeli
İkinci Kat: AIDC—Token Fabrikası
Üçüncü kat: GPU—Token üretim ekipmanı
Dördüncü Katman: LLM—Token üretim motoru
Beşinci Kat: Token Dağıtımı — AI Çağı'nın "Elektrik Şebekesi"
Altıncı Kat: Token Optimizasyonu ve Akıllı Planlama—AI Çağı'nın Beyni
7. Kat: AI Agent—Token Tüketim Uç Noktası

Enerji, GPU'dan AIDC ve kenar düğümlerine, ardından model çıkarımı ve akıllı zamanlama kadar, AI endüstrisi前所未有的 bir "Token endüstri sistemi" oluşturuyor.

Ancak şu aşamada, bu sistem hâlâ çok erken.

En gelişmiş GPU'ya sahip olanlar enerjiyle sınırlı; büyük AIDC'ler kurmuş olanlar etkili bir şekilde planlama yapamıyor; güçlü AI Agent'ler geliştirenler yüksek çıkarım maliyetleri ve gecikmelerle karşı karşıya kalıyor; kenar düğümlerine sahip olanlar ise birleşik bir ağ oluşturamıyor. Tüm zincir hızla gelişiyor olsa da, katmanlar arasında hâlâ büyük ölçüde bölünmüşlük, fazlalık ve verimlilik engelleri var.

Ancak bu yedi katmanlı altyapı gerçekten birbirine bağlanıp birlikte çalıştığında, yapay zeka endüstrisi bugünün "araçlar çağı"ndan, akıllı dünyanın "büyük ölçekli kabul çağına" gerçekten geçecektir.

Birinci kat: Elektrik — AI Çağı İçin Enerji

Sanayi devrimi kömür ve petrolü, internet çağında ise trafiği ve sunucuları rekabet ediyordu; ancak AI çağında en temel savaş yeniden enerjiye dönmektedir.

Çünkü AI nihayetinde elektrik tüketir. Büyük bir AI veri merkezinin elektrik tüketimi, orta boyutlu bir şehrinkine yaklaşmıştır. Dünya çapında yeni inşa edilen AIDC'ler (AI veri merkezleri), aynı sorunla karşı karşıya kalıyor: GPU satın alınabilir, arazi inşa edilebilir, ancak elektrik sağlığı ve şebeke yönetimi bunu takip edemiyor.

Bu, neden artan sayıda AI şirketi enerji altyapısına yeniden odaklanmaya başladığının nedenidir. GTC 2026'da Huang Renxun, geleceğin veri merkezlerini "Token fabrikaları" olarak tanımladı. Bu fabrikaların en üst akışında süper bir enerji endüstrisi ortaya çıkacaktır.

Çin pazarında, Çang Jiang Elektrik, Çin Nükleer Enerjisi, Çin Geniş Nükleer Enerjisi, Üç Kıyı Enerjisi, Long Yuan Elektrik ve Hua Dian Yenilenebilir Enerji gibi şirketler, hidroelektrik, nükleer, rüzgâr ve güneş enerjisi gibi temel enerji alanlarını temsil etmektedir. Nükleer ve hidroelektrik enerji, kararlı elektrik sağlama yetenekleriyle AIDC'nin en önemli temel enerji kaynakları haline gelmektedir; rüzgâr ve güneş enerjisi ise AI endüstrisinin yeşil elektrik ve ESG taleplerindeki artıştan fayda görmektedir. "Doğu Verileri Batı Hesaplama" ve büyük AI veri merkezleri inşaatı ilerledikçe, yenilenebilir enerji bazları ile hesaplama merkezleri arasındaki iş birliği hızla güçlenmektedir.

ABD pazarında, NextEra Energy, Dominion Energy, Duke Energy, Southern Co., Exelon gibi geleneksel enerji devleri, AI veri merkezi genişlemesinden fayda görmektedir. Bunlardan NextEra, Kuzey Amerika'nın yeşil elektrik lideridir; Dominion, Kuzey Virginia'daki "veri merkezi koridoru"nun temel iletim kaynaklarına sahiptir; Exelon ise nükleer enerjiyle kararlı elektrik sağlama kapasitesi sayesinde AI çağındaki "24/7 yüksek stabilite elektrik" talebinin önemli bir yararlanıcısı haline gelmiştir. Genel olarak, küresel elektrik sektörü, geleneksel kamu hizmetlerinden yavaş yavaş AI altyapısı çağına temel kaynak katmanına dönüşmektedir.

Yapay Zeka Veri Merkezi

Genel olarak, bu katmandaki rekabet yapısı, geleneksel enerji şirketlerinin “fiyat rekabetinden” aşağı akıştaki AI veri merkezleri, bulut sağlayıcıları ve enerji şirketleri arasındaki “enerji kilitlenme hakkı rekabetine” dönüşüyor. Uzun vadeli, istikrarlı ve düşük maliyetli enerjiyi kim kilitlerse, Token üretiminin ilk ejderha boncuğunu elde eder.

İkinci kat pasta: AIDC—Token Ham Madde Fabrikası

Tek bir GPU'nun bir anlamı yoktur, gerçek önem ölçeklenebilir kümelerdedir. İşte AIDC ortaya çıktı.

Bu, endüstriyel çağın çelik fabrikaları, elektrik santralleri ve akış hattı fabrikaları gibi, binlerce GPU'yu bir araya getirerek kararlı bir Token üretimi kapasitesi oluşturur. Ancak fabrikaların sorunları da ortaya çıkmaya başladı: Geleneksel AIDC inşaat döngüleri genellikle 18 ila 36 ay sürer, elektrik şebekesi kapasitesini genişletmek ise daha uzun zaman alabilir. AI talebi üssel olarak artarken, eski nesil IDC'lerin inşaat hızı yeni Token ekonomisini karşılayamaz hale gelmiştir.

ABD hisse senedi piyasasında Equinix, 30'un üzerinde ülkede 240'tan fazla veri merkezine sahip olan küresel en önde gelen veri merkezi operatörlerinden biridir. Temel avantajı sadece veri merkezi sayısı değil, aynı zamanda küresel bağlantı kapasitesi ve düşük gecikmeli ağ kaynaklarıdır; bu nedenle AI hesaplama gücü dağıtımının önemli altyapı düğümü haline gelmiştir.

Digital Realty, PlatformDIGITAL platformu aracılığıyla AI altyapısına girmekte ve büyük bulut sağlayıcıları ile finansal kurumları hedef almaktadır.

Çin pazarında Runze Technology, A hisse senedi piyasasının en tipik AIDC operatörlerinden biridir. Ana faaliyet alanı, geleneksel IDC'den AI hesaplama merkezlerine doğru yükselmektedir ve temel rekabet avantajı, büyük ölçekli veri merkezleri, elektrik kaynakları ve AIDC işletimi becerilerindedir. Aofei Data ve Capital Online gibi şirketler ise bölgesel veri merkezleri, bulut altyapısı ve AI hesaplama barındırma yönlerinde sürekli genişlemektedir. Sugon, AIDC faaliyetlerinde hükümet ve kurumsal ile bilimsel araştırmalar alanlarında iş birliği yapmaya odaklanmaktadır.

Diğer bir grup oyuncu ise "maden dönüşümü"den geliyor. CoreWeave, IREN, Applied Digital, Cipher Mining gibi şirketler, başlangıçta çoğu kripto para madenciliği ile ilişkiliydi, ancak AI GPU talebindeki patlamayla birlikte AI hesaplama altyapısına hızla geçiş yaptı. IREN, "yeşil enerji + AI hesaplama" modelini öne çıkarıyor ve yenilenebilir enerji kaynakları kullanarak yoğun GPU veri merkezleri inşa ediyor. Applied Digital ve Cipher Mining de geleneksel madenlerden AI yüksek performanslı hesaplama altyapısına dönüşüm yapıyor.

Yapay Zeka Veri Merkezi

Ayrıca, marjinalleştirilmiş, küçük ölçekli ve modüler AI Factory yeni bir trend haline gelmeye başlıyor. İnternet dönemi büyük bilgisayarlardan bulut hesaplama yönüne doğru ilerlerken, AI hesaplama gücü de süper büyük merkezi düğümlerden bölgesel kenar düğümlerine doğru yayılmaya başlıyor.

Bu nedenle GoodVision AI, daha hafif, modüler ve hızlıca kopyalanabilir bir AI Factory inşa etme yolunu seçti. Geleneksel büyük AIDC'lere kıyasla, GoodVision AI, bölgesel dağıtım kapasitesi, yüksek yoğunluklu GPU kümelerinin verimliliği ve enerji ile hesaplama gücünün entegre iş birliği üzerinde daha çok vurgu yapıyor.

Temel mantığı, tek bir süper büyük veri merkezi inşa etmek değil, küresel yoğun nüfus bölgelerinde genellikle 2-4 MW küçük çıkarım hesaplama odaları olarak AI Factory düğümlerini hızlıca dağıtmaktır. Bu model, yerel enerji kaynaklarına daha hızlı erişimi mümkün kılar ve gelecekteki AI çıkarım taleplerinin kenara doğru yayılma eğilimine daha uygundur.

Eğer geleneksel AIDC, endüstri çağının büyük çelik fabrikalarına benziyorsa, GoodVision AI'nin oluşturduğu, AI çağının "bölgesel Token fabrikalarına" benziyor—daha hafif, daha esnek, kullanıcıya daha yakın ve geleceğin küresel dağıtılmış çıkarım ağı yönüne daha uygun.

Üçüncü kat pasta: GPU—Token'un üretim ekipmanı

Eğer elektrik enerjiyse, GPU üretim ekipmanıdır. AI'nın patlama başlangıcının ilk yıllarında GPU'lar özellikle eğitim için kullanılıyordu; ancak gelecekteki büyük talep, çıkarım (inference) süreçlerinden gelecektir. Çünkü eğitim sadece birkaç öncü şirkete aittir, ancak çıkarım her uygulamaya, her cihaza, her uç noktaya nüfuz edecektir. Robotlar çıkarım gerektirir, otonom araçlar çıkarım gerektirir, AI gözlükleri çıkarım gerektirir ve hatta gelecekte her AI Agent arasındaki iş birliği de gerçek zamanlı olarak Token tüketecektir.

NVIDIA, şu anda küresel AI çip endüstrisinin mutlak çekirdeğidir. H100, B200, Blackwell gibi GPU ürünleri, mevcut küresel AI eğitimi ve çıkarım standartlarını neredeyse tanımlamaktadır. Daha da önemlisi, NVIDIA sadece çip satmakla kalmıyor, CUDA, TensorRT, DGX, HGX gibi yazılım ve donanım sistemleri aracılığıyla tam bir ekosistem oluşturuyor; bu nedenle rakipleri yalnızca GPU performansını değil, tüm AI yazılım ekosistemini de zorlamak zorunda kalıyor.

AMD, şu anda en önemli GPU rakibi olup, MI300X gibi AI GPU'ları ana ürünlerini oluşturur. NVIDIA ile karşılaştırıldığında, AMD daha açık bir ekosistem ve ROCm yazılım platformu vurgusu yapar ve daha açık bir yaklaşımla AI geliştiricilerini ve kurumsal müşterileri çekmeyi hedefler.

Broadcom ve Marvell, ASIC ve yüksek hızlı bağlantıların diğer bir yolunu temsil eder. AI çıkarım senaryoları giderek daha karmaşık hale gelirken, artan sayıda şirket daha yüksek verimlilik ve daha düşük maliyet elde etmek için özel ASIC çipleri denemeye başlamaktadır.

Intel, sunucu CPU'ları ve Gaudi AI hızlandırıcı kartları aracılığıyla AI pazarına girmeyi hedefliyor ve kendi CPU ekosistemini kullanarak AI altyapı rekabetine yeniden dahil olmayı amaçlıyor.

Çin pazarında Cambricon, yerli AI çip üreticilerinden en temsili olanlardan biridir ve思元 serisi AI çiplerini öne çıkararak Neuware adlı kendi geliştirilmiş AI çerçevesini kurmuştur. Hygon Information, AMD Zen mimarisine lisans sahibidir ve DCU ile AI çıkarım pazarlarına odaklanmaktadır.

Moore Threads, Suanyuan Technology, Muxi Shares, Biren Technology gibi yerel GPU şirketleri, Çinli AI çiplerinin "yerel alternatif" yönünü temsil eder. Bu şirketler genellikle CUDA ekosistemine uyumluluğu vurgular ve yerel GPU kümeleri kurmaya çalışır.

Yapay Zeka Veri Merkezi

CUDA ekosisteminden HBM belleğine, Tensor Core'a kadar tüm AI endüstrisinin çekirdeği, aslında "birim zamanda üretilecek Token verimliliğini" sürekli artırma üzerinedir. Aynı zamanda GPU ve arka plandaki sunucular, ışık modülleri, sıvı soğutma, anahtarlayıcılar gibi altyapı bileşenleri de Token üretimi verimliliğiyle yakından ilişkilidir.

Bu şirketler, NVIDIA veya OpenAI gibi AI uygulama şirketleri kadar dikkat çekici değil, ancak tüm AI dünyasının gerçekten çalışıp çalışamayacağını belirliyor. Sanayi devrimi sadece buhar makinesi gerektirmemiş, demiryolları, elektrik şebekesi ve limanlar da gerektirmişti. AI devrimi de sadece bir yazılım devrimi olmayacak. Enerji, çip, ağ, bulut hesaplama ve altyapıyı kapsayan küresel bir zincir yükselişi olacak.

Yapay Zeka Veri Merkezi

Vertiv, veri merkezleri için UPS ve elektrik yönetiminin küresel lideridir ve veri merkezi güç sağlama, raf dağıtım ve hassas iklimlendirme sistemleri sunar.

Yingweike, A hisse senedi piyasasında sıvı soğutma ve sıcaklık kontrol sistemlerinin lideridir ve BAT gibi büyük internet şirketlerini müşterileri arasında bulundurur. GPU güçleri arttıkça, sıvı soğutma AIDC'ler için önemli bir standart haline gelmektedir.

Zhongheng Electric, Kehua Data, Keshida ve diğer şirketler, UPS, güç sistemleri ve IDC güç sağlama alanlarında önemli bir konuma sahiptir.

Ağ ve ışık modülü alanında, CEC旭創, XinYisheng, Tianfu Communication gibi şirketler, AI kümeleri içindeki yüksek hızlı iletişim talebindeki patlamadan fayda sağlamaktadır.

Sunucu tam sistem yönünde, Dell, HPE, Supermicro, Lenovo ve Inspur gibi şirketler, AI sunucularının büyük ölçekli montajını ve teslimatını üstlenmektedir.

Bu katman, doğrudan son kullanıcıya hitap etmese de, AI altyapısının gerçekten kararlı bir şekilde çalışıp çalışmayacağını belirler. Sıvı soğutma, UPS, ışık modülleri, anahtarlayıcılar, enerji depolama ve sunucu tamamlamaları, endüstriyel çağın demiryolları, elektrik şebekeleri ve limanları gibi, AI dünyasının gerçek “kovacı” işleri haline gelmektedir.

Dördüncü kat pasta: LLM—Token üretim motoru

LLM (büyük dil modeli), token'ların nasıl anlaşılacağını, üretileceğini ve organize edileceğini belirler. Geçtiğimiz iki yıl içinde, OpenAI, Anthropic, Google, Meta, xAI, DeepSeek gibi şirketler küresel bir “büyük model yarışına” neden oldu. Parametre sayısı yüz milyarlarca düzeyinden trilyonlara ulaştı ve model yetenekleri metin üretimiyle sınırlı kalmadan çok modallı, akıl yürütme, kodlama, Agent işbirliği ve uzun vadeli hafıza alanlarına genişledi.

Ancak endüstri giderek gelişirken, pazar da şunu fark etmeye başladı: Gelecekte gerçekten önemli olan, artık «kimin en büyük modeli olduğu» değil, modeli daha düşük maliyetle ve daha yüksek verimlilikle sürekli çalıştıran kim olduğu. Çünkü model kendisi doğrudan değer yaratmaz, gerçek değeri yaratan, modelin sürekli olarak çağrılması sonucu ortaya çıkan çıkarım sürecidir.

Bu, LLM'nin geçmişteki "model yeteneklerini sergileme" aşamasından, AI dünyasında bir "Token üretim motoru" haline gelmeye başladığını anlamına gelir.

OpenAI, Anthropic, Google Gemini, Meta Llama gibi kapalı kaynak ve açık kaynak modeller, geleceğin AI ekosistem giriş noktasını kazanmak için rekabet ediyor; DeepSeek gibi yeni oyuncular ise daha düşük maliyetli ve daha yüksek çıkarım verimliliğiyle sektörün rekabet yapısını yeniden şekillendiriyor. Şu anda LLM katmanındaki rekabet artık sadece parametre sayısına odaklanmamakta, değerlendirme kriterleri giderek çok boyutlu karşılaştırmalara doğru dönüşüyor:


Token maliyeti
Tahmin verimliliği
Başarı
Çok Ajanlı İşbirliği
Uzun vadeli hafıza
Model ve altyapı eş zamanlı kapasitesi

Yapay Zeka Veri Merkezi

AI çağında gerçekten önemli olan, büyük modellerin "akıllı" olup olmadığı değil, modellerin küresel olarak sürekli, büyük ölçekli ve düşük maliyetle çalıştırılabilmeleridir. GoodVision AI, bu alanda kendi optimizasyon çözümüne sahiptir: Büyük model üreticileriyle iş birliği yaparak, büyük modelleri AI Factory veri merkezlerine yerleştirerek, geleneksel hesaplama gücü kiralama iş modelinden doğrudan Token hizmeti sunmaya geçiş yapar; bu, iş marjını artırmanın yanı sıra kullanıcı deneyimini de daha dostça hale getirir.

Beşinci kat pasta: Token Dağıtımı — AI Çağı'nın "Elektrik Şebelesi"

AIDC inşa edildikten sonra şu soru ortaya çıktı: Bu hesaplama gücü, dünya çapında nasıl kullanılacak?

Bu nedenle, hesaplama gücü kiralama platformları ortaya çıkmaya başladı. Bu platformlar, AI çağının “elektrik şebekesi” gibi, merkezileştirilmiş GPU kaynaklarını bölümlere ayırıyor, dağıtıyor ve geliştiricilere, işletmelere ve AI uygulamalarına ihtiyaç duyulan ölçüde kiralıyor.

AWS, Azure, Google Cloud, Alibaba Cloud ve Tencent Cloud, bu katmandaki en güçlü oyuncular olarak kalmaktadır. Küresel en büyük bulut hesaplama altyapısına sahiptirler ve AI GPU kaynaklarını giderek kendi IaaS sistemlerine dahil etmektedirler.

Ancak aynı zamanda, «AI-native bulut» adı verilen bir dizi şirket hızla yükseliyor. CoreWeave, Nebius, Nscale gibi şirketler, AI eğitimi ve çıkarım ihtiyaçlarına özel olarak GPU bulut platformları oluşturuyor. Geleneksel bulut sağlayıcılarına kıyasla, daha esnek, AI görevlerine daha odaklı ve GPU kümelerini optimize etmede daha yetenekli.

CoreWeave, NeoCloud'un en temsili şirketlerinden biridir. İlk olarak Ethereum madenciliğine odaklanan şirket, daha sonra tamamen AI GPU bulut hizmetlerine geçiş yapmış ve şu anda NVIDIA'nın öncelikli desteklediği AI altyapı şirketi haline gelmiştir.

DigitalOcean, Vultr gibi hafif bulut platformları, küçük ve orta ölçekli geliştiricilere ve girişimlere hızlı dağıtımı ve düşük maliyetli GPU hizmetlerini vurgular.

Çin pazarında, dev şirketlerin dışında, UCloud, Jinshan Cloud ve Capital Online gibi şirketler, GPU bulut ve AI hesaplama gücü kiralama pazarının ana tedarikçileridir. Bu katmandaki rekabet yapısı, erken dönem elektrik şebekelerine çok benzer: dağılmış hesaplama gücünü nasıl verimli bir şekilde dağıtabilirsiniz?

Yapay Zeka Veri Merkezi

Altıncı kat pasta: Token optimizasyonu ve akıllı atama—AI çağı beyni

Belki de en çok altında değerlenen ancak en kritik katman “kekinin” budur. AI Agent kullanımının patlamasıyla, tüm görevlerin en pahalı büyük modelleri çağırarak değerli olmadığı anlaşıldı. Birçok basit görev yerel modellerle tamamlanabilir; birçok gerçek zamanlı görev, kenar hesaplama ile daha uygundur; birçok gizlilik gerektiren görev ise buluta yüklenemez. “Hesaplama gücü var mı?” sorusundan sonra, “hesaplama gücünü daha akıllıca nasıl kullanırız?” sorusu da eklendi.

Token talebinin üssel artışla artmasıyla, "uygun modelin, uygun hesaplama gücü üzerinde, uygun görevi işlemesi", Token'ların doğru ve verimli kullanılmasının anahtarıdır. Bu, GoodVision AI'nın AI Token fabrikası kurmanın yanı sıra üzerinde çalıştığı yönlerden biridir.

Bugünki elektrik sistemi gibi: bazı talepler büyük şebekelerden geliyor; bazı talepler çatı güneş enerjisi kaynaklı. Gerçekten önemli olan ise ortadaki "akıllı dağıtım sistemi".

Geleceğin AI'si de aynı yapıya sahip olacak: Basit görevler yerel küçük modeller tarafından tamamlanacak, karmaşık görevler bulut büyük modelleri çağıracak, yüksek gizlilik gerektiren görevler kenar hesaplama alanında işlenecek ve yüksek eşzamanlılık gerektiren görevler, karma bulutla dinamik olarak yönlendirilecek.

Goodvision AI'nin yanı sıra, Qingyun Technology, Lambda, OpenRouter ve Fireworks AI gibi şirketler de Token optimizasyonu ve akıllı şedüleme alanında öne çıkmaktadır.

Bu üçüncü «kekin» ile önceki iki «kekin» — AIDC ve hesaplama gücü kiralama — arasında yüksek oranda çakışan oyuncular bulunuyor. GPU kaynakları, bölgesel düğümler ve çıkarım görevlerinin ölçeği arttıkça, yalnızca «hesaplama gücüne sahip olmak» uzun vadeli bir engel oluşturmak için yeterli değil. Artık daha fazla AIDC operatörü ve GPU bulut platformu, gelecekte verimliliği ve kar marjını belirleyenin yalnızca GPU sayısı değil, modeli, hesaplama gücünü ve Token akışını dinamik olarak nasıl yönlendirecekleri olduğunu fark ediyor.

Bu nedenle, önce AIDC ve GPU bulutunu düzenleyen birçok platform, artık «akıllı zamanlama katmanına» doğru genişlemeye başlamıştır. Örneğin, Çin pazarındaki UCloud, Capital Online ve Sugon gibi şirketler, GPU bulut altyapılarını, çok bulut kaynaklarını ve çıkarım zamanlama yeteneklerini birleştirmeye çalışarak «hesaplama gücü satmak» yerine «hesaplama gücünü optimize etmeye» doğru ilerlemektedir.

Yapay Zeka Veri Merkezi

Yedinci kat pasta: Model ve Agent—Token Tüketicileri

Bu katman, kullanıcıya en yakın olmasının ve en kolay trafik kazanmasının yanı sıra en sert rekabeti de barındırır. GTC 2026'da Huang Renxun, gelecekte her şirketin bir «Token üreticisi ve Token tüketicisi» olacağını öne sürdü.

Bir AI аjenti, aynı anda birden fazla modeli, birden fazla aracı ve birden fazla API'yi çağırabilir ve sürekli olarak çıkarım yapabilir, planlayabilir ve uygulayabilir. Bu, gelecekte AI'nın tüketeceği Token miktarının, bugün insanların AI ile yaptığı diyalogların ölçeğinden çok daha fazla olacağı anlamına gelir. Şu anda bazı AI yoğun kullanıcıları, kendi çoklu AI ajanlarını paralel olarak ve birbirleriyle çağırarak kurmuş durumda ve her gün 1 milyar Token tüketmek tamamen mümkündür.

Gelecek, AI'yi 1 milyar kişinin kullanması değil, 10 milyar ve hatta 100 milyar AI Agent'in birbirini çağırarak aynı anda çalışması olacak. Gerçek darboğaz, artık "model kapasitesi" yerine "Token tahsis verimliliği" olacak.

Teknoloji devleri söz konusu olduğunda, Microsoft, Google, Meta ve Amazon, AI yeteneklerini ofis sistemleri, arama, sosyal ağlar ve bulut hizmetleri aracılığıyla tüm ürünlerine yavaş yavaş entegre ediyor.

Adobe, Salesforce, ServiceNow, Palantir gibi kurumsal yazılım şirketleri, kurumsal AI agenteri ve otomatikleştirilmiş iş akışları yönünde hızla ilerliyor. Aynı zamanda Hugging Face, AI çağındaki "Github" olmaya başlıyor. Sadece bir model topluluğu değil, küresel AI geliştirme ekosisteminin önemli altyapısı da.

Çin pazarında iFlytek, Kunlun Wanwei, 360, Kingsoft Office ve SenseTime gibi şirketler, AI asistanı, AI ofis ve AI Agent alanlarında faaliyetlerini genişletiyor.

“Yedi katlı kek” gerçekten oluştuğunda, AI dünyası gerçekten başlayacaktır.

Bugünün AI endüstrisi, hâlâ tamamen olgunlaşmamış bir altyapı sistemi içinde yer almaktadır.

En ileri seviye GPU'ya sahip olanlar enerjiyle sınırlı; büyük AIDC'ler kurmuş olanlar etkili yönlendirme eksikliği yaşıyor; güçlü modeller ve Agent'lar geliştirenler yüksek çıkarım maliyetleri ve gecikmelerle karşı karşıya; kenar düğümlere sahip olanlar ise birleşik bir ağ oluşturamıyor.

Elektrik, AIDC, GPU'dan LLM, Token dağıtımı, akıllı yönlendirme ve AI Agent'e kadar tüm AI zinciri hızla gelişmektedir, ancak katmanlar arasında hâlâ büyük ölçüde ayrılmışlık, fazlalık ve verimlilik engelleri mevcuttur.

Ancak bu "yedi katlı kek" tam olarak kurulup verimli bir şekilde işbirliği yapmaya başladığında, AI endüstrisi bugünün "araç çağından" gerçekten akıllı dünyanın "büyük ölçekli benimseme çağına" geçecektir.

Geleceğin AI dünyasında, yalnızca az sayıda teknoloji devinin büyük modellerini eğitmesi değil, milyarlarca AI Agent'in sürekli çevrimiçi, sürekli işbirliği yaparak, sürekli hesaplama gücü ve Token kullanması olacaktır. Her konuşma, her çıkarım, her araç çağrısı ve her otomatik görev yürütmesi, enerji, GPU, ağ, zamanlama sistemi ve çıkarım düğümlerinin koordineli çalışmasına karşılık gelir.

Bu aynı zamanda, yapay zeka endüstrisinin geçmişteki "yazılım mantığı"ndan, enerji, çip, bulut hesaplama, kenar ağı ve akıllı yönlendirmeyi kapsayan bir süper endüstriyel sisteme doğru yavaş yavaş evrildiğini anlamına gelir.

Endüstri devrimi sadece buhar makinesi değil, demiryolları, elektrik şebekesi ve limanlar da gerektirdiği gibi, internet devrimi sadece PC değil, fiber optik, veri merkezleri ve bulut bilişim de gerektirdi. AI devriminin gerçekten olgunlaşmış bir işaretı, sadece bir popüler uygulama olmayacak, küresel çapta sürekli Token üretimi, dağıtımı, yönlendirilmesi ve tüketimi sağlayan bir “akıllı altyapı ağı”nın oluşmaya başlaması olacaktır.

Yedi katmanlı altyapı nihayet tamamen birbirine bağlandığında, AI endüstrisinin rekabet mantığı tamamen yeniden yapılandırılacaktır. Geleceğin en önemli şirketleri, belki de en büyük modele sahip olanlar değil, enerji, hesaplama gücü, ağ, model ve Token akışını birleştiren şirketler olacak.































Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.