Perplexity, Temmuz'da karma lokal-bulut AI çıkarım sistemi yayınlayacak

CoinDesk haber veriyor:

Perplexity, Taipei'deki Computex 2026'da yeni bir özellik duyurdu ve Temmuz'da Windows sürümü Perplexity Computer'ı piyasaya sürecektir. Sistem, bir AI görevinin hangi kısımlarının yerel cihazda, hangi kısımlarının bulut modeli tarafından işleneceğini otomatik olarak belirleyecek ve kullanıcıların modu elle değiştirmesine gerek olmayacaktır.

Yerel olarak hassas içerikleri işleyin

Bu çözüm, Perplexity CEO'su Aravind Srinivas ve Intel CEO'su Chen Liwu tarafından ortak olarak duyuruldu. Şirket, bu sistemi gizlilik, performans ve hesaplama maliyetini aynı süreçte ele alan karışık yerel-sunucu çıkarım koordinasyon sistemi olarak adlandırıyor.

Perplexity, finansal kayıtlar, sağlık bilgileri ve kişisel belgeler gibi içeriklerin, önce cihazdaki hafif model tarafından yerelde kalıp kalmayacağına karar verilmesini daha uygun buluyor. Daha güçlü çıkarım gerektiren kısımlar, daha büyük bulut modeline gönderiliyor.

Şirketin açıklamasına göre, belge özeti, metin formatlama ve hafif sınıflandırma gibi görevler doğrudan yerel olarak tamamlanabilir; karmaşık çıkarımlar sunucuya devredilir. Tüm süreç, görev yürütülürken otomatik olarak geçiş yapar ve kullanıcıların bunu hissetmeleri en aza indirilir.

Ancak bu, Perplexity'nin kullanıcıya tamamen kontrol edilebilir bir çevrimdışı model açtığı anlamına gelmez. Yerel bileşenler, Perplexity'nin uygulamasına entegre edilmiş kompakt modellerdir ve bulut kısmı hâlâ Perplexity sunucuları üzerinden çalışır; tamamen çevrimdışı bir çözüm olarak kabul edilemez.

Maliyet baskısı önemli bir arka plandır

Srinivas, Computex sırasında yapılan bir röportajda, AI sistemlerinin hedefinin tüm hesaplamaları sunuculara ve en büyük modellere odaklamak yerine, her kullanıcıya daha yüksek “watt başına değer” sağlaması gerektiğini belirtti. Bazı şirketlerin aylık hesaplama maliyetlerinin milyonlarca dolaara ulaştığını ifade etti.

Perplexity, önceki açıklamada, şirket gelirinin 100 milyon dolarlardan 500 milyon dolara çıktığını, ancak çalışan sayısının sadece %34 arttığını belirtti. Bu bağlamda, bazı çıkarım yüklerini kullanıcı bilgisayarlarına aktarmak, bulut hesaplama maliyetlerini doğrudan azaltabilir.

Bu, AI endüstrisinin uçta çıkarım yapmayı önemli kılan diğer bir nedenidir. Kurumlar için yerel çalıştırma sunucu maliyetlerini azaltır; kullanıcılar için ise bazı hassas verilerin cihazdan ayrılmaması anlamına gelir.

Endüstri, uç ve karma modlara doğru kaymaktadır

Şu anda birçok teknoloji şirketi yerel veya karma çıkarım üzerinde çalışıyor. Apple, bazı hassas işlemleri yerel çip üzerinde gerçekleştiriyor; Microsoft'un Foundry Local hizmeti, bu yıl Nisan'da Windows, macOS ve Linux üzerinde yerel AI çıkarımı desteğiyle resmen kullanıma sunuldu.

NVIDIA, Computex sırasında RTX Spark'i yayınladı ve yerel büyük model çıkarımını laptop ve masaüstü cihazlara odakladı. Bununla karşılaştırıldığında, Perplexity'nin farkı modelde değil, zamanlama katmanındadır: sistem, kullanıcıların önceden seçim yapması yerine, görevlere göre gerçek zamanlı olarak yerel ve bulut arasındaki görev paylaşımını belirler.

Perplexity, bu özelliğin çip platformunda yalnızca Intel'e sınırlı olmadığını belirtti. Canlı gösterimde Intel Core Ultra Seri 3 işlemcisi kullanıldı, ancak NVIDIA işlemciler de desteklenmektedir. Şu anda bu özellik yalnızca Windows PC uygulamalarına ilk olarak gelecek şekilde onaylandı; diğer platformlarda yayınlanma zamanı henüz duyurulmadı.