Google, 6 Nisan'da iOS platformunda deneysel ses girişi uygulaması olan Google AI Edge Eloquent'u piyasaya sürdü; offline çalıştırma ve akıllı metin düzeltme özellikleriyle öne çıkıyor. Uygulama, kendi geliştirdiği Gemma4 serisi ASR modelini (E2B/E4B spec) kullanıyor ve yerel sesden metne dönüştürme, duygu kelimelerinin otomatik filtrelenmesi ve tekrarlı düzeltmeleri destekliyor. Ayrıca, metin stilini Özet, Resmi, Kısa ve Tam olacak şekilde dört farklı biçimde dönüştürme seçeneği sunuyor. Kullanıcılar, derin temizleme için bulut tabanlı Gemini modelini etkinleştirebilir ve Gmail kontaklarını ve terimleri içe aktararak kişiselleştirilmiş bir sözlük oluşturabilir. Uygulama şu anda ücretsizdir ve abonelik sınırlaması yoktur; bu, yıllık 85 dolarlık rekabetçi SuperWhisper'dan belirgin şekilde farklıdır. Android sürümü geliştirme planında yer almakta olup, gelecekte sistem klavyesi entegrasyonu ve yüzükü işlem desteği sunulacaktır. Bu adım, Google'ın kenar AI ses işleme alanında somut bir adım attığını göstermekte ve Gemma modelinin mobil cihazlarda hafifletilmiş dağıtım için teknik yeteneğini vurgulamaktadır.
Yazan: AIBase
4 Haziran Pazar günü yerel saatle, Google, iOS platformunda “Google AI Edge Eloquent” adlı deneysel bir ses girişi uygulamasını sessizce piyasaya sürdü. Uygulama, “öncelikle çevrimdışı” ve “akıllı düzeltme” özelliklerini vurgulayarak, kenar hesaplama AI teknolojisini kullanarak doğal konuşmayı gerçek zamanlı olarak profesyonel ve özlü metinlere dönüştürmeyi hedefliyor. Bu adım, Google’ın Wispr Flow ve SuperWhisper’in öncülük ettiği üst düzey AI sesden metne sektörüne resmen girdiğini işaret ediyor.
Ana Teknoloji ve Özellikler:
Eloquent, Google'nin en son yayınladığı Gemma4 serisi (E2B/E4B spec) otomatik ses tanıma (ASR) modelini kullanır. Bu model tamamen çevrimdışı çalışmayı destekler; kullanıcılar model paketini indirdikten sonra yerel olarak transkripsiyon yapabilir ve bu sayede gizlilik korunur ve gecikme azalır. Uygulama, "eh", "ah" gibi duygu ifadelerini ve tekrarlanan düzeltmeleri otomatik olarak tanımlayıp filtreleyen güçlü "Akıllı Gürültü Giderme" özelliğine sahiptir ve mantıksal olarak akıcı metinler üretir.
Ürün derin entegrasyonu ve etkileşimi:
- Çok modlu stil dönüşümü: "Anahtar noktalar", "Resmi", "Kısa" ve "Tam" olmak üzere dört metin işleme modu sunar.
- Bulut ortaklığı (isteğe bağlı): Bulut modu etkinleştirildiğinde, uygulama derin metin temizlemesi için bulut Gemini modelini çağırır.
- Gmail'den kullanıcıya özel anahtar kelimeler, isimler ve terimler içe aktarılmasını destekler ve özelleştirilmiş bir sözlük oluşturmanıza izin verir.
- Üretim İstatistikleri: Gerçek zamanlı olarak transkripsiyon kelime sayısı, dakikadaki kelime hızı (WPM) ve geçmiş oturum kayıtlarını gösterir.
Pazar Stratejisi ve Gelecek Planlaması:
Şu anda uygulama iOS App Store'da ücretsiz olarak sunulmakta olup, abonelik ücreti veya kullanım sınırlaması bulunmamaktadır; bu, her yıl 85 dolarlık ücret talep eden SuperWhisper gibi rakiplere karşı güçlü bir rekabet avantajı sağlamaktadır. İlk olarak iOS'ta başlatılan uygulama, resmi açıklama ile Android sürümü geliştirildiğini doğrulamış ve sistem düzeyi klavye entegrasyonu ile Wispr Flow benzeri yüzük düğmesi özellikleri destekleneceğini duyurmuştur. Google AI Edge markası altında önemli bir üyesi olan Eloquent, sadece bir araç uygulaması değil, Gemma modelinin mobil cihazlarda dağıtılma kapasitesini göstermenin bir göstergesidir.
