Odaily Yıldız Günü Haberi: Google DeepMind, Gemini Robotics-ER 1.6'yı robotlar için üst düzey akıl yürütme modeli olarak duyurdu ve önceki nesil ER 1.5 ile Gemini 3.0 Flash'e kıyasla uzaysal akıl yürütme ve çoklu açıdan anlama konularında önemli iyileştirmeler sağladı. Model, Gemini API ve Google AI Studio aracılığıyla geliştiricilere açıldı; temel yükseltmeler üç yetenek içeriyor:
1. İşaret etme (pointing) doğruluğu artırıldı: Kesin nesne tespiti, sayımı, uzamsal ilişkileri çıkarımı (örneğin, "tüm mavi bardağa sığabilecek nesneleri işaretleyin") ve hareket yolu planlaması için kullanılabilir; aynı zamanda ekran üzerinde bulunmayan nesneleri doğru bir şekilde reddeder.
2. Çoklu açıdan başarı tespiti: Robot, engelleme veya dinamik ortamlarda bile doğru kalabilmek için birden fazla kamera görüntüsünü birleştirerek görevin tamamlanıp tamamlanmadığını belirliyor.
3. Yeni ölçü okuma yeteneği: Dairesel basınç göstergeleri, dikey seviye göstergeleri ve dijital ekranlar gibi endüstriyel ölçüm cihazlarını agentic vision (görsel akıl yürütme + kod yürütme) aracılığıyla adım adım çıkarım yaparak okuyabilir; önce detaylı bölgeleri yakınlaştırır, ardından işaret vererek ve kodla oran ve aralıkları hesaplar, son olarak dünya bilgisiyle okumayı birleştirir.
