Yazar: Will Douglas Heaven
Deep潮 TechFlow
Derin Akış Özet: Niantic, Pokémon Go oyuncularının çektiği 30 milyar şehir fotoğrafını yeni bir iş modeline dönüştürdü. AI alt şirketi Niantic Spatial, bu verileri kullanarak GPS'in şehir vadi içindeki performansını çok aşan santimetre düzeyinde bir görsel konumlandırma sistemi eğitti. İlk büyük müşteri, Coco Robotics adlı yemek teslimat robotu şirketidir. Pikaçuu yakalamaktan pizzayı teslim etmeye kadar, bu, toplu kaynaklı verilerin en beklenmedik ticarileştirme yollarından biri olabilir.
Tam metin şudur:
Pokémon Go, küresel olarak ilk fenomenal AR oyunudur. 2016'da Google'ın alt kuruluşu Niantic tarafından yayımlanan bu oyun, Pokémon IP'sine artırılmış gerçeklik oyun mekaniklerini ekleyerek hızla tüm dünyayı sarmıştır. Şikago'dan Oslo'ya,江之島'a kadar oyuncular, bir Pidgey, Squirtle veya (şansları çok iyiyse) nadir bir Galar Hızlı Kuşu yakalamak için sokaklara dökülmüştür—bu varlıklar gerçek dünyada süzülürken, onlara ulaşmak için sadece biraz daha uzanmak gerekmektedir.
Kısaca, bu, milyonlarca insanın milyonlarca bina için telefonlarıyla fotoğraf çekmesi anlamına gelir. “Beş milyon kişi 60 gün içinde bu uygulamayı yükledi,” diyor Niantic Spatial’in CTO’su Brian McClendon. Niantic Spatial, Niantic’in geçen yıl Mayıs'ta ayırdığı bir AI şirketi. Aynı dönemde Niantic’ten Pokémon Go’yu satın alan oyun şirketi Scopely’nin verilerine göre, bu oyun 2024 yılında hâlâ 100 milyondan fazla aktif oyuncuya sahip; yayınlandığı günden bu yana 8 yıl geçti.
Şu anda, Niantic Spatial, küresel milyonlarca Pokémon Go oyuncusunun telefonlarından gelen, süper hassas konum etiketleriyle birlikte şehir sembollerinin fotoğraflarından oluşan bu eşsiz kitle kaynaklı veri hazinesini kullanarak bir Dünya Modeli (World Model) oluşturuyor. Bu, LLM'lerin akıl gücünü gerçek dünya ortamlarına bağlamayı hedefleyen mevcut popüler teknoloji yönüdür.
Şirketin en son ürünü, sadece birkaç bina veya diğer yer işaretinin anlık görüntüsüyle, haritadaki konumunuzu birkaç santimetreye kadar hassasiyetle belirleyebilen bir modeldir. Bu modeli, GPS'nin güvenilir olmadığı yerlerde robotların daha hassas navigasyon yapmasına yardımcı olmak için kullanmak istiyorlar.
Teknolojinin ilk büyük doğrulaması olarak Niantic Spatial, Coco Robotics ile iş birliği yaptı. Coco, ABD ve Avrupa'nın birçok şehrinde son kilometre yemek teslim robotları dağıtan bir startup şirketi. McClendon, "Herkes AR'in geleceğe ait olduğunu ve AR gözlüklerinin yakında geleceğini düşünüyordu, ancak sonuçta robotlar kullanıcı oldu."
Pikachu'dan pizza teslimatına
Coco Robotics, Los Angeles, Chicago, Jersey City, Miami ve Helsinki'de yaklaşık 1000 adet bavul boyutunda robot dağıttı; bu robotlar en fazla 8 adet büyük pizzayı veya 4 çanta alışveriş malzemesini taşıyabiliyor. CEO Zach Rash'a göre, bu robotlar şimdiye kadar 500.000'den fazla teslimat tamamladı ve çeşitli hava koşullarında milyonlarca mil yol kat etti.
Ancak insan kurierlerle rekabet etmek için Coco'nun robotlarının (yaya yollarında saatte yaklaşık 5 mil hızla seyahat eden) yeterince güvenilir olması gerekir. "En iyi çalıştığımız şekilde, sana belirttiğimiz zamanda tam zamanında varmak," diye söz eden Rash, kaybolmamanın gerektiğini vurguluyor.
Coco'nun karşılaştığı sorun, GPS'e güvenememesidir. Şehirlerde radyo sinyalleri binalar arasında yansır ve birbirini engeller, GPS sinyali zayıftır. "Yüksek binalar, alt geçitler ve üst geçitlerin yoğun olduğu bölgelerde teslimat yapıyoruz; bu bölgelerde GPS neredeyse hiç çalışmaz," diyor Rash.
“Şehir vadi, GPS’in dünyada en kötü performans gösterdiği yerdir,” diye McClendon söyledi. “Telefonunuzdaki mavi noktayı görüyorsunuz, sıklıkla 50 metre kayıyor ve sizi tamamen başka bir sokakta, başka bir yönde, caddenin diğer tarafında gösteriyor.” Niantic Spatial, bu sorunu çözmek istiyor.
Geçtiğimiz yıllarda Niantic Spatial, Pokémon Go ve Ingress (Niantic’in 2013’te çıkardığı önceki mobil AR oyunu) oyuncularından üretilen verileri düzenleyerek, gördüklerinizle nerede olduğunuzu belirleyen bir görsel konumlandırma sistemi (Visual Positioning System) inşa etti. “Pikachu’nun gerçek bir sokakta dolaşmasını sağlamak ile Coco’nun robotlarının şehir içinde güvenli ve hassas bir şekilde dolaşmasını sağlamak temelde aynı sorun,” diyor Niantic Spatial CEO’su John Hanke.
“Görsel konumlandırma yeni bir teknoloji değil,” diyor dijital haritalama ve coğrafi uzay analizi şirketi ESRI’den Konrad Wenzel, “ancak dışarıdaki kameralar ne kadar artarsa, o kadar iyi çalışır.”
Niantic, Spatial için şehir ortamlarından çekilen 30 milyar fotoğraf ile modeli eğitti. Bu fotoğraflar özellikle “ısınma noktaları” etrafında yoğunlaşmıştır—Niantic oyunlarında oyuncuların gitmesi teşvik edilen önemli yerler, örneğin Pokémon dövüş salonları. McClendon, “Dünya çapında 1 milyondan fazla konumumuz var ve konumunuzu tam olarak belirleyebiliyoruz,” dedi. “Nerede durduğunuzu, birkaç santimetre hassasiyetle biliyoruz. Daha da önemlisi, hangi yöne baktığınızı biliyoruz.”
Sonuç olarak, bu 1 milyon lokasyonun her biri için Niantic Spatial, neredeyse aynı konumda ancak farklı açılarla, farklı zamanlarda ve farklı hava koşullarında çekilmiş binlerce fotoğraf sahibi. Her fotoğraf, cihazın o anda uzaydaki tam konumu, yönü, pozisyonu, hareket halinde olup olmadığı, hızı ve yönü gibi ayrıntılı meta verilerle birlikte gelir.
Şirket, bu veri setini kullanarak modeli, hatta 1 milyon sıcak noktanın dışında ve görüntü ile konum verileri nispeten az olan yerlerde bile, "gördüklerini" kullanarak kendi konumunu doğru bir şekilde tahmin edecek şekilde eğitti.
GPS'nin yanı sıra, Coco'nun dört kamera ile donatılmış robotu, kendi konumunu ve nereye gideceğini belirlemek için bu modeli de kullanıyor. Robotun kameraları kalça yüksekliğinde ve tüm yönlerde yerleştirilmiş; bu görüş açısı Pokémon Go oyuncularınınkinden biraz farklı, ancak Rash'a göre veri uyumu karmaşık değil.
Rekabetçi firmalar da görsel konumlandırma sistemlerini kullanıyor. Örneğin, 2014 yılında Estonya'da kurulan robot dağıtım şirketi Starship Technologies, robotlarının çevresel ortamın 3D haritasını oluşturmak için sensörler kullandığını ve bina kenarlarını ve sokak lambalarının konumlarını işaretlediğini belirtiyor.
Ancak Rash, Niantic Spatial'un teknolojisinin Coco'ya avantaj sağlayacağını tahmin ediyor. Bu teknolojinin, robotların restoranların dışındaki doğru alım noktalarına tam olarak durmasını, kimseyi engellememesini ve müşterilerin kapısında durmasını sağlayacağını düşünüyor—geçmişte bu tür durumlar sıkça yaşanmıştı.
Botların Kambriyen Patlaması
Niantic Spatial, görsel konumlandırma sistemi oluştururken hedefi artırılmış gerçeklik üzerinde kullanmaktı, dedi Hanke. “AR gözlük takıyorsanız, sanal dünyanın bakış yönünüze sabitlenmesini istersiniz, bunun için bir yöntem gerekir. Ancak şimdi robotik alanında bir Kambriyen patlaması yaşıyoruz.”
Bazı robotlar, inşaat sahaları ve kaldırım gibi alanlarda insanlarla ortak alan paylaşmalıdır. “Robotların bu ortamlara insanları rahatsız etmeden entegre olabilmeleri için insanlar gibi bir mekân anlayışına sahip olmaları gerekir,” diye söylüyor Hanke. “Robotlar itilip çarptıktan sonra, onlara tam olarak nerede olduklarını söyleyebiliriz.”
Coco Robotics ile olan iş birliği sadece bir başlangıçtır. Hanke, Niantic Spatial'ın inşa ettiğini söylediği, gerçek dünya ile değişen çok yüksek hassasiyette bir sanal dünya simülasyonu olan "Yaşayan Harita"nın ilk bileşenlerini oluşturuyor. Coco ve diğer şirketlerin robotları dünya çapında seyahat ederken, yeni harita veri kaynakları sağlayacak ve dijital dünyanın kopyası giderek daha detaylı hale gelecek.
Hanke ve McClendon'a göre, haritalar sadece daha detaylı hale gelmiyor, aynı zamanda giderek daha çok makine tarafından da kullanılıyor. Bu, haritaların kullanımını değiştiriyor. Haritalar uzun süredir insanlara kendi konumlarını belirlemelerinde yardımcı oluyordu. 2D'den 3D'ye ve 4D'ye (gerçek zamanlı simülasyonlar gibi dijital ikizler düşünün) geçiş yaparken temel prensip değişmedi: haritadaki noktalar, uzayda veya zamanda noktalara karşılık gelir.
Ancak makineler için tasarlanan haritalar, insanlar tarafından doğal olarak kabul edilen bilgilerle dolu bir rehber gibi daha da geliştirilmeli. Niantic Spatial ve ESRI gibi şirketler, haritalara makinelerin aslında ne gördüğünü anlatan açıklamalar eklemek istiyor ve her nesneye bir dizi özellik atıyor. “Bu çağın görevi, makineler için kullanışlı bir dünya tanımı oluşturmak,” diyor Hanke. “Dünyanın bağlantıları ve organizasyonu hakkında anlayışımız için sahip olduğumuz veriler, harika bir başlangıç noktası.”
Şu anda dünya modelleri çok popüler, Niantic Spatial bunu çok iyi biliyor. LLM'ler her şeyi bildiği gibi görünüyor, ancak günlük çevresini yorumlamada ve etkileşimde neredeyse hiçbir ortak akla sahip değil. Dünya modelleri tam olarak bu sorunu çözmek için tasarlandı. Google DeepMind ve World Labs gibi bazı şirketler, sanal hayal dünyalarını anında oluşturup bunları AI ajanlarının eğitim alanları olarak kullanan modeller geliştiriyor.
Niantic Spatial, bu soruna farklı bir açıdan yaklaştıklarını söylüyor. Haritayı yeterince uçurana kadar, sonunda her şeyi yakalayacaksınız, McClendon şöyle diyor: “Henüz o noktaya ulaşmadık, ancak oraya ulaşmak istiyoruz. Şu anda gerçek dünyayı yeniden inşa etmeye odaklanıyorum.”
