Autor: Will Douglas Heaven
DeepChain TechFlow
Guía de Shenchao: Niantic convirtió los 30 mil millones de fotos urbanas tomadas por jugadores de Pokémon Go en un nuevo negocio. Su subsidiaria de IA, Niantic Spatial, utilizó estos datos para entrenar un sistema de localización visual que logra una precisión de centímetros, superando con creces el rendimiento del GPS en los cañones urbanos. El primer cliente importante es la empresa de robots de entrega Coco Robotics. De atrapar a Pikachu a entregar pizza, esta podría ser una de las vías de comercialización más inesperadas de datos colaborativos.
El texto completo es:
Pokémon Go es el primer juego AR fenómeno mundial. Lanzado en 2016 por Niantic, una subsidiaria de Google, este juego que combina la propiedad intelectual de Pokémon con mecánicas de realidad aumentada se extendió rápidamente por todo el planeta. Desde Chicago hasta Oslo y hasta la isla de Enoshima, los jugadores inundaron las calles, ansiosos por capturar un Pidgey, un Squirtle o (si tenían mucha suerte) un rarísimo Articuno de Galar, que flotaban sobre el mundo real, apenas fuera del alcance.
En pocas palabras, esto significa que una enorme cantidad de personas toman fotos de edificios con sus teléfonos. “Quinientos millones de personas descargaron esta app en 60 días”, dijo Brian McClendon, CTO de Niantic Spatial. Niantic Spatial es la empresa de IA que Niantic separó en mayo del año pasado. Según datos de la empresa de juegos Scopely (que adquirió Pokémon Go de Niantic en el mismo período), este juego aún tenía más de 100 millones de jugadores activos en 2024, ocho años después de su lanzamiento.
Ahora, Niantic Spatial está utilizando esta inigualable base de datos recopilada por la comunidad: fotos de puntos de interés urbanos provenientes de los teléfonos de cientos de millones de jugadores de Pokémon Go, con marcas de ubicación superprecisas, para construir un modelo del mundo (World Model). Esta es una dirección tecnológica actualmente muy popular, cuyo objetivo es anclar la inteligencia de los LLM en entornos del mundo real.
El producto más reciente de la empresa es un modelo que, con solo unas pocas instantáneas de edificios u otros puntos de referencia, puede ubicar tu posición en el mapa con precisión de pocos centímetros. Desean utilizarlo para ayudar a los robots a lograr una navegación más precisa en lugares donde el GPS no es confiable.
Como primera validación a gran escala de la tecnología, Niantic Spatial acaba de asociarse con Coco Robotics, una startup que ha desplegado robots de entrega de última milla en varias ciudades de Estados Unidos y Europa. «Todos pensaban que la realidad aumentada era el futuro y que los gafas de RA estaban a punto de llegar», dice McClendon, «pero resulta que los robots se convirtieron primero en usuarios».
De Pikachu a la entrega de pizza
Coco Robotics ha desplegado aproximadamente 1000 robots del tamaño de una maleta en Los Ángeles, Chicago, Jersey City, Miami y Helsinki, capaces de transportar hasta 8 pizzas extra grandes o 4 bolsas de comestibles. Según el CEO Zach Rash, estos robots han realizado más de 500 000 entregas hasta la fecha, recorriendo millones de millas en diversas condiciones climáticas.
Pero para competir con repartidores humanos, los robots de Coco (que se mueven por las aceras a una velocidad de aproximadamente 5 millas por hora) deben ser lo suficientemente confiables. «Nuestra mejor forma de trabajar es llegar exactamente en el momento que te decimos», dice Rash. Eso significa no perderse.
El problema que enfrenta Coco es que no puede depender del GPS. En las ciudades, las señales de radio rebotan entre los edificios y se interfieren entre sí, lo que debilita la señal GPS. "Realizamos entregas en muchas áreas densas con edificios altos, pasos subterráneos y puentes elevados, donde el GPS casi nunca funciona bien", dice Rash.
“Los cañones urbanos son los lugares donde el GPS tiene el peor rendimiento en todo el mundo”, dijo McClendon. “Miras el punto azul en tu teléfono y a menudo se desplaza 50 metros, colocándote directamente en otra cuadra, en otra dirección, al otro lado de la calle”. Es precisamente este problema el que Niantic Spatial busca resolver.
Durante los últimos años, Niantic Spatial ha estado organizando los datos generados por los jugadores de Pokémon Go e Ingress (la anterior aplicación de realidad aumentada para móviles lanzada por Niantic en 2013) para construir un sistema de posicionamiento visual (Visual Positioning System) que determina tu ubicación según lo que ves. «Hacer que Pikachu corra realmente por las calles y hacer que el robot de Coco cruce la ciudad de forma segura y precisa es esencialmente el mismo problema», dijo John Hanke, CEO de Niantic Spatial.
“La localización visual no es una tecnología nueva”, dice Konrad Wenzel de ESRI, empresa de mapas digitales y análisis geoespacial, “pero evidentemente, cuanto más cámaras haya fuera, mejor funciona”.
Niantic Spatial entrenó el modelo con 30 mil millones de imágenes tomadas en entornos urbanos. Estas imágenes se agrupan especialmente densamente alrededor de los «puntos calientes»: lugares clave en los juegos de Niantic que animan a los jugadores a visitar, como los gimnasios de Pokémon. «Tenemos más de un millón de ubicaciones en todo el mundo que pueden localizar tu posición con precisión», dijo McClendon, «sabemos exactamente dónde te encuentras, con una precisión de unos pocos centímetros. Y lo más importante: sabemos en qué dirección estás mirando».
Como resultado, para cada uno de estos un millón de lugares, Niantic Spatial posee miles de fotos tomadas en posiciones casi idénticas, pero desde ángulos distintos, en diferentes momentos y bajo diversas condiciones climáticas. Cada foto viene acompañada de metadatos detallados: la posición exacta, orientación, postura, si el teléfono estaba en movimiento, velocidad y dirección en el momento de la toma, entre otros datos.
La empresa entrenó el modelo con este conjunto de datos para que pueda predecir con precisión su ubicación a través de lo que "ve", incluso en áreas fuera de los 1 millón de puntos calientes donde los datos de imágenes y ubicación son relativamente escasos.
Además del GPS, el robot de Coco (equipado con 4 cámaras) ahora también utiliza este modelo para determinar dónde está y hacia dónde debe ir. Las cámaras del robot están instaladas a la altura de la cadera y apuntan en todas las direcciones, con un ángulo de visión ligeramente diferente al de los jugadores de Pokémon Go, pero Rash dice que la adaptación de los datos no es compleja.
Los competidores también utilizan sistemas de localización visual. Por ejemplo, Starship Technologies, una empresa de entrega robótica fundada en Estonia en 2014, afirma que sus robots construyen mapas 3D del entorno circundante utilizando sensores, marcando los bordes de los edificios y la ubicación de las farolas.
Pero Rash apuesta a que la tecnología de Niantic Spatial brindará una ventaja a Coco. Cree que permitirá que los robots se detengan con precisión en la ubicación correcta de recogida fuera de los restaurantes, sin obstruir el paso de nadie, y se detengan frente a la puerta del cliente en lugar de a unos pasos de distancia, algo que antes ocurría ocasionalmente.
La explosión cámbrica de los robots
Cuando Niantic Spatial comenzó a desarrollar su sistema de localización visual, el objetivo era utilizarlo en realidad aumentada, dice Hanke. "Si llevas gafas de realidad aumentada y deseas que el mundo virtual se fije en la dirección en la que estás mirando, necesitas algún método para lograrlo. Pero ahora estamos presenciando una explosión cámbrica en el campo de la robótica."
Algunos robots necesitan compartir espacio con humanos, como en sitios de construcción y aceras. «Si los robots deben integrarse en estos entornos sin molestar a los humanos, deben poseer una comprensión espacial similar a la humana», dice Hanke. «Cuando los robots son empujados o chocan, podemos ayudarles a recuperar con precisión su ubicación».
La colaboración con Coco Robotics es solo el comienzo. Hanke dice que lo que Niantic Spatial está construyendo son los primeros componentes de lo que él llama un «mapa vivo»: una simulación virtual de alta precisión que cambia junto con el mundo real. A medida que los robots de Coco y otras empresas viajen por todo el mundo, proporcionarán nuevas fuentes de datos cartográficos, haciendo que la copia digital del mundo se vuelva cada vez más detallada.
Para Hanke y McClendon, los mapas no solo se vuelven más detallados, sino que también se utilizan cada vez más por máquinas. Esto ha cambiado el propósito de los mapas. Durante mucho tiempo, los mapas han ayudado a los humanos a ubicarse. Desde 2D hasta 3D y luego a 4D (piensen en simulaciones en tiempo real como los gemelos digitales), el principio básico no ha cambiado: los puntos en los mapas corresponden a puntos en el espacio o en el tiempo.
Pero los mapas dirigidos a máquinas podrían necesitar volverse más como guías turísticas, llenos de información que los humanos dan por sentada. Empresas como Niantic Spatial y ESRI quieren agregar descripciones a los mapas, informando a las máquinas qué es lo que realmente ven, etiquetando cada objeto con una serie de atributos. «El objetivo de esta era es construir descripciones útiles del mundo para las máquinas», dice Hanke. «Los datos que tenemos son un buen punto de partida para comprender cómo funciona la organización conectada del mundo».
Los modelos del mundo están muy de moda ahora, y Niantic Spatial lo sabe muy bien. Los LLM parecen saberlo todo, pero carecen de sentido común al interpretar e interactuar con el entorno cotidiano. Los modelos del mundo buscan resolver este problema. Algunas empresas, como Google DeepMind y World Labs, están desarrollando modelos que generan instantáneamente mundos virtuales de fantasía, y luego los utilizan como campos de entrenamiento para agentes de IA.
Niantic Spatial dice que abordan el problema desde una perspectiva diferente. Si haces el mapa lo suficientemente extremo, eventualmente capturarás todo, dijo McClendon: «Aún no hemos llegado a ese punto, pero queremos llegar allí. Ahora estoy muy enfocado en intentar reconstruir el mundo real».
