Google DeepMind lanza Gemini Robotics-ER 1.6 con razonamiento espacial mejorado

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Google DeepMind ha lanzado Gemini Robotics-ER 1.6, un nuevo modelo con razonamiento espacial mejorado y comprensión de múltiples perspectivas. La actualización incluye una mayor precisión en el apuntado, detección de tareas y la capacidad de leer instrumentos industriales. Los desarrolladores pueden acceder al modelo a través de la API de Gemini y Google AI Studio. Esta actualización de noticias de IA + cripto destaca lo último en integración de IA para robótica y automatización.

Odaily Planet Daily informa que Google DeepMind ha lanzado Gemini Robotics-ER 1.6, posicionado como un modelo de razonamiento de alto nivel para robots, con mejoras significativas en razonamiento espacial y comprensión de múltiples perspectivas en comparación con la versión anterior ER 1.5 y Gemini 3.0 Flash. El modelo ya está disponible para desarrolladores a través de la API de Gemini y Google AI Studio, con las siguientes actualizaciones principales:

1. Mejora de la precisión de apuntado: útil para detección precisa de objetos, conteo, razonamiento sobre relaciones espaciales (por ejemplo, "apunta a todos los objetos que caben en la taza azul") y planificación de trayectorias de movimiento, y puede rechazar correctamente apuntar a objetos que no existen en la imagen.

2. Detección exitosa desde múltiples perspectivas: el robot ahora puede evaluar si una tarea se ha completado combinando imágenes de varias cámaras, manteniendo precisión incluso en entornos con obstrucciones o dinámicos.

3. Nueva capacidad de lectura de instrumentos: puede interpretar diversos instrumentos industriales, como manómetros circulares, indicadores de nivel vertical y pantallas digitales, mediante agentic vision (razonamiento visual + ejecución de código) para realizar razonamiento paso a paso: primero amplía las áreas detalladas, luego utiliza apuntamiento y cálculo de código para determinar proporciones e intervalos, y finalmente combina conocimientos del mundo para obtener la lectura.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.