Google DeepMind lanza Gemini Robotics-ER 1.6, el robot Spot ahora lee automáticamente los paneles de control

iconChainthink
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Noticias en la cadena: Google DeepMind lanzó Gemini Robotics-ER 1.6 el 14 de abril, mejorando el razonamiento espacial y la detección de múltiples vistas para la robótica. El modelo ahora admite la lectura de instrumentos industriales y está disponible a través de la API de Gemini y Google AI Studio. Boston Dynamics lo integró en AIVI-Learning, permitiendo que los robots Spot inspeccionen de forma autónoma instalaciones y lean paneles de control. Las noticias de IA + cripto continúan destacando la innovación interindustrial.

Mensaje de ChainThink, 14 de abril: según el monitoreo de 1M AI News, Google DeepMind lanzó Gemini Robotics-ER 1.6, posicionado como un modelo de razonamiento de alto nivel para robots. Este modelo presenta mejoras significativas en razonamiento espacial y comprensión de múltiples perspectivas en comparación con sus predecesores ER 1.5 y Gemini 3.0 Flash, y ya está disponible para desarrolladores a través de la API de Gemini y Google AI Studio.


La actualización principal incluye tres capacidades: primero, mejora en la precisión de la indicación, que permite la detección precisa de objetos, conteo, razonamiento sobre relaciones espaciales y planificación de trayectorias de movimiento, además de rechazar correctamente la indicación de objetos que no existen en la imagen; segundo, detección exitosa desde múltiples ángulos, que permite evaluar el estado de finalización de la tarea combinando imágenes de varias cámaras, manteniendo precisión incluso en entornos con obstrucciones o dinámicos; tercero, nueva capacidad de lectura de instrumentos, que permite interpretar instrumentos industriales como manómetros circulares, indicadores de nivel vertical y pantallas digitales, mediante razonamiento progresivo con agentic vision.


La capacidad de lectura de este panel proviene de la colaboración entre DeepMind y Boston Dynamics. El mismo día, Boston Dynamics anunció que ha integrado Gemini y Gemini Robotics-ER 1.6 en el producto Orbit AIVI-Learning, lanzado el 8 de abril para todos los clientes de AIVI-Learning. Tras la integración, se añadió soporte para paneles, permitiendo que el robot cuadrúpedo Spot realice inspecciones autónomas en instalaciones industriales y lea datos de instrumentos como manómetros.


Boston Dynamics afirma que, gracias a la capacidad de razonamiento de Gemini, AIVI-Learning ha mejorado su rendimiento y precisión base en tareas como inspección visual, conteo de palets y detección de líquidos acumulados. DeepMind indica que ER 1.6 es su "modelo de robot más seguro", con una mayor adherencia a instrucciones de seguridad en tareas de razonamiento espacial adversarial en comparación con ER 1.5; en pruebas de identificación de riesgos de seguridad basadas en informes reales de lesiones, los modelos de la serie ER superan a Gemini 3.0 Flash en un 6% en escenarios de texto y un 10% en escenarios de video.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.