Google DeepMind lance Gemini Robotics-ER 1.6 avec une raisonnement spatial amélioré

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Google DeepMind a lancé Gemini Robotics-ER 1.6, un nouveau modèle avec une raisonnement spatial amélioré et une compréhension multi-perspectives. Cette mise à jour inclut une précision de pointage accrue, une détection de tâches améliorée et la capacité de lire des instruments industriels. Les développeurs peuvent accéder au modèle via l'API Gemini et Google AI Studio. Cette mise à jour actualisée sur l'IA et les cryptomonnaies met en lumière les dernières avancées en matière d'intégration de l'IA pour la robotique et l'automatisation.

Odaily Planet Daily : Google DeepMind lance Gemini Robotics-ER 1.6, un modèle de raisonnement de haut niveau pour robots, qui présente une amélioration significative en matière de raisonnement spatial et de compréhension multivue par rapport à ses prédécesseurs ER 1.5 et Gemini 3.0 Flash. Le modèle est désormais accessible aux développeurs via l'API Gemini et Google AI Studio, avec trois améliorations principales :

1. Amélioration de la précision de pointage : utile pour la détection précise d'objets, le comptage, le raisonnement sur les relations spatiales (par exemple, « indiquez tous les objets pouvant être placés dans la tasse bleue ») et la planification de trajectoires, tout en rejetant correctement les pointages d'objets absents de l'image.

2. Détection réussie à partir de plusieurs angles : le robot peut désormais évaluer si une tâche est terminée en combinant les images de plusieurs caméras, tout en conservant une précision élevée même en cas d'obstruction ou dans des environnements dynamiques.

3. Ajout de la capacité de lecture des instruments : peut interpréter divers instruments industriels tels que des manomètres circulaires, des indicateurs de niveau vertical et des écrans numériques, en utilisant l'agentic vision (raisonnement visuel + exécution de code) pour un raisonnement progressif : d'abord zoomer sur les zones détaillées, puis pointer et calculer les proportions et les intervalles via du code, enfin déduire la lecture en combinant les connaissances du monde.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.