Mensaje de AIMPACT, 11 de mayo (UTC+8): según el monitoreo de Beating, aún faltan una semana para el Google I/O 2026, pero el nuevo modelo de video de Gemini, «Omni», ya ha sido descubierto accidentalmente por usuarios. Varios usuarios de Reddit informaron que, durante la última semana, al abrir la aplicación Gemini, aparecía repetidamente una nueva entrada para generar videos, etiquetada como «Powered by Omni», apareciendo junto al modelo existente Veo 3.1 (código interno Toucan). Un usuario que lo probó personalmente dio una alta calificación, describiendo a Omni como uno de los mejores modelos de video que ha visto, quedando impresionado por su adherencia a los prompts y la fluidez en los cambios de ángulos de cámara. Señaló especialmente que la calidad del audio y los sonidos ambientales generados por Omni supera en más de un nivel a la serie Veo, e incluso incluye automáticamente música de fondo adecuada al escenario. Sin embargo, también mencionó dos problemas evidentes: los límites de velocidad son extremadamente estrictos; los usuarios con suscripción Pro agotan el 80% de su cuota tras generar solo dos videos; y las imágenes de celebridades siguen siendo bloqueadas por los filtros, ya que la prueba clásica de Will Smith comiendo espaguetis no funciona. Actualmente, la generación multimedia de Gemini está separada: los videos dependen de Veo 3.1 y las imágenes del conjunto Nano Banana. Si Omni es un modelo unificado, significa que Google está integrando las capacidades de generación de texto, imagen y video dentro de una misma arquitectura. El CEO de DeepMind, Hassabis, ya había declarado públicamente el año pasado su intención de fusionar Gemini y Veo; Omni probablemente sea la implementación de este plan. Google aún no ha confirmado oficialmente este modelo, pero se espera que lo anuncie en la conferencia I/O del 19 de mayo. (Fuente: BlockBeats)
El nuevo modelo de video de Gemini, 'Omni', se detectó antes del lanzamiento oficial; los usuarios elogian la calidad de audio
KuCoinFlashCompartir






El nuevo modelo de video de Gemini, 'Omni', llamó la atención antes de su lanzamiento oficial, con operadores que notaron fuertes niveles de soporte y resistencia en su potencial de mercado. Usuarios de Reddit encontraron una entrada 'Powered by Omni' en la aplicación de Gemini, junto con Veo 3.1. Un usuario elogió la calidad de audio y sonido ambiental, incluyendo música de fondo adaptada a la escena. También mencionó límites de tasa y restricciones continuas en la generación de semejanzas de celebridades. Gemini utiliza modelos separados para la generación de video e imagen, pero Omni podría unificar texto, imagen y video bajo un solo sistema. Google no ha confirmado el modelo, que se espera se presente en I/O 2026 el 19 de mayo. Los primeros comentarios sugieren una relación riesgo-recompensa sólida para inversores que siguen el espacio.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.