Le nouveau modèle vidéo de Gemini, « Omni », détecté avant le lancement officiel ; les utilisateurs louent la qualité audio

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Le nouveau modèle vidéo de Gemini, « Omni », a attiré l'attention avant sa sortie officielle, les traders notant un fort soutien et des résistances dans son potentiel de marché. Des utilisateurs de Reddit ont découvert une entrée « Powered by Omni » dans l'application Gemini, aux côtés de Veo 3.1. Un utilisateur a salué la qualité audio et sonore environnementale, y compris la musique de fond adaptée à la scène. Il a également mentionné des limites de taux et des restrictions en cours sur la génération de ressemblances avec des célébrités. Gemini utilise des modèles séparés pour la génération vidéo et d'image, mais Omni pourrait unifier texte, image et vidéo sous un seul système. Google n'a pas confirmé ce modèle, attendu pour le I/O 2026 le 19 mai. Les premiers retours suggèrent un rapport risque-récompense solide pour les investisseurs suivant cet espace.

Message AIMPACT, 11 mai (UTC+8) : Selon les données de Beating, alors que Google I/O 2026 n'aura lieu que dans une semaine, le nouveau modèle vidéo de Gemini, « Omni », a déjà été découvert par erreur par des utilisateurs. Plusieurs utilisateurs de Reddit ont rapporté qu'au cours de la semaine écoulée, en ouvrant l'application Gemini, une nouvelle entrée de génération vidéo apparaissait systématiquement, étiquetée « Powered by Omni », affichée en parallèle avec le modèle existant Veo 3.1 (code interne Toucan). Un utilisateur ayant réellement testé le modèle l'a fortement félicité, le qualifiant de l'un des meilleurs modèles vidéo qu'il ait jamais vus, impressionné par la fidélité aux invites et la fluidité des changements de plans multiples. Il a particulièrement souligné que la qualité de la voix et des sons d'ambiance générés par Omni dépassait largement celle de la série Veo, voire en ajoutant automatiquement une musique de fond adaptée au contexte. Toutefois, il a également mentionné deux problèmes évidents : les limites de débit sont extrêmement strictes — les utilisateurs abonnés Pro épuisent 80 % de leur quota après seulement deux générations vidéo ; les portraits de célébrités sont toujours bloqués par les filtres — le test classique de Will Smith mangeant des pâtes échoue toujours. Actuellement, la génération multimédia de Gemini est séparée : les vidéos dépendent de Veo 3.1, les images de la série Nano Banana. Si Omni est un modèle unifié, cela signifie que Google cherche à intégrer les capacités de génération de texte, d'image et de vidéo au sein d'une même architecture. Le PDG de DeepMind, Hassabis, avait déjà annoncé publiquement l'année dernière son intention de fusionner Gemini et Veo ; Omni est très probablement la concrétisation de ce projet. Google n'a pas encore officiellement confirmé l'existence de ce modèle, mais il devrait être révélé lors de la conférence I/O du 19 mai. (Source : BlockBeats)

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.