O novo modelo de vídeo da Gemini, 'Omni', foi detectado antes do lançamento oficial; usuários elogiam a qualidade de áudio

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
O novo modelo de vídeo da Gemini, 'Omni', chamou a atenção antes de seu lançamento oficial, com traders observando forte suporte e resistência em seu potencial de mercado. Usuários do Reddit encontraram uma entrada 'Powered by Omni' no aplicativo da Gemini, juntamente com o Veo 3.1. Um usuário elogiou a qualidade de áudio e sons ambientais, incluindo música de fundo adequada à cena. Ele também mencionou limites de taxa e restrições contínuas na geração de semelhança de celebridades. A Gemini utiliza modelos separados para geração de vídeo e imagem, mas o Omni poderia unificar texto, imagem e vídeo em um único sistema. O Google ainda não confirmou o modelo, previsto para ser apresentado no I/O 2026 em 19 de maio. Os primeiros feedbacks sugerem uma relação risco-recompensa sólida para investidores que acompanham o espaço.

Mensagem AIMPACT, 11 de maio (UTC+8): De acordo com monitoramento da Beating, ainda faltam uma semana para o Google I/O 2026, mas o novo modelo de vídeo do Gemini, chamado "Omni", já foi descoberto acidentalmente pelos usuários. Vários usuários do Reddit relataram que, durante a última semana, ao abrir o aplicativo Gemini, uma nova entrada para geração de vídeo repetidamente aparecia, com a marcação "Powered by Omni", exibida ao lado do Veo 3.1 (código interno Toucan). Um usuário que testou o modelo deu uma avaliação elevada, afirmando que o Omni é um dos melhores modelos de vídeo que já viu, impressionando-o com a aderência às instruções e a fluidez nas transições entre múltiplas câmeras. Ele destacou especialmente que a qualidade da voz e dos sons ambientais gerados pelo Omni supera em muito a do série Veo, chegando até a adicionar automaticamente música de fundo adequada ao cenário. No entanto, ele também mencionou dois problemas evidentes: o limite de taxa é extremamente restritivo — usuários com assinatura Pro esgotam 80% de seu crédito após apenas duas gerações de vídeo; e imagens de celebridades ainda são bloqueadas pelos filtros — o teste clássico com Will Smith comendo macarrão não funciona. Atualmente, a geração multimídia do Gemini é separada: vídeos são gerados pelo Veo 3.1 e imagens pelo série Nano Banana. Se o Omni for um modelo unificado, isso indica que o Google está integrando as capacidades de geração de texto, imagem e vídeo em uma única arquitetura. O CEO da DeepMind, Hassabis, já havia declarado publicamente no ano passado que pretende fundir o Gemini e o Veo; o Omni provavelmente é a implementação desse plano. O Google ainda não confirmou oficialmente este modelo, mas espera-se que seja anunciado na conferência I/O em 19 de maio. (Fonte: BlockBeats)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.