O Google lançou em 6 de abril o aplicativo experimental de entrada por voz para iOS, Google AI Edge Eloquent, com foco em execução off-line e refinamento inteligente de texto. O aplicativo incorpora os modelos ASR Gemma4 desenvolvidos internamente (especificações E2B/E4B), suportando conversão local de voz em texto, filtragem automática de palavras de preenchimento e correção de repetições, além de oferecer quatro estilos de texto: resumo, formal, curto e completo. Os usuários podem optar por ativar o modelo Gemini na nuvem para limpeza aprofundada e importar contatos do Gmail e termos técnicos para construir um vocabulário personalizado. O aplicativo está atualmente gratuito e sem restrições de assinatura, diferindo significativamente do concorrente SuperWhisper, que cobra US$ 85 por ano. A versão Android já está planejada e, no futuro, suportará integração com o teclado do sistema e operações flutuantes. Essa iniciativa marca a implementação concreta do Google no campo de processamento de voz em IA de borda, destacando a capacidade técnica dos modelos Gemma para implantação leve em dispositivos móveis.
Autor do artigo, fonte: AIBase
Em 6 de abril (segunda-feira), horário local, o Google lançou discretamente na plataforma iOS um aplicativo experimental chamado “Google AI Edge Eloquent”. O aplicativo destaca-se por ser “offline-first” e por oferecer “refinamento inteligente”, visando utilizar tecnologia de IA na borda para transformar em tempo real a fala natural em texto profissional e conciso. Essa iniciativa marca a entrada oficial do Google na competida faixa de alto nível de conversão de voz em texto, liderada por Wispr Flow e SuperWhisper.
Principais tecnologias e recursos:
O Eloquent integra o mais recente modelo de reconhecimento automático de fala (ASR) da Google, a série Gemma4 (especificações E2B/E4B). Esse modelo suporta execução totalmente offline; após baixar o pacote do modelo, os usuários podem realizar transcrições localmente, garantindo eficazmente privacidade e reduzindo a latência. O aplicativo possui uma poderosa função de "limpeza inteligente", que identifica e filtra automaticamente palavras de preenchimento como "hum" e "ah", bem como repetições e correções, gerando texto logicamente coerente.
Integração e interação aprofundadas do produto:
- Transformação de estilo multimodal: oferece quatro modos de processamento de texto: "pontos-chave", "formal", "curto" e "completo".
- Colaboração em nuvem (opcional): Após ativar o modo nuvem, o aplicativo utilizará o modelo Gemini na nuvem para limpeza aprofundada de texto.
- Contexto personalizado: Suporta a importação de palavras-chave, nomes e termos exclusivos do usuário a partir do Gmail, permitindo a criação de um vocabulário personalizado.
- Estatísticas de produtividade: exibe em tempo real o número de palavras ditadas, a velocidade em palavras por minuto (WPM) e o histórico de sessões.
Estratégia de mercado e planejamento futuro:
Atualmente, o aplicativo está disponível gratuitamente na App Store da iOS, sem taxas de assinatura ou limitações de uso, apresentando um forte impacto em comparação com concorrentes como o SuperWhisper, que cobra US$ 85 por ano. Embora tenha sido lançado inicialmente na iOS, a descrição oficial confirma o planejamento de desenvolvimento da versão Android e antecipa o suporte à integração do teclado do sistema e funcionalidades de botão flutuante semelhantes ao Wispr Flow. Como membro importante da marca Google AI Edge, o lançamento do Eloquent não é apenas uma tentativa de aplicativo de ferramenta, mas também um caso de referência para a Google demonstrar a capacidade de implantação do modelo Gemma em dispositivos móveis.
