Google lanzó el 6 de abril la aplicación experimental de entrada por voz para iOS, Google AI Edge Eloquent, destacando su funcionamiento sin conexión y la pulida inteligente del texto. La aplicación incorpora modelos ASR Gemma4 desarrollados internamente (especificaciones E2B/E4B), que admiten conversión local de voz a texto, filtrado automático de palabras fillers y correcciones de repeticiones, además de ofrecer cuatro estilos de texto: resumen, formal, breve y completo. Los usuarios pueden activar opcionalmente el modelo Gemini en la nube para una limpieza profunda e importar contactos de Gmail y términos para construir un vocabulario personalizado. Actualmente, la aplicación es gratuita y sin restricciones de suscripción, diferenciándose significativamente de su competidor SuperWhisper, que cuesta 85 dólares anuales. La versión para Android ya está en planificación y futuramente admitirá integración con el teclado del sistema y operaciones flotantes. Este movimiento marca una implementación concreta de Google en el campo del procesamiento de voz en IA perimetral, destacando la capacidad técnica de los modelos Gemma para su despliegue ligero en dispositivos móviles.
Autor y fuente del artículo: AIBase
El 6 de abril (lunes), Google lanzó discretamente en la plataforma iOS una aplicación experimental llamada “Google AI Edge Eloquent”. La aplicación se centra en “prioridad fuera de línea” y “edición inteligente”, con el objetivo de utilizar tecnología de IA en el borde para convertir en tiempo real el habla natural en texto profesional y conciso. Este movimiento marca el ingreso oficial de Google al segmento superior de conversión de voz a texto, liderado por Wispr Flow y SuperWhisper.
Características y funciones clave de la tecnología:
Eloquent incorpora el modelo de reconocimiento automático de voz (ASR) más reciente de Google, la serie Gemma4 (especificaciones E2B/E4B). Este modelo admite ejecución completamente en off-line; tras descargar el paquete del modelo, los usuarios pueden realizar transcripciones locales, garantizando eficazmente la privacidad y reduciendo la latencia. La aplicación cuenta con una potente función de "eliminación inteligente de ruido" que identifica y filtra automáticamente palabras de relleno como "eh" y "ah", así como repeticiones y correcciones, generando un texto lógico y coherente.
Integración y interacción profundas del producto:
- Transformación de estilo multimodal: ofrece cuatro modos de procesamiento de texto: "puntos clave", "formal", "breve" y "completo".
- Coordinación en la nube (opcional): Después de activar el modo en la nube, la aplicación utilizará el modelo Gemini en la nube para realizar una limpieza profunda del texto.
- Contexto personalizado: Admite la importación de palabras clave, nombres y términos exclusivos del usuario desde Gmail y permite crear un vocabulario personalizado.
- Estadísticas de productividad: Muestra en tiempo real la cantidad de palabras dictadas, la velocidad por minuto (WPM) y el historial de sesiones.
Estrategia de mercado y planificación futura:
Actualmente, la aplicación está disponible gratuitamente en la App Store de iOS, sin tarifas de suscripción ni restricciones de uso, lo que representa una fuerte competencia frente a productos como SuperWhisper, que cuesta 85 dólares anuales. Aunque se lanzó inicialmente en iOS, la descripción oficial confirma el plan de desarrollo para la versión de Android y anuncia el soporte para integración del teclado del sistema y funciones de botón flotante similares a Wispr Flow. Como miembro importante de la marca Google AI Edge, el lanzamiento de Eloquent no solo es un intento de aplicación de herramientas, sino también un caso de referencia para demostrar la capacidad de Google de implementar el modelo Gemma en dispositivos móviles.
