Google выпустила экспериментальное приложение для голосового ввода Google AI Edge Eloquent на платформе iOS 6 апреля, акцентируя внимание на работе в автономном режиме и интеллектуальной коррекции текста. Приложение использует собственную модель ASR серии Gemma4 (версии E2B/E4B), поддерживающую локальное преобразование речи в текст, автоматическое удаление междометий и повторов, а также предоставляет четыре стиля преобразования текста: ключевые моменты, формальный, краткий и полный. Пользователи могут включить облачную модель Gemini для глубокой очистки и импортировать контакты из Gmail и термины для создания персонализированного словаря. Приложение доступно бесплатно без ограничений по подписке, что значительно отличает его от конкурента SuperWhisper, стоимость которого составляет 85 долларов в год. Версия для Android уже в планах разработки; в будущем планируется поддержка интеграции с системной клавиатурой и плавающей операцией. Этот шаг означает реальное внедрение Google в область обработки голоса на краевых устройствах и демонстрирует технические возможности модели Gemma для легковесного развертывания на мобильных устройствах.
Автор статьи, источник: AIBase
6 апреля (понедельник), по местному времени, Google незаметно запустил на платформе iOS экспериментальное приложение для голосового ввода под названием «Google AI Edge Eloquent». Приложение фокусируется на функциях «оффлайн-первый» и «умная редактура», стремясь использовать технологии ИИ на краю для преобразования естественной устной речи в профессиональный и лаконичный текст в реальном времени. Этот шаг означает, что Google официально вошел в сегмент высококлассных решений для преобразования речи в текст, возглавляемый Wispr Flow и SuperWhisper.
Ключевые технологии и особенности функций:
Eloquent оснащен новейшей моделью автоматического распознавания речи (ASR) Gemma4 серии (спецификации E2B/E4B), выпущенной Google. Модель поддерживает полную автономную работу: после загрузки пакета модели пользователи могут выполнять локальную транскрипцию, что эффективно защищает конфиденциальность и снижает задержки. Приложение обладает мощной функцией «умной очистки», которая автоматически распознает и фильтрует междометия, такие как «э-э» и «а-а», а также повторы и исправления, выводя логически связный текст.
Глубокая интеграция и взаимодействие продукта:
- Мультимодальное преобразование стиля: предоставляет четыре режима обработки текста — «ключевые моменты», «официальный», «краткий» и «полный».
- Облачное взаимодействие (опционально): После включения облачного режима приложение будет использовать облачную модель Gemini для глубокой очистки текста.
- Персонализированный контекст: поддержка импорта пользовательских ключевых слов, имен и терминов из Gmail, а также возможность создания пользовательского словаря.
- Статистика производительности: отображение количества распознанных слов в реальном времени, скорости в словах в минуту (WPM) и истории сессий.
Рыночная стратегия и будущее развитие:
Сейчас приложение бесплатно доступно в iOS App Store без подписки или ограничений по использованию, что представляет собой серьезную конкуренцию таким продуктам, как SuperWhisper, стоящим 85 долларов в год. Несмотря на то, что оно было выпущено первоначально для iOS, официальное описание подтверждает планы по разработке версии для Android и обещает поддержку интеграции клавиатуры на системном уровне и всплывающей кнопки, подобной Wispr Flow. Как важный продукт под брендом Google AI Edge, выпуск Eloquent — это не просто попытка создать инструментальное приложение, а также эталонный пример демонстрации возможностей модели Gemma по развертыванию на мобильных устройствах.
