Google 6 квітня запустила експериментальну програму для голосового вводу Google AI Edge Eloquent на платформі iOS, з акцентом на роботу автономно та розумне поліпшення тексту. Програма використовує власні ASR-моделі серії Gemma4 (специфікації E2B/E4B), підтримує локальне перетворення мови на текст, автоматичне видалення мовних часток та виправлення повторів, а також надає чотири стилі перетворення тексту: ключові моменти, офіційний, стислий та повний. Користувачі можуть увімкнути хмарну модель Gemini для глибокої очистки та імпортувати контакти Gmail і терміни для створення персоналізованого словника. Програма зараз безкоштовна, без обмежень підписки, що суттєво відрізняє її від конкурента SuperWhisper, який коштує 85 доларів на рік. Версія для Android вже знаходиться у розробці, і майбутні оновлення підтримуватимуть інтеграцію з системною клавіатурою та плаваючі функції. Цей крок означає реальне впровадження Google у сфері обробки голосу на краю AI та демонструє технічні можливості моделей Gemma щодо легковагого розгортання на мобільних пристроях.
Автор статті, джерело: AIBase
У місцевий час 6 квітня (понеділок) Google тихо запустила на платформі iOS експериментальну голосову додаток під назвою «Google AI Edge Eloquent». Додаток зосереджений на принципі «офлайн-перш за все» та «розумному редагуванні», метою якого є використання AI-технологій на краю для перетворення природної розмовної мови на професійний, стислий текст у реальному часі. Цей крок означає, що Google офіційно увійшла на ринок висококласних AI-додатків для перетворення голосу в текст, який очолюють Wispr Flow і SuperWhisper.
Ключові технології та переваги функцій:
Eloquent оснащений найновішою моделлю автоматичного розпізнавання мови (ASR) Gemma4 від Google (специфікації E2B/E4B). Модель підтримує повну роботу в автономному режимі — після завантаження пакета моделі користувачі можуть виконувати локальне транскрібування, що ефективно забезпечує конфіденційність та зменшує затримки. Додаток має потужну функцію «розумного очищення», яка автоматично виявляє та фільтрує мовні частки, такі як «ем» та «а», а також повторення та виправлення, щоб надавати логічно зв’язний текст.
Глибока інтеграція та взаємодія продукту:
- Багатомодальний перетворення стилю: надає чотири режими обробки тексту — «ключові пункти», «офіційний», «короткий» та «повний».
- Спільна робота в хмарі (за бажанням): після увімкнення хмарного режиму додаток використовуватиме хмарну модель Gemini для глибокого очищення тексту.
- Персоналізований контекст: підтримка імпорту користувацьких ключових слів, імен та термінів з Gmail та можливість створення власного словника.
- Статистика продуктивності: у реальному часі відображає кількість слів, швидкість набору на хвилину (WPM) та історію сеансів.
Ринкова стратегія та майбутнє розташування:
Зараз додаток безкоштовно доступний у iOS App Store без підписки чи обмежень у використанні, що створює сильну конкуренцію таким конкурентам, як SuperWhisper, який коштує 85 доларів на рік. Хоча він був запущений спочатку для iOS, офіційний опис підтверджує план розробки версії для Android і передбачає підтримку інтеграції клавіатури на рівні системи та плаваючої кнопки, подібно до Wispr Flow. Як важливий представник бренду Google AI Edge, випуск Eloquent — це не просто спроба створити інструментальний додаток, а й визначальний приклад того, як Google демонструє можливості розгортання моделі Gemma на мобільних пристроях.
