Googleは4月6日、iOSプラットフォームで実験的な音声入力アプリ「Google AI Edge Eloquent」をリリースしました。オフライン動作とインテリジェントなテキスト編集を主な特徴とし、独自開発のGemma4シリーズASRモデル(E2B/E4B仕様)を搭載しています。アプリはローカルでの音声からテキストへの変換、感嘆詞や繰り返しの自動除去、および要点・フォーマル・簡潔・完全の4つのテキストスタイル変換をサポートします。ユーザーはクラウド上のGeminiモデルを有効にしてより深層的なクリーニングを実行でき、Gmailの連絡先と用語をインポートしてパーソナライズされた語彙表を構築できます。現在、アプリは無料でサブスクリプション制限がなく、年額85ドルの競合製品SuperWhisperとは明確に区別されます。Android版は開発計画に含まれており、今後はシステムキーボードとの統合とフローティング操作をサポートする予定です。これは、エッジAI音声処理分野におけるGoogleの実質的な実装を示すものであり、Gemmaモデルのモバイル端末における軽量デプロイ技術能力を強調しています。
文章作成者、出典:AIBase
現地時間4月6日(月曜日)、グーグルはiOSプラットフォーム上で、「Google AI Edge Eloquent」という実験的な音声入力アプリを静かにリリースしました。このアプリは「オフライン優先」と「スマート編集」を主な特徴とし、エッジ側AI技術を活用して、自然な口語をリアルタイムでプロフェッショナルで洗練されたテキストに変換することを目的としています。これは、グーグルがWispr FlowやSuperWhisperがリードする高級AI音声からテキストへの変換市場に本格参入したことを示す意味を持ちます。
核心技術と機能のハイライト:
Eloquentは、Googleが最新リリースしたGemma4シリーズ(E2B/E4B仕様)の自動音声認識(ASR)モデルを搭載しています。このモデルは完全オフラインで動作し、ユーザーはモデルパッケージをダウンロード後、ローカルで音声をテキスト化できます。これにより、プライバシーが強化され、レイテンシーが低減されます。アプリは強力な「スマートノイズ除去」機能を備えており、「ええ」と「ああ」などの填充語や繰り返し修正を自動的に認識・除去し、論理的に流暢なテキストを出力します。
製品の深層統合とインタラクション:
- マルチモーダルスタイル変換:「要点」、「フォーマル」、「短縮」、「完全」の4つのテキスト処理モードを提供します。
- クラウド連携(オプション):クラウドモードを有効にすると、アプリはクラウド上のGeminiモデルを呼び出して、テキストの深層クリーニングを実行します。
- Gmailからユーザー固有のキーワード、人名、用語をインポートし、カスタム語彙表を作成できます。
- 生産性統計:リアルタイムで書き取り文字数、分あたりの文字数(WPM)、および過去のセッション記録を表示します。
マーケティング戦略と今後の展開:
現在、このアプリはiOS App Storeで無料で提供されており、サブスクリプション料や使用制限がなく、年間85ドルの競合製品SuperWhisperなどと比較して非常に強い競争力を持っています。最初にiOSでリリースされましたが、公式説明ではAndroid版の開発計画が確認されており、システムレベルのキーボード統合やWispr Flowのようなフローティングボタン機能のサポートが予告されています。Google AI Edgeブランドの重要なメンバーとして、Eloquentのリリースはツールアプリの試みにとどまらず、Gemmaモデルのモバイルデプロイ能力を示すベンチマークケースです。
