Googleは、Geminiアプリに大規模なアップデートをリリースし、新しいエージェント機能、再設計されたインターフェース、拡張された動画生成ツールを導入します。これにより、同社はGeminiをチャットボットを超えて、より能動的なAIアシスタントへと進化させようとしています。
Googleの発表によると、この更新は、Geminiが昨年の4億ユーザーから、230か国以上、70以上の言語で月間9億ユーザー以上に達したことを受けて行われました。同社は、新バージョンにGemini 3.5 Flash、Gemini Omni、Daily Brief、Gemini Spark、新しいmacOSアプリ、およびNeural Expressiveと呼ばれる再設計されたインターフェースが含まれていると述べています。
Gemini Sparkが今回のアップデートで最大の変更点です。GoogleはSparkを、Gmail、Docs、Slidesその他のWorkspaceツールでバックグラウンドで動作する24時間365日の個人用AIエージェントと説明しています。ユーザーがラップトップを閉じたり、スマートフォンをロックしても動作し続けます。このエージェントは繰り返しのタスクを処理し、メールからの情報を整理し、プロジェクト文書を作成し、ユーザーの指示に従ってフォローアップメッセージを作成できます。
Sparkは、Geminiを反応型アシスタントから、バックグラウンドで継続して作業できる常時稼働エージェントに変えることを目的としています。ベータアクセスは、来週、米国在住のGoogle AI Ultraサブスクライバーを対象に予定されています。
Googleは、GmailやCalendarなどの連携アプリから情報を抽出するパーソナライズされた朝の要約「Daily Brief」も導入しました。この機能は、緊急の更新情報、予定されているイベント、および推奨される次のステップを表示することを目的としており、ユーザーはフィードバックを通じて時間とともに要約を細かく調整できます。Daily Briefは、米国におけるGoogle AI Plus、Pro、およびUltraのサブスクライバー向けに順次提供を開始します。
同社はまた、テキスト、画像、動画のプロンプトを高品質な動画出力に変換する「Gemini Omni」を発表しました。Googleは、Omniが会話型動画編集、背景の切り替え、シネマティックなズーム、テンプレート、カスタムAIアバターをサポートすると述べています。このモデルは、Google AI Plus、Pro、Ultraのサブスクライバー向けに世界中で順次提供を開始します。
Gemini Omniは、GoogleがGeminiをよりマルチモーダルにすることを目的とした取り組みの一部であり、動画生成、より豊かな応答フォーマット、そしてアプリとの深層統合が製品の中心となっています。
Googleは、滑らかなアニメーション、明るいビジュアル、更新されたタイポグラフィ、ヒューリスティックフィードバック、およびGemini Liveのより深い統合を備えた新しいインターフェースシステム「Neural Expressive」を通じてGeminiを再設計しています。
同社は、ユーザーがテキストとライブ音声会話の間をより簡単に切り替えられるようになり、Geminiの応答が画像、タイムライン、ナレーション付き動画、ダイナミックなグラフィックスを通じてより視覚的になると述べました。
この更新により、Geminiのデスクトップにおける野心も拡大されます。Googleは、macOSアプリが現在利用可能であり、今夏の後半にはSparkとの統合と新しい音声機能が予定されていると述べました。これらの更新により、Geminiはローカルファイルの支援、デスクトップワークフローの自動化、および画面のコンテキストを活用して自然な話し言葉をより洗練された原稿に変換することが可能になります。
この展開は、Geminiをアプリ、ファイル、メディア、日常のワークフロー全体で動作する汎用アシスタントとするためのGoogleのより広範な取り組みを強調しています。Sparkは今週、信頼できるテストユーザーに最初にリリースされ、来週には米国のGoogle AI Ultraサブスクライバー向けにベータ版が計画されています。
