appx-1. 音声でのAIとの会話: 作業中にAIが音声でサポートする
Gemini Live でリアルタイムの会話を通じて作業する・練習する
Gemini Liveは、Googleが提供するAIアシスタント「Gemini」アプリの音声対話機能です。まるで人間と話しているかのように、リアルタイムで自然な会話ができます。(ChatGPTアプリにも同様の機能があります。)
Gemini Liveの主な機能と特徴は以下の通りです。
リアルタイムの音声対話: テキスト入力なしで、声でGeminiと会話できます。従来のAIアシスタントとは異なり、質問を途中で遮って追加の質問をしたり、話題を変えたりすることが可能で、より人間らしいスムーズな対話を実現します。
インタラプト機能: AIが話している途中でも、ユーザーが話しかけて会話を中断し、新しい質問を追加できる機能です。これにより、より自然な会話の流れが生まれます。
マルチモーダル対応: 音声だけでなく、カメラ映像やデバイスの画面内容をGeminiと共有しながら対話することができます。例えば、スマートフォンのカメラで目の前の物体を映して質問したり、画面に表示されている内容について尋ねたりすることが可能です。これにより、視覚情報を含むより複雑な状況に対応できます。
音声ならではの応用事例として、プレゼンテーションの練習、面接のリハーサル、手が話せない状況での機械操作の支援など、様々な学習でも活用できます。 会話の内容を自動でテキスト化し、要約することも可能です。 また、45以上の言語に対応しており、様々な言語で利用できます。
Gemini アプリを Live モードで使う方法
- Gemini モバイルアプリを開く: スマートフォン(Android または iPhone/iPad)で Gemini アプリを起動します。
- Live アイコンをタップまたはスワイプする: アプリの下部に表示されている Gemini Live アイコン(マイクの形をしたアイコン)をタップするか、左にスワイプします。
初回利用時の注意点:
- 初めて Live モードを使用する場合、マイク、カメラ、画面録画などのアクセス許可を求められることがあります。画面上のガイダンスに従って許可してください。
- 音声スタイル(話しかたや声質)を選択するオプションが表示されることもあります。
Live モードの一時停止・終了・再開:
- 一時停止: Live モード中に「一時停止」アイコンをタップすると、マイクがオフになり、一時停止します。
- 再開: 一時停止中にもう一度 Gemini Live アイコンをタップすると、再開できます。
- 終了: Live モードの会話を終了し、文字起こしを確認するには、「終了」をタップするか、右にスワイプします。
- 前回の会話を再開: 前回の Gemini Live の会話を再開するには、チャット履歴を開いて Gemini Live アイコンをタップするか、左にスワイプします。
最初からLiveモード(口頭での会話)で始めるのではなく、ある程度は文字で入力し送信した後で、Live モードに切り替えて、口頭での会話を開始することもできます。
練習(任意): Gemini Live (またはChatGPTライブモードなど)に、(就活担当の面接員、シンガポールのホテルのチェックイン窓口、など)何かの役割を指定した上で、会話を行ってみてください。