Gemini Live でリアルタイムの会話を通じて作業する・練習する

Gemini Liveは、Googleが提供するAIアシスタント「Gemini」アプリの音声対話機能です。まるで人間と話しているかのように、リアルタイムで自然な会話ができます。(ChatGPTアプリにも同様の機能があります。)


Gemini Liveの主な機能と特徴は以下の通りです。

リアルタイムの音声対話: テキスト入力なしで、声でGeminiと会話できます。従来のAIアシスタントとは異なり、質問を途中で遮って追加の質問をしたり、話題を変えたりすることが可能で、より人間らしいスムーズな対話を実現します。

インタラプト機能: AIが話している途中でも、ユーザーが話しかけて会話を中断し、新しい質問を追加できる機能です。これにより、より自然な会話の流れが生まれます。

マルチモーダル対応: 音声だけでなく、カメラ映像やデバイスの画面内容をGeminiと共有しながら対話することができます。例えば、スマートフォンのカメラで目の前の物体を映して質問したり、画面に表示されている内容について尋ねたりすることが可能です。これにより、視覚情報を含むより複雑な状況に対応できます。

音声ならではの応用事例として、プレゼンテーションの練習、面接のリハーサル、手が話せない状況での機械操作の支援など、様々な学習でも活用できます。 会話の内容を自動でテキスト化し、要約することも可能です。 また、45以上の言語に対応しており、様々な言語で利用できます。


Gemini アプリを Live モードで使う方法

  1. Gemini モバイルアプリを開く: スマートフォン(Android または iPhone/iPad)で Gemini アプリを起動します。
  2. Live アイコンをタップまたはスワイプする: アプリの下部に表示されている Gemini Live アイコン(マイクの形をしたアイコン)をタップするか、左にスワイプします。

初回利用時の注意点:

  • 初めて Live モードを使用する場合、マイク、カメラ、画面録画などのアクセス許可を求められることがあります。画面上のガイダンスに従って許可してください。
  • 音声スタイル(話しかたや声質)を選択するオプションが表示されることもあります。

Live モードの一時停止・終了・再開:

  • 一時停止: Live モード中に「一時停止」アイコンをタップすると、マイクがオフになり、一時停止します。
  • 再開: 一時停止中にもう一度 Gemini Live アイコンをタップすると、再開できます。
  • 終了: Live モードの会話を終了し、文字起こしを確認するには、「終了」をタップするか、右にスワイプします。
  • 前回の会話を再開: 前回の Gemini Live の会話を再開するには、チャット履歴を開いて Gemini Live アイコンをタップするか、左にスワイプします。

最初からLiveモード(口頭での会話)で始めるのではなく、ある程度は文字で入力し送信した後で、Live モードに切り替えて、口頭での会話を開始することもできます。


練習(任意): Gemini Live (またはChatGPTライブモードなど)に、(就活担当の面接員、シンガポールのホテルのチェックイン窓口、など)何かの役割を指定した上で、会話を行ってみてください。

Last modified: Tuesday, 9 September 2025, 1:13 AM