Google Translate gets new Gemini AI translation models

We’re bringing Gemini’s state-of-the-art translation model to Google Translate for text, and more new features.

Google翻訳は、AIを活用したリアルタイム翻訳機能を強化し、イヤホンで翻訳音声をそのまま聞ける仕組みを提供し始めています。Android版Google翻訳アプリでは、70以上の言語に対応したライブ翻訳が利用でき、会話の流れを止めずに意味を理解できる点が特徴です。
なぜこのような翻訳が可能になったのでしょうか。また、翻訳アプリがなかった時代の方法と比べて、何が変わったのでしょうか。

なぜリアルタイム翻訳が可能になったのか

このアップデートの中心にあるのが、GoogleのAIモデル「Gemini」です。Geminiは、文章の意味や文脈を理解するテキスト翻訳と、音声を直接別の言語の音声に変換する音声翻訳を統合しています。これにより、単語を直訳するのではなく、慣用句や話し言葉も自然な表現に置き換えた翻訳が行えます

音声翻訳では、話し手の発話をAIが解析し、内容を理解したうえで別の言語の音声を生成します。この処理はスマートフォンとクラウド上のAIで行われるため、イヤホン自体に専用チップは必要ありません。結果として、一般的なイヤホンでもリアルタイム翻訳が可能になっています。

Google翻訳ライブ翻訳の仕組みと特徴

Google翻訳のライブ翻訳は、2025年12月現在、Android版アプリのベータ機能として提供されています。
利用者はイヤホンをスマートフォンに接続し、アプリ内でライブ翻訳を選択すると、相手の話した内容が翻訳音声としてイヤホンに流れます。
提供地域は段階的に拡大されており、アメリカ、メキシコ、インドなどで先行提供されています。

この仕組みでは、翻訳処理の大部分をクラウド上のAIが担っています。Googleは、翻訳時に話し手の強調や話すリズムをできるだけ保つことを目標にしていると説明しています。文章だけでなく、会話として自然に聞こえる翻訳を目指している点が特徴です。

翻訳アプリがなかった時代のコミュニケーション

翻訳アプリが普及する以前、異なる言語を話す人どうしの会話は、人間の通訳や翻訳者が中心でした。国際会議や外交の場では、専門の通訳が発言内容を即座に別の言語へ伝えていました。一方、旅行者や一般の人は、会話集や紙の辞書を使い、必要な表現を探しながら会話していました。

言葉が通じにくい場面では、身ぶりや地図、数字を書いたメモなど、言語以外の手段も多く用いられていました。このように、コミュニケーションには時間と工夫が必要でしたが、人と人が直接やり取りすることが基本でした。

他のAI翻訳アプリやデバイスとの違い

リアルタイム音声翻訳は、Google翻訳以外にも複数のサービスが提供しています。Microsoftは、Microsoft TranslatorやSkype Translatorを通じて、会話音声をほぼ同時に字幕や音声へ変換しています。AppleもAirPods向けに対応言語間のライブ翻訳機能を発表しています。

その中でGoogle翻訳の特徴は、特定の専用イヤホンを必要とせず、一般的なイヤホンで利用できる点です。また、70以上の言語に対応し、Google翻訳アプリと統合されているため、翻訳機能を一つのアプリで利用できます。
対応言語数や使い方はサービスごとに異なるため、利用場面に応じた選択が必要です。

まとめ
  • Google翻訳はAIモデルGeminiを活用し、テキスト翻訳と音声翻訳を統合
  • Android版アプリのライブ翻訳は、イヤホンでリアルタイムに翻訳音声を聞ける
  • 翻訳アプリがない時代は、通訳や会話集、辞書、ジェスチャーが主な手段だった
  • 他社もリアルタイム翻訳を提供しているが、対応言語や利用条件は異なる

リアルタイム翻訳イヤホンは、言語が異なる人どうしの会話を身近なものにしています。一方で、翻訳技術が発展する以前から、人びとは通訳や会話集、身ぶりなどを使って言葉の壁を越えようとしてきました。
今後も新しい翻訳技術が登場する中で、どの場面でどのツールを使うかを考えることが重要になります。ニュースや公式発表を調べ、自分の興味がある分野で翻訳技術がどのように使われているのかを知ることは、学びや将来の仕事を考える手がかりになります。