Googleは現地時間9日、最新のライブ音声翻訳を実現するAIオーディオモデル「Gemini 3.5 Live Translate」を発表しました。
Gemini 3.5 Live Translateについて
Gemini 3.5 Live Translateの性能
Gemini 3.5 Live Translate(以下、本文ではLive Translateと表記)の特徴について詳しく説明します。
まず、Live Translateは70以上の言語に対応するライブ音声翻訳向けのAIオーディオモデルです。
話者のイントネーションやペース、ピッチを維持した滑らかで自然な音声翻訳を生成し、話者が話し終えるまで応答しないターンバイターン方式のシステムと異なり、音声を連続的に生成することで、文脈を考慮して品質を向上させることが可能になります。また、話者との同期を保つ為に即座に翻訳することのバランスをとります。
ぎこちない間もなくスムーズな翻訳音声を提供し、会話を通して話者からわずか数秒遅れるだけとなります。
Gemini 3.5 Live Translateの提供範囲と時期
Gemini 3.5 Live Translateは本日より、順次展開されます。
- Gemini Live APIとGoogle AI Studioを介した開発者向けパブリックプレビュー版
- Google Meetでプレビューを開始する企業向け
- AndroidとiOSにおけるGoogle翻訳ユーザー
関連リンク
Fluid, natural voice translation with Gemini 3.5 Live Translate(Google公式ブログ The Keywordより)