生成AIで音声を忠実再現

Published by
共同通信
NTTが開発した音声合成技術のイメージ

 NTTは17日、生成人工知能(AI)を活用し、その人の声や話し方を忠実に再現する音声合成技術を開発したと発表した。インターネット上の仮想空間「メタバース」での活用のほか、病気などで失語した人の声を復活させるといった用途が見込まれる。商用化に向け、今後1~2年かけて実証研究を進める。

 新技術は、数分~10分程度の音声データを機械に読み込ませて声を合成する。性別や年代による声色の特徴を高いレベルで再現するだけでなく、同じ言葉でも「平静」や「喜び」、「悲しみ」など感情に変化をつけて発声できるという。数秒の音声データだけでも本人に似た声を再現できる簡易版の技術も開発した。