あなたの声を「すぐそば」品質で聴くAI
~遠くからでも近接マイク品質で混ざった音を聞き分ける革新的音響処理技術~
日本電信電話株式会社
NTTコミュニケーション科学基礎研究所 上席特別研究員
中谷 智広 氏
話者から離れたマイクで音声を収録すると、残響や他の話者の音声、背景雑音などが混在し、音声は聞き取りにくくなり、音声認識などのアプリケーションの性能も劣化します。本講演では、そのように劣化した複数マイクによる収録音から、話者の近くのマイク(近接マイク)で収録したような高品質な音声を取り出す最新の音声強調技術を紹介します。また、深層学習に基づく単一マイク音声強調との連携についてもお話しします。