摘要 |
【課題】音声を合成する際に行われる話者性の制御を、ユーザの意図した通りに精度良く行う。【解決手段】実施形態の学装置は、記憶部と学部とを備える。記憶部は、複数の種類の話者の音声波形から抽出された音響データ及び言語データを用いて構築された平均声モデルと、学話者の音声の特徴を表す学話者情報と、学話者の声質を音声に関する1以上の知覚表現の得点により表した知覚表現得点情報と、を記憶する。学部は、平均声モデルと、学話者情報と、知覚表現得点情報と、から、1以上の知覚表現に対応する1以上の知覚表現音響モデルを学する。【選択図】図1 |