摘要 |
【課題】主観的な品質に影響を与えるコンテキストを決定木に反映させることで予測モデルの精度を実用において高めることにより、音声合成パラメータ時系列データの計算コストを増加させることなく、最終的な合成音声の品質を向上させる。【解決手段】音声データから抽出した複数種の音声合成パラメータのうち、音声合成に用いる標準ベクトルxと音声合成に用いない追加ベクトルx'とを連結して拡張ベクトルXを生成し、これを評価規準として、HMM状態の集合に対してモデル尤度が最大となる分割条件をノード毎に決定することを繰り返し、各リーフノードに各音声合成パラメータの分布情報が登録された決定木を構築し、各リーフノードから追加ベクトルに対応した分布情報を削除する。これにより、決定木のルートノードおよび各中間ノードには、拡張ベクトルを反映した分割条件が紐付け、各リーフノードには標準ベクトルxに関する分布情報のみが対応付けられる。【選択図】図4 |