发明名称 |
基频和停顿预测及语音合成的方法和装置 |
摘要 |
本发明提供了数据驱动训练基频和停顿预测模型、基频和停顿预测以及语音合成方法和装置。本发明的数据驱动训练基频预测模型的方法包括:用正交多项式表示基频;对于上述正交多项式的每一个参数,利用与基频预测相关的多个属性和至少一部分上述属性的组合生成一个初始参数预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述参数预测模型的每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成参数预测模型;判断上述重新生成的参数预测模型是否最优;以及如果上述参数预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤;其中,上述正交多项式及其全部参数预测模型构成基频预测模型。 |
申请公布号 |
CN101051459A |
申请公布日期 |
2007.10.10 |
申请号 |
CN200610073145.X |
申请日期 |
2006.04.06 |
申请人 |
株式会社东芝 |
发明人 |
易立夫;郝杰 |
分类号 |
G10L13/08(2006.01);G10L13/00(2006.01) |
主分类号 |
G10L13/08(2006.01) |
代理机构 |
北京市中咨律师事务所 |
代理人 |
李峥;刘瑞东 |
主权项 |
1.一种数据驱动训练基频预测模型的方法,包括:用正交多项式表示基频;对于上述正交多项式的每一个参数,利用与基频预测相关的多个属性和至少一部分上述属性的组合生成一个初始参数预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述参数预测模型的每一上述项的重要性; 删除上述计算出的重要性最低的项;利用剩余的项重新生成参数预测模型;判断上述重新生成的参数预测模型是否最优;以及如果上述参数预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤;其中,上述正交多项式及其全部参数预测模型构成基频预测模型。 |
地址 |
日本东京都 |