发明名称 一种语音合成单元时长的预测方法及装置
摘要 本发明提供了一种语音合成单元时长的预测方法和装置,包括:针对上下文环境参数,采用逐步线性回归的时长预测模型,对语音合成单元的时长进行初始预测,获得初始时长预测结果;采用决策树-高斯混合模型对所述初始时长预测结果进行分配,得到分配后的时长预测结果。本发明能够提高时长预测结果的准确性,使得从语音合成系统中合成出的语音具备真实的韵律感。
申请公布号 CN102231276A 申请公布日期 2011.11.02
申请号 CN201110167390.8 申请日期 2011.06.21
申请人 北京捷通华声语音技术有限公司 发明人 王愈;李健
分类号 G10L13/08(2006.01)I 主分类号 G10L13/08(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种逐步线性回归的时长预测模型的训练方法,其特征在于,包括:建立初始的线性回归的时长预测模型;在迭代所述线性回归的时长预测模型的过程中,通过评价每轮的时长预测模型选择上下文环境参数,最终得到最优时长预测模型。
地址 100193 北京市海淀区东北旺西路8号中关村软件园10号楼二层206-1