发明名称 |
参数语音合成方法和系统 |
摘要 |
本发明提供了一种参数语音合成方法和系统,该方法包括:依次对输入文本的音素序列中每一音素的每一帧语音进行如下处理:对当前音素,从统计模型库中提取相应的统计模型,并将该统计模型在当前音素当前帧下相应的模型参数作为当前所预测语音参数的粗略值;利用粗略值以及当前时刻之前预定数目语音帧的信息,得到当前所预测语音参数的平滑值;根据统计得到的语音参数的全局均值和全局标准差比值,对语音参数的平滑值进行全局优化,生成所需的语音参数;对生成的所述语音参数进行合成,得到对当前音素当前帧所合成的一帧语音。利用本方案,能够使语音合成所需要的RAM不会随着合成语音长度的增加而增加,合成语音的时长不再受到RAM的限制。 |
申请公布号 |
CN102385859A |
申请公布日期 |
2012.03.21 |
申请号 |
CN201110331821.X |
申请日期 |
2011.10.27 |
申请人 |
歌尔声学股份有限公司 |
发明人 |
吴凤梁;职振华 |
分类号 |
G10L13/08(2006.01)I;G10L13/04(2006.01)I;G10L19/08(2006.01)I |
主分类号 |
G10L13/08(2006.01)I |
代理机构 |
北京市隆安律师事务所 11323 |
代理人 |
权鲜枝 |
主权项 |
一种参数语音合成方法,包括:在合成阶段,依次对输入文本的音素序列中每一音素的每一帧语音进行如下处理:对输入文本的音素序列中的当前音素,从统计模型库中提取相应的统计模型,并将该统计模型在当前音素当前帧下相应的模型参数作为当前所预测语音参数的粗略值;利用所述粗略值以及当前时刻之前预定数目语音帧的信息,对所述粗略值进行滤波,得到当前所预测语音参数的平滑值;根据统计得到的所述语音参数的全局均值和全局标准差比值,对所述当前所预测语音参数的平滑值进行全局优化,生成所需的语音参数;对生成的所述语音参数进行合成,得到对当前音素当前帧所合成的一帧语音。 |
地址 |
261031 山东省潍坊市高新技术产业开发区东方路268号 |