发明名称 |
一种语音合成的方法和装置 |
摘要 |
本发明实施例提供了一种语音合成的方法和装置以及一种基频模型的训练方法和装置,其中,语音合成的方法包括:对待合成文本中的各音段进行音段模型决策,确定所述各音段对应的基线HTS基频模型;对所述待合成文本中的各音节进行音节模型决策,确定所述各音节对应的连续浊音段基频模型;依据所述各音段对应的基线HTS基频模型与所述各音节对应的连续浊音段基频模型,按照多层融合算法联合生成融合基频参数;依据所述融合基频参数以及对应的谱参数合成语音。本发明实施例能够提高音高的准确度,从而使韵律更接近真实语音。 |
申请公布号 |
CN104916282A |
申请公布日期 |
2015.09.16 |
申请号 |
CN201510142395.3 |
申请日期 |
2015.03.27 |
申请人 |
北京捷通华声语音技术有限公司 |
发明人 |
王愈;李健;张连毅;武卫东 |
分类号 |
G10L13/08(2013.01)I;G10L15/06(2013.01)I;G10L15/183(2013.01)I;G10L25/93(2013.01)I |
主分类号 |
G10L13/08(2013.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
刘祥景 |
主权项 |
一种语音合成的方法,其特征在于,所述方法包括:对待合成文本中的各音段进行音段模型决策,确定所述各音段对应的基线HTS基频模型;对所述待合成文本中的各音节进行音节模型决策,确定所述各音节对应的连续浊音段基频模型;依据所述各音段对应的基线HTS基频模型与所述各音节对应的连续浊音段基频模型,按照多层融合算法联合生成融合基频参数;依据所述融合基频参数以及对应的谱参数合成语音。 |
地址 |
100193 北京市海淀区东北旺西路8号中关村软件园10号楼二层206-1 |