发明名称 基于语音转换的情感语音生成方法
摘要 本发明公开一种新的基于语音转换的情感语音生成方法,包括训练阶段,对中性语音和情感语音分别提取频谱和基频特征,分别在频谱和基频特征上建立中性语音和情感语音的映射关系,在基频的表示和转换上是基于基频目标模型。对中性语音和情感语音的基频曲线提取模型参数,使用高斯混合模型和分类回归树的方法建立基频目标模型参数间的映射函数;包括生成阶段,同样对要转换的中性语音提取频谱和基频特征,对于基频特征通过利用训练阶段获得的映射函数对基频曲线进行转换,使得转换基频曲线具有情感的特性。最后将转换后的频谱和基频曲线合成为带有相应情感的转换语音。本发明可以用于个性化语音合成、带有表现力的语音合成等多个领域。
申请公布号 CN101064104B 申请公布日期 2011.02.02
申请号 CN200610076014.7 申请日期 2006.04.24
申请人 中国科学院自动化研究所 发明人 陶建华;康永国
分类号 G10L13/02(2006.01)I;G10L13/08(2006.01)I;G10L13/00(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 基于语音转换的情感语音生成方法,其特征在于:包括步骤:创建语音基频曲线模型:对语音的基频曲线,根据各音节边界,自动提取基频目标模型参数为(a,b,β,λ),基频目标模型参数分别表示为基频目标的斜率a和截距b、基频轨迹开始时基频曲线和基频目标之间的距离β,函数衰减的速度λ;创建用于训练的中性和情感相对应的参数集合:对中性语音和情感语音的基频目标模型参数,根据中性语音和情感语音发音内容一一对应在一起构成用于训练中性与情感参数映射关系的参数集;建立参数映射关系:根据创建的训练参数集,使用高斯混合模型或者分类回归树的方法建立中性和情感基频目标模型参数之间的映射关系;建立基频转换:使用训练得到的映射关系,对来自中性基频曲线的基频目标模型参数进行基频转换;重建基频曲线:根据基频目标模型对转换后的模型参数生成对应重建的基频曲线;语音合成:将转换后重建带有情感的基频曲线和带有情感的频谱包络合成为语音信号。
地址 100080 北京市海淀区中关村东路95号