发明名称 语音合成方法及装置
摘要 本发明公开了一种语音合成方法及装置,用于利用预先建立的音库对输入的待合成语句进行语音合成,其中的方法包括:使用HMM模型预测待合成语句的声学参数,根据所述待合成语句的声学参数确定待合成语句中的关键帧;从音库中搜索合成所述关键帧所需的语音波形片段;对所述语音波形片段进行波形内插处理,并对内插处理后的语音波形进行拼接合成,恢复波形得到合成语音。本发明通过搜索音库得到关键帧处的合成样本,并通过内插得到关键帧间的各帧波形,可提高处理效率,并改善合成语音质量。
申请公布号 CN101710488B 申请公布日期 2011.08.03
申请号 CN200910222899.0 申请日期 2009.11.20
申请人 安徽科大讯飞信息科技股份有限公司 发明人 凌震华;江源;胡郁;胡国平;刘庆峰
分类号 G10L13/02(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 逯长明;王宝筠
主权项 一种语音合成方法,用于利用预先建立的音库对输入的待合成语句进行语音合成,其特征在于,包括:利用HMM模型预测待合成语句的声学参数,所述声学参数包括:基频F0参数和线谱频率LSF参数;根据所述待合成语句的声学参数确定待合成语句中的关键帧;所述确定待合成语句中的关键帧包括:利用所述待合成语句的LSF参数,选取待合成语句的关键帧位置,所述关键帧位置的选取准则是,在预测的LSF参数序列中选择某些帧,使得基于这些帧的LSF参数恢复整句LSF参数时的恢复误差最小;从音库中搜索合成所述关键帧所需的语音波形片段,包括:选定各关键帧一定数量的备选语音波形片段;挑选最优的关键帧语音波形片段序列;对合成的所述关键帧所需的语音波形片段进行波形内插处理,并对内插处理后的语音波形进行拼接合成,恢复波形得到合成语音。
地址 230088 安徽省合肥市高新开发区黄山路616号