发明名称 |
语音合成方法及装置 |
摘要 |
本发明公开了一种语音合成方法及装置,用于利用预先建立的音库对输入的待合成语句进行语音合成,其中的方法包括:使用HMM模型预测待合成语句的声学参数,根据所述待合成语句的声学参数确定待合成语句中的关键帧;从音库中搜索合成所述关键帧所需的语音波形片段;对所述语音波形片段进行波形内插处理,并对内插处理后的语音波形进行拼接合成,恢复波形得到合成语音。本发明通过搜索音库得到关键帧处的合成样本,并通过内插得到关键帧间的各帧波形,可提高处理效率,并改善合成语音质量。 |
申请公布号 |
CN101710488B |
申请公布日期 |
2011.08.03 |
申请号 |
CN200910222899.0 |
申请日期 |
2009.11.20 |
申请人 |
安徽科大讯飞信息科技股份有限公司 |
发明人 |
凌震华;江源;胡郁;胡国平;刘庆峰 |
分类号 |
G10L13/02(2006.01)I |
主分类号 |
G10L13/02(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明;王宝筠 |
主权项 |
一种语音合成方法,用于利用预先建立的音库对输入的待合成语句进行语音合成,其特征在于,包括:利用HMM模型预测待合成语句的声学参数,所述声学参数包括:基频F0参数和线谱频率LSF参数;根据所述待合成语句的声学参数确定待合成语句中的关键帧;所述确定待合成语句中的关键帧包括:利用所述待合成语句的LSF参数,选取待合成语句的关键帧位置,所述关键帧位置的选取准则是,在预测的LSF参数序列中选择某些帧,使得基于这些帧的LSF参数恢复整句LSF参数时的恢复误差最小;从音库中搜索合成所述关键帧所需的语音波形片段,包括:选定各关键帧一定数量的备选语音波形片段;挑选最优的关键帧语音波形片段序列;对合成的所述关键帧所需的语音波形片段进行波形内插处理,并对内插处理后的语音波形进行拼接合成,恢复波形得到合成语音。 |
地址 |
230088 安徽省合肥市高新开发区黄山路616号 |