发明名称 一种个性化歌唱语音的合成方法
摘要 本发明涉及一种个性化歌唱语音的合成方法,包括以下步骤:对语音的线谱频率系数进行建模,并训练得到相关的决策树模型;录制特定用户的朗读风格语音,得到该用户的线谱频率系数模型;得到简谱中的歌词上下文相关的属性集,根据决策树模型和个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;根据简谱约定生成基频信息,并与生成的时长、频谱参数合并后,得到所有的合成参数,将这些参数输入参数化语音合成声码器,可合成出个性化的歌唱语音。本发明提供了只要对少数的韵律参数进行调整,就能合成出歌唱风格的合成语音,只要能录制一个少量的朗读风格库,就能合成出歌唱风格语音的合成方法。
申请公布号 CN101308652B 申请公布日期 2011.06.29
申请号 CN200810107114.0 申请日期 2008.07.17
申请人 安徽科大讯飞信息科技股份有限公司 发明人 王玉平;江源;凌震华;胡国平;胡郁;刘庆峰;王仁华
分类号 G10L13/02(2006.01)I;G10L13/04(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 合肥天明专利事务所 34115 代理人 袁由茂
主权项 一种个性化歌唱语音的合成方法,其特征在于包括以下步骤实现:(1)在大规模标准语音数据库上,用隐马尔科夫模型对语音的线谱频率系数进行建模,并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型;(2)录制特定用户的少量朗读风格语音,并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应,得到该用户的个性化的线谱频率系数模型;(3)对文本化的简谱中的歌词,经过文本处理分析后,得到上下文相关的属性集,然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;(4)根据简谱对于唱歌的音调、节拍的约定,生成基频信息,并对(3)中预测得到的时长信息进行调整;(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后,就生成了最后的参数;这些参数是既具有目标说话人特征,又具有歌唱特征的基频、时长和线谱频率参数,将这些参数输入参数化语音合成声码器,即可合成出个性化的歌唱语音。
地址 230088 安徽省合肥市高新区黄山路616号信息产业基地