发明名称 |
一种汉藏双语跨语言语音转换的方法及其系统 |
摘要 |
本发明公开了一种汉藏双语跨语言语音转换的方法,包括以下步骤:A、通过设计相应的文本语料,录制语音语料,对所述语音语料进行切分与标注,基元归类和目录索引等,完成藏语拉萨话音节库和汉语普通话韵律特征分析库的建立;B、利用五度字调模型建立基频模型,同时建立时长转换模型和停顿时长转换模型,完成韵律模型的建立;C、输入藏语文本,利用决策树算法从建立的藏语拉萨话音节库中选取出合适的音节,完成基于波形拼接技术的语音转换;D、利用STRAIGHT算法对转换的语音进行基频,时长、停顿时长等韵律参数的修改,完成韵律控制,输出汉语普通话语音。实现基于韵律控制的汉藏双语跨语言语音转换系统。 |
申请公布号 |
CN106128450A |
申请公布日期 |
2016.11.16 |
申请号 |
CN201610796294.2 |
申请日期 |
2016.08.31 |
申请人 |
西北师范大学 |
发明人 |
甘振业;贾浩洁;阮文彬;杨鸿武;余珊珊;孔新杰 |
分类号 |
G10L13/02(2013.01)I;G10L13/07(2013.01)I;G10L13/08(2013.01)I |
主分类号 |
G10L13/02(2013.01)I |
代理机构 |
北京世誉鑫诚专利代理事务所(普通合伙) 11368 |
代理人 |
孙国栋 |
主权项 |
一种汉藏双语跨语言语音转换的方法,其特征在于,包括以下步骤:A、通过设计相应的文本语料,录制语音语料,对所述语音语料进行切分与标注,基元归类和目录索引等,完成藏语拉萨话音节库和汉语普通话韵律特征分析库的建立;B、利用五度字调模型建立基频模型,同时利用统计方法建立时长转换模型和停顿时长转换模型,完成韵律模型的建立;C、输入藏语文本,利用决策树算法从建立的藏语拉萨话音节库中选取出合适的音节,完成基于波形拼接技术的语音转换;D、利用STRAIGHT算法对转换的语音进行基频、时长、停顿时长等韵律参数的修改,完成韵律控制,输出汉语普通话语音。 |
地址 |
730070 甘肃省兰州市安宁区安宁东路967号西北师范大学 |