发明名称 一种汉藏双语跨语言语音转换的方法及其系统
摘要 本发明公开了一种汉藏双语跨语言语音转换的方法,包括以下步骤:A、通过设计相应的文本语料,录制语音语料,对所述语音语料进行切分与标注,基元归类和目录索引等,完成藏语拉萨话音节库和汉语普通话韵律特征分析库的建立;B、利用五度字调模型建立基频模型,同时建立时长转换模型和停顿时长转换模型,完成韵律模型的建立;C、输入藏语文本,利用决策树算法从建立的藏语拉萨话音节库中选取出合适的音节,完成基于波形拼接技术的语音转换;D、利用STRAIGHT算法对转换的语音进行基频,时长、停顿时长等韵律参数的修改,完成韵律控制,输出汉语普通话语音。实现基于韵律控制的汉藏双语跨语言语音转换系统。
申请公布号 CN106128450A 申请公布日期 2016.11.16
申请号 CN201610796294.2 申请日期 2016.08.31
申请人 西北师范大学 发明人 甘振业;贾浩洁;阮文彬;杨鸿武;余珊珊;孔新杰
分类号 G10L13/02(2013.01)I;G10L13/07(2013.01)I;G10L13/08(2013.01)I 主分类号 G10L13/02(2013.01)I
代理机构 北京世誉鑫诚专利代理事务所(普通合伙) 11368 代理人 孙国栋
主权项 一种汉藏双语跨语言语音转换的方法,其特征在于,包括以下步骤:A、通过设计相应的文本语料,录制语音语料,对所述语音语料进行切分与标注,基元归类和目录索引等,完成藏语拉萨话音节库和汉语普通话韵律特征分析库的建立;B、利用五度字调模型建立基频模型,同时利用统计方法建立时长转换模型和停顿时长转换模型,完成韵律模型的建立;C、输入藏语文本,利用决策树算法从建立的藏语拉萨话音节库中选取出合适的音节,完成基于波形拼接技术的语音转换;D、利用STRAIGHT算法对转换的语音进行基频、时长、停顿时长等韵律参数的修改,完成韵律控制,输出汉语普通话语音。
地址 730070 甘肃省兰州市安宁区安宁东路967号西北师范大学