发明名称 基于声道动作知识库改进的DIVA神经网络模型发音方法
摘要 本发明涉及一种发音方法,尤其是基于声道动作知识库改进的DIVA神经网络模型发音方法。所述基于声道动作知识库改进的DIVA神经网络模型发音方法利用添加了声道动作知识库的改进后的DIVA神经网络模型,对于语音映射集中没有的语音,结合扰动因素得到修正后的听觉反馈信息,再利用修正后的听觉反馈信息训练神经网络,减少了模型在产生发音时的训练次数,提高发音准确性。
申请公布号 CN103310272B 申请公布日期 2016.06.08
申请号 CN201310274341.3 申请日期 2013.07.02
申请人 南京邮电大学 发明人 张少白;徐歆冰
分类号 G06F19/10(2011.01)I;G06N3/00(2006.01)I 主分类号 G06F19/10(2011.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 基于声道动作知识库改进的DIVA神经网络模型发音方法,其特征在于,包括如下步骤:步骤1,构建改进的DIVA神经计算学语音模型:在DIVA神经计算学语音模型中添加作用于模拟发音器官的声道动作知识库,所述声道动作知识库激活始于语音项的音素表征的激活,在处理高频音节时已经获取高频音节的规划运动,语音映射集激活规划运动,每个音节对应的声道动作产生运动神经元激活模式,神经肌肉处理导致了发音器官的运动并允许通过发音‑听觉模型生成语音信号,在处理低频音节时通过语音映射集激活相似音节语音学上的规划来激活规划运动;步骤2,采集发音单元的共振峰频率,作为DIVA神经计算学语音模型的输入量;步骤3,将DIVA神经网络模型的输入量映射到语音映射集中,初始化语音映射集中所有的音素单元为未激活状态;步骤4,输入任意发音单元的振峰频率,训练基于声道动作知识库改进的DIVA神经计算学语音模型:当语音映射集中存在于输入的发音单元的振峰频率相同的因素单元时,模拟发音器官直接经过前馈控制发出输入的发音单元;否则,模拟发音器官经过反馈控制学习发出输入的发音单元。
地址 210003 江苏省南京市鼓楼区新模范马路66号