发明名称 一种语音的响度均衡处理方法
摘要 本发明公开了一种语音的响度均衡处理方法,包括以下步骤:(1)语音输入信号数据段进行类型判断,将数据段标记为需要响度调整的第一类型数据段或不需要响度调整的第二类型数据段;(2)对数据段进行上下文标志判断,初始时上下文标志设为0,若上文的上下文标志为0,则第一类型数据段的上下文标志置1,并加起始窗函数,响度调整后输出;第二类型数据段的上下文标志仍为0,直接输出;若上文的上下文标志为1,则第一类型数据段进行响度调整后输出;第二类型数据段则将上下文标志置0,并加结束窗,响度调整后输出。本发明消除了语音输出的不稳定的因素,提供一个相对稳定的感知语音强度,提高了语音的感知质量。
申请公布号 CN101483416B 申请公布日期 2011.09.14
申请号 CN200910095724.8 申请日期 2009.01.20
申请人 杭州火莲科技有限公司 发明人 金旖青;宋钦梅
分类号 H03G9/02(2006.01)I;H03G9/14(2006.01)I 主分类号 H03G9/02(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 一种语音的响度均衡处理方法,其特征在于:包括以下步骤:(1)语音输入信号数据段进行类型判断,将数据段标记为需要响度调整的第一类型数据段或不需要响度调整的第二类型数据段;(2)对数据段进行上下文标志判断,初始时上下文标志设为0,若上文的上下文标志为0,则第一类型数据段的帧计数,当第一类型数据段的帧数小于第一帧数阈值时,直接输出,当第一类型数据段的帧数等于第一帧数阈值时,该第一类型数据段的上下文标志置1,加起始窗函数,响度调整后输出;第二类型数据段的上下文标志仍为0,帧计数清零后直接输出;若上文的上下文标志为1,则第一类型数据段的上下文标志仍为1,并帧计数,响度调整后输出;第二类型数据段在帧数小于第二帧数阈值时,第二类型数据段的上下文标志仍为1,直接输出并帧计数,第二类型数据段在帧数大于等于第二帧数阈值时,帧计数归零,上下文标志设置0,加结束窗,响度调整后输出。
地址 310012 浙江省杭州市西湖区文三路199号创业大厦十四楼1401室