发明名称 |
自适应语音可理解性处理器 |
摘要 |
本申请描述了用于自适应地处理语音以改进语音可理解性的系统和方法。这些系统和方法可以自适应地识别和跟踪共振峰位置,从而使共振峰能够在改变时得到强调。因此,即使在有噪环境中,这些系统和方法也可以改进近端可理解性。所述系统和方法可以在IP语音(VoIP)应用、电话和/或视频会议应用(包括在蜂窝电话、智能电话等上)、膝上型和平板通信等中实现。所述系统和方法还可以增强非浊音话音,所述非浊音话音可以包括无需声道而产生的话音,如,瞬态话音。 |
申请公布号 |
CN103827965B |
申请公布日期 |
2016.05.25 |
申请号 |
CN201280047329.2 |
申请日期 |
2012.07.26 |
申请人 |
DTS有限责任公司 |
发明人 |
鲁迪克阳;何星;詹姆斯·特雷西 |
分类号 |
G10L21/003(2006.01)I;G10L21/0316(2006.01)I;G10L21/0364(2006.01)I;G10L19/07(2006.01)I;G10L25/15(2006.01)I |
主分类号 |
G10L21/003(2006.01)I |
代理机构 |
中科专利商标代理有限责任公司 11021 |
代理人 |
杨静 |
主权项 |
一种调整语音可理解性增强的方法,所述方法包括:接收输入的语音信号;利用线性预测编码LPC过程来获得输入的语音信号的谱表示,所述谱表示包括一个或更多个共振峰频率;利用一个或更多个处理器来调整输入的语音信号的谱表示,以产生增强滤波器,所述增强滤波器被配置为强调所述一个或更多个共振峰频率;对从输入的语音信号导出的激励信号应用所述增强滤波器,以产生具有增强的共振峰频率的第一增强信号;对输入的语音信号应用所述增强滤波器,以产生第二增强信号;将第一增强信号和第二增强信号相组合,以产生修改后的语音信号;基于输入的语音信号来检测包络;分析修改后的语音信号的包络,以确定一个或更多个时间增强参数;以及对修改后的语音信号应用所述一个或更多个时间增强参数,以产生输出的语音信号;其中,至少所述应用所述一个或更多个时间增强参数由一个或更多个处理器来执行。 |
地址 |
美国加利福尼亚州 |