发明名称 一种语音增强的系统
摘要 本发明提供了一种语音增强的系统,通过特定的双麦克结构,模拟人耳的听觉场景分析能力来实现语音增强,具有与噪声类型无关的特点,可广泛应用于各类噪声环境下的语音增强,利用计算听觉场景分析的原理,将目标语音从背景噪声中进行分离,从而实现去噪,从而实现了与噪声的具体类型、各种噪声源的个数、目标声源与噪声源的空间拓扑结构无关,在实现较好去噪效果的同时保证较高的语音质量。
申请公布号 CN102456351A 申请公布日期 2012.05.16
申请号 CN201010515293.9 申请日期 2010.10.14
申请人 清华大学 发明人 梁维谦;胡奎;杨华中;蒋毅;陈卓
分类号 G10L21/02(2006.01)I;G10L19/00(2006.01)I;H04R3/00(2006.01)I;H04R25/00(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种语音增强的系统,其特征在于,所述系统包括:语音采集模块,包括两路麦克,其中一路麦克置于目标声源的近端;另一路麦克置于目标声源的远端;所述采集模块用于采集两路语音信号;双麦克语音增强模块,用于对采集的两路语音信号进行处理,以获取增强后的目标声源语音信号;所述双麦克语音增强模块包括以下子模块:波束形成子模块,用于获得目标声源语音的参考信号;零陷波束形成子模块,用于获得环境噪声的参考信号;外围分析子模块,用于通过模拟声音进入人耳的过程,将两路语音进行分频及对语音信号进行变换;特征提取子模块,用于提取分频后两路语音信号的延时差和能量差信息;生成掩蔽子模块,根据提取的延时差和能量差信息获得不同时频区域对应的掩蔽值;掩蔽值平滑子模块,用于对提取的掩蔽值进行平滑处理;语音信号重建子模块,用于对由波束形成模块得到的参考信号进行掩蔽值处理,并合成增强后的语音信号作为输出。
地址 100084 北京市海淀区清华园一号