发明名称 一种基于统计模型的双传感器语音增强方法与装置
摘要 本发明公开了一种基于统计模型的双传感器语音增强方法与装置,该方法首先结合非气导传感器语音和气导传感器语音来构建当前用于分类的语音联合统计模型以及进行端点检测,通过联合统计模型的分类结果来计算最佳气导语音滤波器,对气导语音进行滤波增强,然后通过映射模型将非气导语音转换为具有气导特征的气导语音,并与滤波增强后的语音进行加权融合,以进一步提高语音的质量。本方法采用两级语音增强的结构方法,在气导语音因强噪声而滤波效果不好时,第二级语音增强将滤波语音与非气导语音的映射语音进行自适应加权融合,能在强噪声环境下获得更好的语音增强效果,该方法可广泛应用于视频通话、车载电话、多媒体教室、军事通信等多种场合。
申请公布号 CN105632512A 申请公布日期 2016.06.01
申请号 CN201610025390.7 申请日期 2016.01.14
申请人 华南理工大学 发明人 张军;陈鑫源;潘伟锵;宁更新;冯义志;余华;季飞;陈芳炯
分类号 G10L21/0272(2013.01)I;G10L21/038(2013.01)I 主分类号 G10L21/0272(2013.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 罗观祥
主权项 一种基于统计模型的双传感器语音增强方法,其特征在于,包括下列步骤:S1、同步采集干净的气导训练语音和非气导训练语音,建立用于分类的联合统计模型,并计算对应于每个分类的气导语音线性频谱统计模型;S2、利用同步采集的所述气导训练语音和所述非气导训练语音,建立非气导语音到气导语音的映射模型;S3、同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;S4、利用所述气导噪声统计模型修正所述联合统计模型,并对气导检测语音帧进行分类,然后根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器,并对气导检测语音进行滤波增强后得到滤波增强语音;S5、根据所述非气导语音到气导语音的映射模型,将非气导检测语音转换为气导的映射语音;S6、将所述气导的映射语音与所述滤波增强语音进行加权融合,得到融合增强后的语音。
地址 510640 广东省广州市天河区五山路381号