发明名称 一种基于动态噪声估计时频域自适应语音检测方法
摘要 本发明涉及信息处理技术及传感信号处理领域,特别是涉及到一种基于动态噪声估计时频域自适应自动语音检测方法,本发明根据声音的时域短时能量和一定范围频域短时能量变化分别进行语音的检测,最后根据动态估计出的背景噪声能量的大小,选择最优的结果,从而大幅提高了语音识别的准确率并提高了语音识别对环境变化的适应性。
申请公布号 CN106098076A 申请公布日期 2016.11.09
申请号 CN201610393406.X 申请日期 2016.06.06
申请人 成都启英泰伦科技有限公司 发明人 何云鹏
分类号 G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G10L25/60(2013.01)I;G10L25/75(2013.01)I 主分类号 G10L21/0224(2013.01)I
代理机构 代理人
主权项 一种基于动态噪声估计时频域自适应语音检测方法,其包括以下步骤:步骤一,载入当前帧数据,所述当前帧数据为时域内语音数据;步骤二,计算所述时域内语音数据的每帧声音的能量总和作为时域短时能量,并将每帧所述时域内语音数据通过FFT变换为频域数据;步骤三,选取所述频域数据一定频率范围子带数据,计算所述一定频率范围子带数据的能量并累加作为频域短时能量;步骤四,背景噪声能量估计单元计算出背景噪声能量,频域背景能量计算单元计算出频域背景能量;步骤五,将所述时域短时能量与所述背景噪声能量进行比较,结果为大于所述背景噪声能量的则为语音,结果为小于或等于所述背景噪声能量的则为非语音;步骤六,将所述频域短时能量与所述频域背景能量进行比较,结果为大于所述频域背景能量的则为语音,结果为小于或等于所述频域背景能量的则为非语音;步骤七,将所述背景噪声能量与一系统设定的阈值一进行比较,若大于阈值一则选择步骤六中比较为语音的结果,若小于等于阈值一则选择步骤五中比较为语音的结果;步骤八,若所述当前帧结果检测为非语音,则将所述当前帧的所述时域短时能量送到所述背景噪声估计单元中累加,累加到第一帧数后,将累加值除以所述第一帧数得到新的背景噪声能量作为输出,同时将所述当前帧的所述频域短时能量送到所述频域背景能量计算单元中累加,累加到第二帧数后,将累加值除以所述第二帧数得到新的频域背景能量作为输出。
地址 610041 四川省成都市高新区天府四街199号1栋26层22号