发明名称 |
基于滑动窗口的端点检测方法、装置和语音识别系统 |
摘要 |
本发明提供一种端点检测方法和装置,用于检测具有背景噪音的输入语音信号的语音端点,所述方法包括下列步骤:对输入语音信号施加一个窗口,取一定的帧数目作为窗口大小;确定输入语音信号中的背景噪音开始点并且计算背景噪音能量;计算当前帧的声音能量并且进而计算窗口能量;比较窗口的总声音能量是否大于背景噪音能量和语音开始点信噪比的乘积;如果不是,则窗口向下一帧滑动,并且返回计算当前帧声音能量步骤;如果是,则判断当前帧为语音开始点。本发明的端点检测方法提高端点检测的准确性,改善鲁棒性和提高语音识别系统的总体识别率。本发明的端点检测方法和装置通常应用在语音识别系统中。 |
申请公布号 |
CN1763844B |
申请公布日期 |
2010.05.05 |
申请号 |
CN200410083807.2 |
申请日期 |
2004.10.18 |
申请人 |
中国科学院声学研究所;北京中科信利通信技术有限公司;北京中科信利技术有限公司 |
发明人 |
余洪涌;赵庆卫 |
分类号 |
G10L15/04(2006.01)I;G10L15/20(2006.01)I;G10L15/28(2006.01)I;G10L19/02(2006.01)I;G10L15/00(2006.01)I |
主分类号 |
G10L15/04(2006.01)I |
代理机构 |
北京亿腾知识产权代理事务所 11309 |
代理人 |
陈霁 |
主权项 |
一种端点检测方法,用于检测输入语音信号的语音端点,所述方法包括下列步骤:对输入语音信号施加一个窗口,取一定的帧数目作为窗口大小;确定输入语音信号中的背景噪音开始点并且计算背景噪音能量;计算当前帧的声音能量并且进而计算窗口能量;比较窗口能量是否大于背景噪音能量和语音开始点信噪比的乘积;如果不是,则窗口向下一帧滑动,并且返回计算当前帧声音能量步骤;如果是,则判断当前帧为语音开始点。 |
地址 |
100080 北京市海淀区北四环西路21号DSP大楼 |