发明名称 面向孤立词语音识别的自适应端点检测方法及其系统
摘要 本发明公开了一种面向孤立词语音识别的自适应端点检测方法及其系统,包括:a.语音输入,输入包含待识别孤立词的语音信号;b.语音预处理,对语音信号进行幅值平移,归一化和分帧处理,计算每一帧语音的短时平均能量和短时平均过零率;c.孤立词端点粗检测,利用每一帧语音信号的短时平均能量和短时平均过零率,以及端点前后连续语音帧的最短长度约束,对孤立词端点进行粗略估计;d.检测门限的自适应调整及精确端点的检测,利用孤立词最小时长和最大时长的限制,对检测门限进行动态调整,并对语音端点进行前后微调,得到精确的孤立词端点;e.输出孤立词的端点进行孤立词语音识别,输出精确的孤立词端点,利用语音识别技术进行孤立词识别。
申请公布号 CN103366739B 申请公布日期 2015.12.09
申请号 CN201210085584.8 申请日期 2012.03.28
申请人 郑州市科学技术情报研究所 发明人 霍小四;尹明理;刘军江
分类号 G10L15/04(2013.01)I;G10L25/87(2013.01)I 主分类号 G10L15/04(2013.01)I
代理机构 郑州中原专利事务所有限公司 41109 代理人 霍彦伟;李想
主权项 一种面向孤立词语音识别的自适应端点检测方法,其特征在于,该方法包括以下步骤:a.语音输入输入包含待识别孤立词的语音信号;b.语音预处理对语音信号进行幅值平移,归一化和分帧处理,计算每一帧语音信号的短时平均能量和短时平均过零率;c. 孤立词端点粗检测利用每一帧语音信号的短时平均能量和短时平均过零率,以及端点前后连续语音帧的最短长度约束,对孤立词端点进行粗略估计;d. 检测门限的自适应调整及精确端点的检测利用孤立词最小时长和最大时长的限制,对检测门限进行动态调整,并对语音端点进行前后微调,得到精确的孤立词端点;当检测到的孤立词语音长度大于孤立词的最大长度时,增大短时能量高阈值,并向后调整起点、向前调整终点,分别使得起点和终点的帧平均能量大于新的高阈值;当检测到的孤立词语音长度大于孤立词的最大长度时,缩小短时过零率阈值,并向后调整起点、向前调整终点,使得起点前一帧和终点下一帧平均过零率大于新的短时过零率阈值;当检测到的孤立词语音长度小于孤立词的最短长度时,缩小短时能量高阈值,并向前调整起点、向后调整终点,分别使得起点和终点的帧平均能量大于新的高阈值;当检测到的孤立词语音长度小于孤立词的最短长度时,增大短时过零率阈值,并向前调整起点、向后调整终点,使得起点前一帧和终点下一帧平均过零率大于新的短时过零率阈值; <u />e. 输出孤立词的端点进行孤立词语音识别输出精确的孤立词端点,利用语音识别技术进行孤立词识别。
地址 450006 河南省郑州市工人路13号五楼