发明名称 基于端点检测的智能轮椅语音识别的控制方法
摘要 本发明请求保护一种在一般噪声环境下基于端点检测的智能轮椅语音识别的控制方法,涉及人工智能领域,本发明中语音信号序列经过一系列预处理;估计倒谱距离dst;计算短时能量amp;为倒谱距离和短时能量分别确定两个高低门限;进行语音端点检测;通过倒谱距离或能量超过了低门限来判断语音进入过渡段和倒谱距离或能量超过高门限来判断进入语音段,实现一般噪声环境下的语音端点检测,本发明与其它低噪声下的语音端点检测方法不同之处在于提出了一种一般噪声环境下有效的语音端点检测方法,利用此方法能准确检测到语音端点,通过设置5个基本语音命令:前进、后退、左转、右转、停止,在智能轮椅上实现了语音控制。
申请公布号 CN102254558B 申请公布日期 2012.10.03
申请号 CN201110184321.8 申请日期 2011.07.01
申请人 重庆邮电大学 发明人 张毅;罗元;蔡军;林海波;谢颖;徐晓东;黄璜
分类号 G10L15/20(2006.01)I 主分类号 G10L15/20(2006.01)I
代理机构 北京同恒源知识产权代理有限公司 11275 代理人 赵荣之
主权项 1.基于端点检测的智能轮椅语音识别的控制方法,其特征在于:包括以下步骤:步骤1:采集并对语音信号序列预处理;步骤2:通过以下公式计算当前状态的倒谱距离dst:<img file="FDA0000073283930000011.GIF" wi="1389" he="132" />式中,dst为倒谱距离,对于两个不同信号s<sub>0</sub>(n)和s<sub>1</sub>(n),c<sub>0</sub>(n)和c<sub>1</sub>(n)分别对应于谱密度函数<img file="FDA0000073283930000012.GIF" wi="120" he="50" />和<img file="FDA0000073283930000013.GIF" wi="115" he="50" />的倒谱系数,<img file="FDA0000073283930000014.GIF" wi="37" he="32" />表示角频率;步骤3:通过以下公式计算当前状态的短时能量amp:<img file="FDA0000073283930000015.GIF" wi="723" he="148" />式中,x(m)表示语音信号,<img file="FDA0000073283930000016.GIF" wi="212" he="56" />表示窗函数,m表示帧长,n表示第几帧语音信号;步骤4:确定倒谱距离门限、短时能量门限;步骤5:语音端点检测,根据当前状态的倒谱距离与倒谱距离门限的比较,当前状态的短时能量与短时能量门限的比较,来确定语音信号处理的相应阶段的处理程序。
地址 400065 重庆市南岸区黄桷垭崇文路2号