发明名称 一种公共场所异常声音的识别与定位方法
摘要 本发明是用于公共场所异常声音识别及定位方法,属于音频信号处理技术领域。该方法通过双阈值算法和Welch法估计功率谱来判定公共场所是否存在异常声音;然后将异常声音特征时序信号转换为时频域的谱图,利用听觉感知的稀疏编码声音识别技术解决异常声音的特征提取及分类识别问题。为了抑制公共场所背景噪声中脉冲噪声对异常声音定位的影响,引入非线性变换,增强异常声音的互相关函数峰值能力。对传统的HB加权函数进行改进,降低由低信噪比带来的权值变化。引入一种多帧数据加权处理,使新的HB加权广义互相关算法更加适合于处理公共场所复杂声学环境中的异常声音定位能力。由于该方法结合基于听觉感知的稀疏编码声音识别技术和改进的到达时间差的声源定位技术,可以更好的利用异常事件所伴随的声音信息,可以提高公共场所监控系统的智能化水平。
申请公布号 CN102522082A 申请公布日期 2012.06.27
申请号 CN201110444850.7 申请日期 2011.12.27
申请人 重庆大学 发明人 李伟红;刘鹏;龚卫国;汤海兵;张智龙;仲建华
分类号 G10L15/02(2006.01)I;G10L21/02(2006.01)I;G10L19/02(2006.01)I;G10L19/00(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 重庆华科专利事务所 50123 代理人 康海燕
主权项 1.一种公共场所异常声音的识别与定位方法,所述本方法首先对公共场所获取的声音信号进行分析,确定在该区域是否存在异常声音,从而判别是否有异常事件发生;如果有异常事件发生,则快速确定异常事件发生的方向和位置,为视频监控系统提供快速、准确的方位信息;所述方法分为异常声音识别方法和异常声音定位方法两部分,其特征在于:所述异常声音识别方法为:(1)首先是判定是否存在异常声音;(2)然后将异常声音的特征时序信号转换为时频域的谱图,通过独立成分分析(ICA)、稀疏表示分类(SRC)等图像处理方法对异常声音谱图进行分类识别,具体步骤如下:①对异常声音的时序信号进行短时傅里叶变换:使用汉明窗作为滑动窗,傅里叶变换的长度为2N<sub>f</sub>点,这样每一帧的信号都可以得到长度为N<sub>f</sub>的频谱,其声压值为:PdB=20×log<sub>10</sub>|x(1:N<sub>f</sub>)|式中,x为一帧信号的频谱值,PdB表示其声压值;将异常声音的时频表达沿频率轴切分成N<sub>b</sub>个图像块,将每个异常声音样本的图像块通过列堆栈转换为向量,并把所有样本得到的向量合并成为矩阵X∈R<sup>M×N</sup>,其中M是样本声谱图的大小,N表示声音样本的数量;②将训练样本X作为独立成分分析的输入矩阵,得到分离矩阵W,然后将X投影到W张成的子空间构成稀疏分解的冗余字典A;③将系统检测到的异常声音信号经过步骤①的声谱图转换后向W张成的子空间投影得到y,可以由冗余字典A中原子线性表示,异常声音信号的稀疏描述为:<maths num="0001"><![CDATA[<math><mrow><msub><mover><mi>x</mi><mo>^</mo></mover><mn>1</mn></msub><mo>=</mo><mi>arg</mi><mi>min</mi><msub><mrow><mo>|</mo><mo>|</mo><mi>x</mi><mo>|</mo><mo>|</mo></mrow><mn>1</mn></msub></mrow></math>]]></maths>subject to Ax=y计算残差得到异常声音信号的类别结果:<img file="FDA0000125171910000012.GIF" wi="426" he="61" />i=1,2,…,j。上式中y为待检测信号转换后投影到子空间的表示,<img file="FDA0000125171910000013.GIF" wi="97" he="62" />表示优化问题的解中第i个样本的系数,而<img file="FDA0000125171910000021.GIF" wi="136" he="62" />则表示由其重建的特征<img file="FDA0000125171910000022.GIF" wi="59" he="52" />则r<sub>i</sub>表示原信号与重建新号的差距,显然,y与<img file="FDA0000125171910000023.GIF" wi="36" he="52" />的差距越小,i与待识别样本就越接近,则可得到判定结果。
地址 400030 重庆市沙坪坝区沙正街174号