发明名称 基于声谱图双特征的动物声音识别方法
摘要 本发明涉及一种基于声谱图双特征的动物声音识别方法,其特征在于包括以下步骤:建立一声音样本库;采集待识别的声音信号;将预存声音样本及待识别的声音信号转化成声谱图;将声谱图进行规范化,并进行特征值分解和投影,转化成一投影特征X<sub>K</sub>;将声谱图转化成等价LBP值矩阵u,统计对应的像素与周围像素灰度值的方差,形成一特征向量LBPV;将投影特征X<sub>K</sub>和特征向量LBPV结合,形成双层特征X<sub>K</sub>+LBPV;以所述声音样本库中预存声音样本对应的双层特征集为训练样本集,以待识别的声音信号对应的双层特征为输入样本,通过随机森林的训练,得出待识别的声音信号于声音样本库中对应的类别并输出结果。本发明改善了不同声音环境下各种低信噪比动物声音的识别率。
申请公布号 CN104882144A 申请公布日期 2015.09.02
申请号 CN201510226082.6 申请日期 2015.05.06
申请人 福州大学 发明人 李应;吴志彬
分类号 G10L17/26(2013.01)I 主分类号 G10L17/26(2013.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种基于声谱图双特征的动物声音识别方法,其特征在于包括以下步骤:步骤S1:建立一声音样本库,用以预存声音样本;步骤S2:采集待识别的声音信号;步骤S3:分别将所述预存声音样本及待识别的声音信号转化成声谱图;步骤S4:将所述声谱图进行规范化,并对所述规范化后的声谱图进行特征值分解和投影,将其转化得到一投影特征X<sub>K</sub>;步骤S5:将所述声谱图转化成等价LBP值矩阵u,统计每一个等价LBP值对应的像素与周围像素灰度值的方差,形成一特征向量LBPV;步骤S6:将所述投影特征X<sub>K</sub>和特征向量LBPV结合,形成双层特征X<sub>K</sub>+LBPV;步骤S7:以所述声音样本库中预存声音样本对应的双层特征集为训练样本集,以待识别的声音信号对应的双层特征为输入样本,通过随机森林的训练,得出待识别的声音信号于声音样本库中对应的类别并输出结果。
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区