发明名称 |
基于声谱图双特征的动物声音识别方法 |
摘要 |
本发明涉及一种基于声谱图双特征的动物声音识别方法,其特征在于包括以下步骤:建立一声音样本库;采集待识别的声音信号;将预存声音样本及待识别的声音信号转化成声谱图;将声谱图进行规范化,并进行特征值分解和投影,转化成一投影特征X<sub>K</sub>;将声谱图转化成等价LBP值矩阵u,统计对应的像素与周围像素灰度值的方差,形成一特征向量LBPV;将投影特征X<sub>K</sub>和特征向量LBPV结合,形成双层特征X<sub>K</sub>+LBPV;以所述声音样本库中预存声音样本对应的双层特征集为训练样本集,以待识别的声音信号对应的双层特征为输入样本,通过随机森林的训练,得出待识别的声音信号于声音样本库中对应的类别并输出结果。本发明改善了不同声音环境下各种低信噪比动物声音的识别率。 |
申请公布号 |
CN104882144A |
申请公布日期 |
2015.09.02 |
申请号 |
CN201510226082.6 |
申请日期 |
2015.05.06 |
申请人 |
福州大学 |
发明人 |
李应;吴志彬 |
分类号 |
G10L17/26(2013.01)I |
主分类号 |
G10L17/26(2013.01)I |
代理机构 |
福州元创专利商标代理有限公司 35100 |
代理人 |
蔡学俊 |
主权项 |
一种基于声谱图双特征的动物声音识别方法,其特征在于包括以下步骤:步骤S1:建立一声音样本库,用以预存声音样本;步骤S2:采集待识别的声音信号;步骤S3:分别将所述预存声音样本及待识别的声音信号转化成声谱图;步骤S4:将所述声谱图进行规范化,并对所述规范化后的声谱图进行特征值分解和投影,将其转化得到一投影特征X<sub>K</sub>;步骤S5:将所述声谱图转化成等价LBP值矩阵u,统计每一个等价LBP值对应的像素与周围像素灰度值的方差,形成一特征向量LBPV;步骤S6:将所述投影特征X<sub>K</sub>和特征向量LBPV结合,形成双层特征X<sub>K</sub>+LBPV;步骤S7:以所述声音样本库中预存声音样本对应的双层特征集为训练样本集,以待识别的声音信号对应的双层特征为输入样本,通过随机森林的训练,得出待识别的声音信号于声音样本库中对应的类别并输出结果。 |
地址 |
350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区 |