发明名称 一种自动识别少数民族传统乐器音频数据的方法
摘要 本发明公开了一种自动识别少数民族传统乐器音频数据的方法,其特征在于:其内容包括如下步骤:采用录音设备采集由少数民族传统乐器弹奏的音频信号;对音频信号进行预处理,主要包括抗混叠滤波、预加重、分帧和端点检测等内容;音频特征提取采用MFCC提取的音频特征;设计三层结构的BP人工神经网络分类器进行训练,其中间层的结点个数采用遗传算法根据人工神经网络的训练结果自动择优确定;用训练好的BP人工神经网络分类器识别乐器种类并输出对应乐器的图片。本发明能对我国48种少数民族传统乐器弹奏的音频数据识别其弹奏的乐器:所采用的方法针对性强、抗干扰能力强、识别准确率高。
申请公布号 CN103325382A 申请公布日期 2013.09.25
申请号 CN201310226990.6 申请日期 2013.06.07
申请人 大连民族学院 发明人 郑蕊蕊;李敏;张俊星;吴宝春
分类号 G10L25/30(2013.01)I 主分类号 G10L25/30(2013.01)I
代理机构 大连一通专利代理事务所(普通合伙) 21233 代理人 秦少林
主权项 一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:其内容包括如下步骤:步骤1:采用录音设备采集由少数民族传统乐器弹奏的音频信号;步骤2:对音频信号进行预处理,主要包括抗混叠滤波、预加重、分帧和端点检测等内容;步骤3:音频特征提取采用MFCC提取的音频特征;MFCC的计算首先是对数据加窗;对加窗后的时域信号采用傅里叶变换转化到频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换,取前N个系数;再将频域轴用Mel刻度表示即为Mel倒谱域,用倒谱域表示的系数即为Mel频率倒谱系数;最终提取的我国少数民族传统乐器音频特征为24维数据;步骤4:采用BP人工神经网络分类器分三层结构,第一层是输入层,24个结点;第二层为隐含层,结点个数采用遗传算法根据训练结果自动择优确定;第三层是输出层,根据分类的少数民族乐器数目确定设定为48个;最后训练完的BP人工神经网络可识别音频数据的弹奏乐器,并显示对应的乐器图片。
地址 116600 辽宁省大连市开发区辽河西路18号大连民族学院创新教育中心