发明名称 基于时频域统计特征提取的自然环境声音识别方法
摘要 本发明公开了一种基于时频域统计特征提取的自然环境识别方法。本发明包括如下步骤:步骤1、采集各类自然环境的声音,如发动机、汽车喇叭、风噪声等,建立声音样本库;步骤2、声音样本信号的加窗分帧处理;步骤3、提取所有帧信号在时域上的统计特征;步骤4、标记特征向量所属声音来源的种类,建立样本特征库;步骤5、利用支持向量机训练特征向量,建立训练模型;步骤6,提取目标声音的特征向量;步骤7、利用支持向量机对目标声音的特征向量进行匹配分类;步骤8、提供识别结果。本发明弥补了传统的声音LPCC和MFCC特征提取方法在时频结合方面的不足,能够判断各类目标声音的所属类型。
申请公布号 CN106297770A 申请公布日期 2017.01.04
申请号 CN201610634966.X 申请日期 2016.08.04
申请人 杭州电子科技大学 发明人 曹九稳;徐茹;王建中;王天磊;曾焕强
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L25/03(2013.01)I;G10L25/45(2013.01)I;G10L25/51(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人 杜军
主权项 基于时频域统计特征提取的自然环境声音识别方法,其特征在于需要提取所有帧信号在时域上的统计特征:平均帧能量变化系数、能量冲击型帧信号占比、平均能量脉冲宽度、脉冲宽度离散程度、平均脉冲间隔宽度、间隔宽度离散程度和脉冲个数,以及在频谱分布上的特征:频带能量分量占比、频带帧能量分布离散程度和总频带帧能量分布离散程度,组成特征向量。
地址 310018 浙江省杭州市下沙高教园区2号大街