发明名称 行车噪声环境下的快速声学事件检测系统
摘要 行车噪声环境下的快速声学事件检测系统,涉及快速声学事件检测系统。本发明为了解决现有的声学事件检测系统在行车环境下系统识别率较低的问题。行车噪声环境下的快速声学事件检测系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;该系统对于行车环境下不可避免的风噪具有较好的抗噪能力,在各种风噪条件下检测性能具有鲁棒性;在相同的风噪条件下,本发明比现有的声学事件检测系统的识别率提高20%-30%。本发明适用于快速声学事件的检测。
申请公布号 CN104361887A 申请公布日期 2015.02.18
申请号 CN201410668501.7 申请日期 2014.11.20
申请人 哈尔滨工业大学 发明人 郑铁然;韩纪庆;朱强华
分类号 G10L15/02(2006.01)I;G10L25/78(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 杨立超
主权项 行车噪声环境下的快速声学事件检测系统,其特征在于该系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对比,声学事件SVM模型文件用做SVM模型识别子模块的识别依据;所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型;所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块;所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐帧传送到AWeighting加权子模块;所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用AWeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块;所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决;所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号