发明名称 一种基于堆栈式自动编码器的广告识别方法
摘要 本发明公开了一种基于堆栈式自动编码器的广告识别的方法,属于通信领域。该方法的特点在于首先采用无标签的语音、音频和有标签的广告音频,训练基于堆栈式自动编码器和softmax分类器的深度神经网络;去掉softmax分类器;利用训练好的堆栈式自动编码器,提取广告的特征参数,并建立广告音频特征参数数据库;利用训练好的堆栈式自动编码器提取待检测音频的特征参数,用该特征参数去匹配广告音频特征参数数据库,根据欧氏距离确定待检测音频是哪一条广告。本发明利用堆栈式自动编码器提取广告音频的特征参数,广告识别准确率高;本发明在对堆栈式自动编码器进行有监督学时,加入了含有噪声的广告音频数据,有较好的抗噪声性能。
申请公布号 CN106372653A 申请公布日期 2017.02.01
申请号 CN201610745524.2 申请日期 2016.08.29
申请人 中国传媒大学 发明人 赵艳明;蓝善祯;李绍彬;雷腾铭;周俊宇
分类号 G06K9/62(2006.01)I;G06N3/04(2006.01)I;G10L15/02(2006.01)I;G10L15/16(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 一种基于堆栈式自动编码器的广告识别方法,其特征在于:首先采用无标签的语音、音频和有标签的广告音频,训练得到基于堆栈式自动编码器和softmax分类器的深度神经网络;然后去掉softmax分类器,利用训练好的堆栈式自动编码器,提取广告库中每一条广告的特征参数,建立广告音频特征参数数据库;把待检测音频输入到训练好的堆栈式自动编码器,得到特征参数,用待检测音频的特征参数去匹配广告音频特征参数数据库,根据欧氏距离的最小值确定待检测音频是否是广告库中的广告,如果是则该音频是哪一条广告。
地址 100024 北京市朝阳区定福庄东街1号