发明名称 |
一种基于堆栈式自动编码器的广告识别方法 |
摘要 |
本发明公开了一种基于堆栈式自动编码器的广告识别的方法,属于通信领域。该方法的特点在于首先采用无标签的语音、音频和有标签的广告音频,训练基于堆栈式自动编码器和softmax分类器的深度神经网络;去掉softmax分类器;利用训练好的堆栈式自动编码器,提取广告的特征参数,并建立广告音频特征参数数据库;利用训练好的堆栈式自动编码器提取待检测音频的特征参数,用该特征参数去匹配广告音频特征参数数据库,根据欧氏距离确定待检测音频是哪一条广告。本发明利用堆栈式自动编码器提取广告音频的特征参数,广告识别准确率高;本发明在对堆栈式自动编码器进行有监督学时,加入了含有噪声的广告音频数据,有较好的抗噪声性能。 |
申请公布号 |
CN106372653A |
申请公布日期 |
2017.02.01 |
申请号 |
CN201610745524.2 |
申请日期 |
2016.08.29 |
申请人 |
中国传媒大学 |
发明人 |
赵艳明;蓝善祯;李绍彬;雷腾铭;周俊宇 |
分类号 |
G06K9/62(2006.01)I;G06N3/04(2006.01)I;G10L15/02(2006.01)I;G10L15/16(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于堆栈式自动编码器的广告识别方法,其特征在于:首先采用无标签的语音、音频和有标签的广告音频,训练得到基于堆栈式自动编码器和softmax分类器的深度神经网络;然后去掉softmax分类器,利用训练好的堆栈式自动编码器,提取广告库中每一条广告的特征参数,建立广告音频特征参数数据库;把待检测音频输入到训练好的堆栈式自动编码器,得到特征参数,用待检测音频的特征参数去匹配广告音频特征参数数据库,根据欧氏距离的最小值确定待检测音频是否是广告库中的广告,如果是则该音频是哪一条广告。 |
地址 |
100024 北京市朝阳区定福庄东街1号 |