发明名称 一种声纹特征和音频水印相结合的音频信号识别方法
摘要 本发明公开了一种声纹特征和音频水印相结合的音频信号识别方法,解决了现有技术中音频识别不精确、使用范围窄,以及音视频内容的数字水印版权保护等问题。该声纹特征和音频水印相结合的音频信号识别方法包括:(1)样本来源;(2)对所述步骤(1)中的文件提取音频进行预处理,获得对应的频谱数据;(3)声纹特征提取;(4)声纹特征识别;根据需要还可包括数字水印生成和添加。本发明申请以声纹特征和音频数字水印相结合,在广播电视台实际环境经测试,无论广播、直播、录播以及会场均能对声音进行较好的识别。
申请公布号 CN106162321A 申请公布日期 2016.11.23
申请号 CN201610788886.X 申请日期 2016.08.31
申请人 成都广电视讯文化传播有限公司 发明人 张涛;余忠;邱星华
分类号 H04N21/439(2011.01)I;H04N21/8358(2011.01)I;G10L19/018(2013.01)I;G10L25/03(2013.01)I;G10L25/54(2013.01)I 主分类号 H04N21/439(2011.01)I
代理机构 成都顶峰专利事务所(普通合伙) 51224 代理人 杨俊华
主权项 一种声纹特征和音频水印相结合的音频信号识别方法,其特征在于,包括以下步骤:(1)样本来源:实时收录音视频直播流和保存点播视频文件或音频文件;或指定的需匹配的视频或音频文件;(2)对所述步骤(1)中的文件提取音频进行预处理,获得对应的频谱数据;(3)声纹特征提取:根据频谱数据进行声纹特征提取,所提取的声纹特征存入服务器端内存数据库,该声纹特征对应为该音视频文件或者直播频道;(4)声纹特征识别,包括以下三种方式:(a)音频声纹特征识别:客户端获取音频声纹特征数据,并将该音频特征数据通过声纹特征提取方法生成待识别的声纹特征,将待识别的声纹特征与服务器端内存数据库所存的声纹特征进行比对,通过对比得到识别结果;(b)音频数字水印提取识别:客户端提取出音视频资源中的数字水印,通过数字水印识别出音视频文件或者直播频道;(c)音频声纹特征识别与音频数字水印提取识别相结合。
地址 610000 四川省成都市高新区高朋大道3号东方希望科研楼A座3楼