发明名称 一种基于关键帧的影音指纹生成方法
摘要 本发明公开了一种基于关键帧的影音指纹生成方法,首先通过基于最小顶点覆盖原理提取视频数据I帧中的多个关键帧,以此降低指纹的开销,然后利用I帧的DCT系数特性,选取关键帧直流系数x0和频率最小的N个低频交流系数x1,x2…,xN,通过量化编码生成一个N+1位的0/1序列,将关键帧的时间戳转换二进制序列,放置在N+1位的0/1序列前,构成该关键帧的M-1位的视频帧指纹。通过时间戳的匹配与同步性认证,利用异或运算的特性,将音、视频指纹合二为一进而产生影音指纹。此方法不仅实现了一种指纹同时认证多种媒体数据,而且大大缩小了指纹的开销,并对音视频节目的错播、误播、非法节目插播和篡改等问题具有一定的错误定位、检错修复能力。
申请公布号 CN102307301A 申请公布日期 2012.01.04
申请号 CN201110143159.5 申请日期 2011.05.30
申请人 电子科技大学 发明人 徐杰;隆克平;赵洪健;陈龙;闫朝喜
分类号 H04N7/26(2006.01)I;H04N7/30(2006.01)I;H04N21/8547(2011.01)I 主分类号 H04N7/26(2006.01)I
代理机构 成都行之专利代理事务所(普通合伙) 51220 代理人 温利平
主权项 一种基于关键帧的影音指纹生成方法,其特征在于,包括以下步骤:(1)、基于最小顶点覆盖原理的关键帧提取对视频数据流进行解码,得到单个视频帧序列,然后,抽取其中的视频I帧,并将其作为无向图顶点;在无向图中,将顶点依据帧与帧之间的相似度进行连接,其边长与相似度成反比;对于无向图,进行以下处理:1.1)、首先将与其他视频I帧相似度为0的顶点归到顶点集合C,并从无向图中移除;1.2)、移除相似度低于设定值的边;1.3)、将无向图中所有的顶点用访问标志进行标记,初始值为未被访问;1.4)、计算所有顶点的度和邻接度,顶点的度表示与其连接的边数量,顶点的邻接度表示与其连接的所有顶点的度之和;1.5)、在无向图中,选取邻接度最大的顶点,然后根据其数量n将顶点集合C复制为n个,依次将n个邻接度最大的顶点放入这n个顶点集合C中;将无向图复制为n幅,对每一幅无向图移除一个邻接度最大的顶点,得到n个分别移除一个邻接度最大顶点的无向图,同时,在这n个无向图中,原来与邻接度最大顶点连接的顶点标记为已被访问,移除与邻接度最大顶点连接的所有边;1.6)、对n个无向图,进行步骤1.4)相同的处理,直到无向图中,所有的顶点均被标记为已被访问时为止,得到m个顶点集合Ci,i=1,2…,m;1.7)、依次选择顶点集合Ci以外的各个顶点与顶点集合Ci内各点之间的最大相似度并求和,得到各个顶点集合Ci的求和Sum值,其中Sum值最大的顶点集合Ci中的顶点即为关键帧;(2)、视频帧指纹的生成2.1)、对于每一关键帧,在其压缩域提取到该帧的DCT系数,选取其直流系数x0和频率最小的N个低频交流系数x1,x2…,xN,然后对这些系数进行量化编码,得到二进制码序列Ai;2.2)、将该关键帧的时间戳转换二进制序列,放置在二进制码序列Ai的头部,构成该关键帧的M‑1位的视频帧指纹;(3)、影音指纹的合成3.1)、首先对每帧音频数据进行快速傅里叶变换,得到对应的一系列频域值,并将音频频段划分成M个不重叠的频带,计算频域值落入各个频带中的数量;然后,计算相邻帧之间落入各个频带中频域值数量的差值,并量化为0或1,得到M‑1位的音频帧指纹;3.2)、对应每一视频帧指纹,利用其时间戳找到同步的音频帧指纹,然后通过异或运算将两者合二为一生成该时间戳对应的影音指纹;3.3)、按照时间顺序,将不同时间对应的影音指纹有序排列,构成整段音视频数据对应的影音指纹。
地址 611731 四川省成都市高新区(西区)西源大道2006号
您可能感兴趣的专利