发明名称 一种基于内容的镜头检索方法
摘要 本发明属于视频检索技术领域,具体涉及一种基于内容的镜头检索方法。现有的基于内容的镜头检索方法往往存在着检索准确率不高的问题。针对现有技术中存在的不足,本发明首次将图论最优匹配的Kuhn_Munkres方法用于镜头检索。与现有方法相比,本发明提出的方法强调在一一对应的前提下,全面客观地度量两个镜头的相似度。把两个镜头的相似度度量建模为一个带权的二分图:镜头中的每一帧看成二分图的一个结点,两个镜头之间任意帧的相似值作为边的权值。在一一对应的前提下,利用Kuhn_Munkres方法求出该二分图的最大权,以此作为两个镜头的相似值。考虑到检索速度问题,提出了两个改进方法。实验对比结果证实了本发明在镜头检索中的优异表现。
申请公布号 CN1477600A 申请公布日期 2004.02.25
申请号 CN03150127.3 申请日期 2003.07.18
申请人 北京大学计算机科学技术研究所;北京北大方正技术研究院有限公司 发明人 彭宇新;肖建国;陈晓欧
分类号 G06T5/40;G06T5/00 主分类号 G06T5/40
代理机构 北京英赛嘉华知识产权代理有限责任公司 代理人 田明;王达佐
主权项 1、一种基于内容的镜头检索方法,包括以下步骤:(1)首先对视频数据库进行镜头分割,以镜头作为视频的基本结构单元和检索单元;(2)建立镜头相似度度量的带权二分图模型G={X,Y,E}:X表示镜头X有n帧x1,x2,...,xn,Y表示镜头Y有m帧y1,y2,...,ym,边集E={eij},其中边eij=(xi,yj)表示xi与yj相似,边eij的权值ωij表示xi与yj的相似值;该步骤中,采用如下方法降低G={X,Y,E}的结点数目,提高检索速度:A、子镜头构造带权二分图的方法:以子镜头的关键帧作为结点,构造带权二分图G={X,Y,E};或B、等间隔采样构造带权二分图的方法:在每个镜头内部等间隔地提取关键帧作为结点,构造带权二分图G={X,Y,E},这样,两个镜头的关键帧数目是一样的,可以构成多结点的完全二分图;(3)利用Kuhn_Munkres方法计算两个镜头的相似度:利用图论中最优匹配的Kuhn_Munkres方法,求出G={X,Y,E}的最优匹配M后,把M每条边eij的权值ωij相加,可以求得G={X,Y,E}的最大权ω,定义两个镜头X和Y的视觉相似度<math> <mrow> <mi>Similarity</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>,</mo> <mi>Y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mi>&omega;</mi> <mrow> <mi>min</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow> </math> 使用min(n,m)将Similarity(X,Y)归一化到0,1之间,值越大,表明镜头X和Y越相似。
地址 100871北京市海淀区北京大学计算机科学技术研究所
您可能感兴趣的专利