一种基于内容的镜头检索方法,申请号CN03150127.3-传众专利搜索

发明名称	一种基于内容的镜头检索方法
摘要	本发明属于视频检索技术领域，具体涉及一种基于内容的镜头检索方法。现有的基于内容的镜头检索方法往往存在着检索准确率不高的问题。针对现有技术中存在的不足，本发明首次将图论最优匹配的Kuhn_Munkres方法用于镜头检索。与现有方法相比，本发明提出的方法强调在一一对应的前提下，全面客观地度量两个镜头的相似度。把两个镜头的相似度度量建模为一个带权的二分图：镜头中的每一帧看成二分图的一个结点，两个镜头之间任意帧的相似值作为边的权值。在一一对应的前提下，利用Kuhn_Munkres方法求出该二分图的最大权，以此作为两个镜头的相似值。考虑到检索速度问题，提出了两个改进方法。实验对比结果证实了本发明在镜头检索中的优异表现。
申请公布号	CN1477600A	申请公布日期	2004.02.25
申请号	CN03150127.3	申请日期	2003.07.18
申请人	北京大学计算机科学技术研究所;北京北大方正技术研究院有限公司	发明人	彭宇新;肖建国;陈晓欧
分类号	G06T5/40;G06T5/00	主分类号	G06T5/40
代理机构	北京英赛嘉华知识产权代理有限责任公司	代理人	田明;王达佐
主权项	1、一种基于内容的镜头检索方法，包括以下步骤：(1)首先对视频数据库进行镜头分割，以镜头作为视频的基本结构单元和检索单元；(2)建立镜头相似度度量的带权二分图模型G＝{X，Y，E}：X表示镜头X有n帧x1，x2，...，xn，Y表示镜头Y有m帧y1，y2，...，ym，边集E＝{eij}，其中边eij＝(xi，yj)表示xi与yj相似，边eij的权值ωij表示xi与yj的相似值；该步骤中，采用如下方法降低G＝{X，Y，E}的结点数目，提高检索速度：A、子镜头构造带权二分图的方法：以子镜头的关键帧作为结点，构造带权二分图G＝{X，Y，E}；或B、等间隔采样构造带权二分图的方法：在每个镜头内部等间隔地提取关键帧作为结点，构造带权二分图G＝{X，Y，E}，这样，两个镜头的关键帧数目是一样的，可以构成多结点的完全二分图；(3)利用Kuhn_Munkres方法计算两个镜头的相似度：利用图论中最优匹配的Kuhn_Munkres方法，求出G＝{X，Y，E}的最优匹配M后，把M每条边eij的权值ωij相加，可以求得G＝{X，Y，E}的最大权ω，定义两个镜头X和Y的视觉相似度<math> <mrow> <mi>Similarity</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>,</mo> <mi>Y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mi>ω</mi> <mrow> <mi>min</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow> </math> 使用min(n，m)将Similarity(X，Y)归一化到0，1之间，值越大，表明镜头X和Y越相似。
地址	100871北京市海淀区北京大学计算机科学技术研究所