基于新型语义空间的视频检索方法,申请号CN201310253044.0-传众专利搜索

发明名称	基于新型语义空间的视频检索方法
摘要	本发明提出了一个基于新型语义空间的视频检索方法。该方法首先会将所有的概念构建一个概念空间，并且对每个概念构建一个检测器，用于将视频中的低级特征映射到概念空间中。针对构建好的概念空间，对其进行谱分解，得到多个“关键概念”张成的语义空间。再根据该语义空间，构建一个全局的本体语义空间，该空间用来衡量不同概念之间的相似度。该发明解决了检索过程中，对于不同概念之间无法直接进行统一和全局的比较的问题，从而提高了检索视频的精度。
申请公布号	CN103279580A	申请公布日期	2013.09.04
申请号	CN201310253044.0	申请日期	2013.06.24
申请人	魏骁勇	发明人	魏骁勇;杨震群;黄劲;徐浩然;孙洋
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	成都华典专利事务所(普通合伙) 51223	代理人	徐丰;杨保刚
主权项	1.基于新型语义空间的视频检索方法，其特征在于：构建传统概念语义空间：给定一组基础的概念语义，构成传统概念语义空间C=[C<sub>1</sub>,C<sub>2</sub>,.......C<sub>N</sub>]，其中每个C<sub>i</sub>为一个概念的语义，每个概念C<sub>i</sub>对应一个检测器d<sub>i</sub>，用以将视频的低级特征映射到概念空间中；构建新的语义空间B，其步骤包括以下步骤：步骤A1：对传统概念语义空间进行转换，得到新的完备和紧致的语义空间P，步骤A2：将C空间中的语义映射到P空间中，然后的进行层次聚类，该聚类的结果构建一个树形结构，用来表达概念之间的从属和推广能力；步骤A3：选择表达P空间中本体的概念之间相似度度量的策略，使用WUP来表达具有从属和推广能力的相似度，<img file="FDA00003397595300011.GIF" wi="764" he="172" />其中D(p<sub>ij</sub>)表示概念Ci和概念Cj的最低的公共父亲节点的深度，L(C<sub>i</sub>，C<sub>j</sub>)表示Ci和Cj之间的路径的长度；步骤A4：采用步骤A3计算P空间中的每个概念与其他概念的相似度，构造一个关系矩阵R，R为对称矩阵，对R进行谱分解，公式如下：<maths num="0001"><![CDATA[<math><mrow><mi>R</mi><mo>=</mo><mi>VΛ</mi><msup><mi>V</mi><mi>T</mi></msup><mo>=</mo><msup><mrow><mo>(</mo><mi>V</mi><msup><mi>Λ</mi><mfrac><mn>1</mn><mn>2</mn></mfrac></msup><msup><mi>V</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>T</mi></msup><mrow><mo>(</mo><mi>V</mi><msup><mi>Λ</mi><mfrac><mn>1</mn><mn>2</mn></mfrac></msup><msup><mi>V</mi><mi>T</mi></msup><mo>)</mo></mrow></mrow></math>]]></maths>V为R的特征向量矩阵，Λ为特征值对角矩阵；抽取其中的基向量构造新的语义空间B，公式如下：<img file="FDA00003397595300013.GIF" wi="261" he="124" />检索过程，具体包括以下步骤：步骤B1：对于一个属于传统语义概念空间C的未知语义<img file="FDA00003397595300014.GIF" wi="97" he="89" />将其映射到P空间中，形成<img file="FDA00003397595300015.GIF" wi="92" he="93" />将<img file="FDA00003397595300016.GIF" wi="66" he="92" />映射到新的B空间中，映射公式为：<img file="FDA00003397595300017.GIF" wi="337" he="123" />计算B空间中向量间的相似度，这里采用余弦相似度来计算，计算公式为：<img file="FDA00003397595300018.GIF" wi="546" he="188" />公式中B<sub>i</sub>、B<sub>j</sub>新的语义空间B中的向量；步骤B2：对每个视频的关键帧，使用每个传统语义概念Ci所对应的概念检测器d<sub>i</sub>，响应超过一定阈值，则将其对应的C<sub>i</sub>加入到集合S中，并对S中的每个语义概念进行步骤B1中的映射，形成新的语义集合N，计算<img file="FDA00003397595300019.GIF" wi="66" he="83" />与N中的余弦相似度，进行排序，选取前K个视频作为返回视频。
地址	610000 四川省成都市武侯区郭家桥正街16号府河竹园16楼1号