发明名称 基于新型语义空间的视频检索方法
摘要 本发明提出了一个基于新型语义空间的视频检索方法。该方法首先会将所有的概念构建一个概念空间,并且对每个概念构建一个检测器,用于将视频中的低级特征映射到概念空间中。针对构建好的概念空间,对其进行谱分解,得到多个“关键概念”张成的语义空间。再根据该语义空间,构建一个全局的本体语义空间,该空间用来衡量不同概念之间的相似度。该发明解决了检索过程中,对于不同概念之间无法直接进行统一和全局的比较的问题,从而提高了检索视频的精度。
申请公布号 CN103279580A 申请公布日期 2013.09.04
申请号 CN201310253044.0 申请日期 2013.06.24
申请人 魏骁勇 发明人 魏骁勇;杨震群;黄劲;徐浩然;孙洋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 成都华典专利事务所(普通合伙) 51223 代理人 徐丰;杨保刚
主权项 1.基于新型语义空间的视频检索方法,其特征在于:构建传统概念语义空间:给定一组基础的概念语义,构成传统概念语义空间C=[C<sub>1</sub>,C<sub>2</sub>,.......C<sub>N</sub>],其中每个C<sub>i</sub>为一个概念的语义,每个概念C<sub>i</sub>对应一个检测器d<sub>i</sub>,用以将视频的低级特征映射到概念空间中;构建新的语义空间B,其步骤包括以下步骤:步骤A1:对传统概念语义空间进行转换,得到新的完备和紧致的语义空间P,步骤A2:将C空间中的语义映射到P空间中,然后的进行层次聚类,该聚类的结果构建一个树形结构,用来表达概念之间的从属和推广能力;步骤A3:选择表达P空间中本体的概念之间相似度度量的策略,使用WUP来表达具有从属和推广能力的相似度,<img file="FDA00003397595300011.GIF" wi="764" he="172" />其中D(p<sub>ij</sub>)表示概念Ci和概念Cj的最低的公共父亲节点的深度,L(C<sub>i</sub>,C<sub>j</sub>)表示Ci和Cj之间的路径的长度;步骤A4:采用步骤A3计算P空间中的每个概念与其他概念的相似度,构造一个关系矩阵R,R为对称矩阵,对R进行谱分解,公式如下:<maths num="0001"><![CDATA[<math><mrow><mi>R</mi><mo>=</mo><mi>V&Lambda;</mi><msup><mi>V</mi><mi>T</mi></msup><mo>=</mo><msup><mrow><mo>(</mo><mi>V</mi><msup><mi>&Lambda;</mi><mfrac><mn>1</mn><mn>2</mn></mfrac></msup><msup><mi>V</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>T</mi></msup><mrow><mo>(</mo><mi>V</mi><msup><mi>&Lambda;</mi><mfrac><mn>1</mn><mn>2</mn></mfrac></msup><msup><mi>V</mi><mi>T</mi></msup><mo>)</mo></mrow></mrow></math>]]></maths>V为R的特征向量矩阵,Λ为特征值对角矩阵;抽取其中的基向量构造新的语义空间B,公式如下:<img file="FDA00003397595300013.GIF" wi="261" he="124" />检索过程,具体包括以下步骤:步骤B1:对于一个属于传统语义概念空间C的未知语义<img file="FDA00003397595300014.GIF" wi="97" he="89" />将其映射到P空间中,形成<img file="FDA00003397595300015.GIF" wi="92" he="93" />将<img file="FDA00003397595300016.GIF" wi="66" he="92" />映射到新的B空间中,映射公式为:<img file="FDA00003397595300017.GIF" wi="337" he="123" />计算B空间中向量间的相似度,这里采用余弦相似度来计算,计算公式为:<img file="FDA00003397595300018.GIF" wi="546" he="188" />公式中B<sub>i</sub>、B<sub>j</sub>新的语义空间B中的向量;步骤B2:对每个视频的关键帧,使用每个传统语义概念Ci所对应的概念检测器d<sub>i</sub>,响应超过一定阈值,则将其对应的C<sub>i</sub>加入到集合S中,并对S中的每个语义概念进行步骤B1中的映射,形成新的语义集合N,计算<img file="FDA00003397595300019.GIF" wi="66" he="83" />与N中的余弦相似度,进行排序,选取前K个视频作为返回视频。
地址 610000 四川省成都市武侯区郭家桥正街16号府河竹园16楼1号