发明名称 镜头分割方法
摘要 本发明公开了一种镜头分割方法,包括步骤:A、提取视频中每一帧的尺度不变特征转换SIFT特征作为当前帧的特征,将所有特征聚类得到包含第一预设数量特征词的特征词典;B、计算相邻两帧之间的距离最大值,所述两帧之间的距离最大值大于预设阈值的位置为视频镜头分割的边界。应用本发明所述的镜头分割方法,有效地实现了对一段视频的镜头分割,较好的提取了视频数据中的镜头边界。
申请公布号 CN103578094B 申请公布日期 2016.07.13
申请号 CN201210254690.4 申请日期 2012.07.20
申请人 清华大学 发明人 刘永进;郭文静;罗曦;张金凯;苏舟
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种镜头分割方法,其特征在于,包括步骤:A、提取视频中每一帧的尺度不变特征转换SIFT特征作为当前帧的特征,将所有特征聚类得到包含第一预设数量特征词的特征词典;B、计算相邻两帧之间的距离最大值,所述两帧之间的距离最大值大于预设阈值的位置为视频镜头分割的边界;其中,所述相邻两帧之间的距离由当前每个帧中的特征词与相邻帧特征词的距离最小值之和的平均值来计算;所述相邻两个特征词的距离由静态距离和动态距离构成,所述相邻两个特征词的静态距离sim(w<sub>1</sub>,w<sub>2</sub>)的计算公式为sim(w<sub>1</sub>,w<sub>2</sub>)=||w<sub>1</sub>‑w<sub>2</sub>||<sub>2</sub>,其中w<sub>1</sub>,w<sub>2</sub>分别为两个特征词;所述相邻两个特征词的动态距离md(i,j)的计算公式为<img file="FDA0000968049160000011.GIF" wi="926" he="126" />其中,<img file="FDA0000968049160000012.GIF" wi="77" he="71" />是第i个特征词的第r个特征词实例,N<sub>i</sub>、N<sub>j</sub>分别为第i、j两个特征词的特征词实例的总数,<img file="FDA0000968049160000013.GIF" wi="75" he="79" />是第j个特征词的第s个特征词实例;所述相邻两个特征词的距离wd(i,j)的计算公式为wd(i,j)=λsim(w<sub>1</sub>,w<sub>2</sub>)+(1‑λ)md(i,j),其中0≤λ≤1为权重值;所述相邻两帧之间的距离D(i,j)的计算公式为<img file="FDA0000968049160000014.GIF" wi="1677" he="119" /><img file="FDA0000968049160000015.GIF" wi="582" he="87" />其中n(i)为第i帧特征词总数,n(j)为第j帧特征词总数,<img file="FDA0000968049160000016.GIF" wi="70" he="70" />为第i帧中第r个特征词,<img file="FDA0000968049160000017.GIF" wi="77" he="86" />为第j帧中第s个特征词。
地址 100084 北京市海淀区清华园北京市100084-82信箱