发明名称 基于特征袋模型和监督学的视频语义标注方法
摘要 本发明涉及一种基于特征袋模型和监督学的视频语义标注方法。该方法的包括步骤如下:(1)对电影视频进行预处理,进行视频镜头边界检测,对电影进行镜头分割;然后采取一定的策略提取出各个镜头的关键帧,每一幅关键帧作为视频镜头的代表帧;(2)构建一个视频语义本体库,定义大量的语义概念,用语义概念描述视频的语义信息,对视频的语义内容进行标注,以便对视频进行管理和检索;(3)提取视频关键帧的SIFT特征,然后采用k-means聚类对这些特征点聚类,每一个聚类代表一个“视觉单词”,从而生成“视觉词汇表”;(4)提取部分“视觉词汇表”进行训练,标注出相应的语义信息,采用监督学方法,预测测试样本中的“视觉单词”,实现对视频关键帧的语义标注。
申请公布号 CN102663015A 申请公布日期 2012.09.12
申请号 CN201210075050.7 申请日期 2012.03.21
申请人 上海大学 发明人 章剑飞;蔡喜;李平;丁友东
分类号 G06F17/30(2006.01)I;G06N3/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海上大专利事务所(普通合伙) 31205 代理人 何文欣
主权项 一种基于特征袋模型和监督学习的视频语义标注方法,其特征在于,具体操作步骤如下:(1)将收集的电影视频数据集进行预处理,视频镜头分割和提取镜头关键帧;(2)构建一个视频语义本体库,定义语义概念,用语义概念描述视频的语义信息,对视频的语义内容进行标注,以便对视频进行管理和检索;(3)采用k‑means聚类算法对视频关键帧提取的SIFT特征点进行聚类,构造视觉词汇表;(4)然后采用支持向量机对样本视觉词汇进行训练,与高层语义进行标注,运用于测试集视觉词汇,实现基于视频镜头的语义标注。
地址 200444 上海市宝山区上大路99号