基于特征袋模型和监督学的视频语义标注方法,申请号CN201210075050.7-传众专利搜索

发明名称	基于特征袋模型和监督学的视频语义标注方法
摘要	本发明涉及一种基于特征袋模型和监督学的视频语义标注方法。该方法的包括步骤如下：(1)对电影视频进行预处理，进行视频镜头边界检测，对电影进行镜头分割；然后采取一定的策略提取出各个镜头的关键帧，每一幅关键帧作为视频镜头的代表帧；(2)构建一个视频语义本体库，定义大量的语义概念，用语义概念描述视频的语义信息，对视频的语义内容进行标注，以便对视频进行管理和检索；(3)提取视频关键帧的SIFT特征，然后采用k-means聚类对这些特征点聚类，每一个聚类代表一个“视觉单词”,从而生成“视觉词汇表”；(4)提取部分“视觉词汇表”进行训练，标注出相应的语义信息，采用监督学方法，预测测试样本中的“视觉单词”，实现对视频关键帧的语义标注。
申请公布号	CN102663015A	申请公布日期	2012.09.12
申请号	CN201210075050.7	申请日期	2012.03.21
申请人	上海大学	发明人	章剑飞;蔡喜;李平;丁友东
分类号	G06F17/30(2006.01)I;G06N3/08(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	上海上大专利事务所(普通合伙) 31205	代理人	何文欣
主权项	一种基于特征袋模型和监督学习的视频语义标注方法，其特征在于，具体操作步骤如下：（1）将收集的电影视频数据集进行预处理，视频镜头分割和提取镜头关键帧；（2）构建一个视频语义本体库，定义语义概念，用语义概念描述视频的语义信息，对视频的语义内容进行标注，以便对视频进行管理和检索；（3）采用k‑means聚类算法对视频关键帧提取的SIFT特征点进行聚类，构造视觉词汇表；（4）然后采用支持向量机对样本视觉词汇进行训练，与高层语义进行标注，运用于测试集视觉词汇，实现基于视频镜头的语义标注。
地址	200444 上海市宝山区上大路99号