发明名称 | 一种基于连续的多实例学的视频中动作识别的方法 | ||
摘要 | 本发明公开了一种基于连续的多实例学的视频中动作识别的方法。本发明包括如下步骤:1、从视频网站上收集电影数据作为训练数据样本集,同时对网站上收集字幕和剧本进行预处理,将剧本中的动作描述作为训练数据的视频级别的弱标记;2、通过弱标记将视频切分成多个视频片段,每个视频片段由一个动作组成;对于每个动作,利用视频片段训练基于连续的多实例学的动作分类器;3、用户将待识别视频输入至训练好的多个动作分类器,计算待识别视频的每一帧属于该动作的概率;4、通过视频切割模型得到每一帧的动作类别,将动作类别返回给用户。本发明减少了人工标记费时费力的问题,同时减少了弱标记和转折帧带来的二义性问题。 | ||
申请公布号 | CN105138953A | 申请公布日期 | 2015.12.09 |
申请号 | CN201510405296.X | 申请日期 | 2015.07.09 |
申请人 | 浙江大学 | 发明人 | 宋明黎;栾乔;张珂瑶;宋新慧;邱画谋 |
分类号 | G06K9/00(2006.01)I | 主分类号 | G06K9/00(2006.01)I |
代理机构 | 杭州求是专利事务所有限公司 33200 | 代理人 | 叶志坚 |
主权项 | 一种基于连续的多实例学习的视频中动作识别的方法,其特征在于包括如下步骤:步骤1、从视频网站上收集电影数据作为训练数据样本集,同时从网站上收集字幕和剧本,对字幕和剧本进行预处理,将剧本中的动作描述作为训练数据的视频级别的弱标记;步骤2、通过弱标记将视频切分成多个视频片段,每个视频片段由一个动作组成;对于每个动作,利用视频片段训练基于连续的多实例学习的动作分类器;步骤3、用户将待识别视频输入至训练好的多个动作分类器,计算待识别视频的每一帧属于该动作的概率;步骤4、根据所述步骤3得到的概率,通过视频切割模型得到每一帧的动作类别,将动作类别结果返回给用户。 | ||
地址 | 310027 浙江省杭州市西湖区浙大路38号 |