发明名称 一种视频字幕的确定方法及装置
摘要 本发明实施例提供了一种视频字幕的确定方法及装置,所述方法包括:获取目标视频片段的包含原始字幕的一个或多个视频帧图片以及与多个视频帧图片对应的音频信息,并从多个视频帧图片中选取一个作为目标视频帧图片;将音频信息转化成对应的文本信息;将目标视频帧图片的原始字幕转化成对应的文本信息;在音频信息对应的文本信息和目标视频帧图片的原始字幕对应的文本信息不相同的情况下,针对每个不相同的字符,采用神经网络语言模型分别对音频信息对应的文本信息和目标视频帧图片的原始字幕对应的文本信息进行预测;根据预测结果,确定目标视频片段的目标字幕。应用本发明实施例,提高了目标视频字幕的准确率。
申请公布号 CN106604125A 申请公布日期 2017.04.26
申请号 CN201611250142.9 申请日期 2016.12.29
申请人 北京奇艺世纪科技有限公司 发明人 余咸国;胡明清
分类号 H04N21/439(2011.01)I;H04N21/435(2011.01)I;G10L15/26(2006.01)I;G10L15/16(2006.01)I 主分类号 H04N21/439(2011.01)I
代理机构 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人 项京;马敬
主权项 一种视频字幕的确定方法,其特征在于,所述方法包括:获取目标视频片段的包含原始字幕的一个或多个视频帧图片以及与所述多个视频帧图片对应的音频信息,并从所述多个视频帧图片中选取一个作为目标视频帧图片;将所述音频信息转化成对应的文本信息;将所述目标视频帧图片的原始字幕转化成对应的文本信息;在所述音频信息对应的文本信息和所述目标视频帧图片的原始字幕对应的文本信息不相同的情况下,针对每个不相同的字符,采用神经网络语言模型分别对所述音频信息对应的文本信息和所述目标视频帧图片的原始字幕对应的文本信息进行预测;根据预测结果,确定所述目标视频片段的目标字幕。
地址 100080 北京市海淀区北一街2号鸿城拓展大厦10、11层