一种视频字幕的确定方法及装置,申请号CN201611250142.9-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种视频字幕的确定方法及装置
摘要	本发明实施例提供了一种视频字幕的确定方法及装置，所述方法包括：获取目标视频片段的包含原始字幕的一个或多个视频帧图片以及与多个视频帧图片对应的音频信息，并从多个视频帧图片中选取一个作为目标视频帧图片；将音频信息转化成对应的文本信息；将目标视频帧图片的原始字幕转化成对应的文本信息；在音频信息对应的文本信息和目标视频帧图片的原始字幕对应的文本信息不相同的情况下，针对每个不相同的字符，采用神经网络语言模型分别对音频信息对应的文本信息和目标视频帧图片的原始字幕对应的文本信息进行预测；根据预测结果，确定目标视频片段的目标字幕。应用本发明实施例，提高了目标视频字幕的准确率。
申请公布号	CN106604125A	申请公布日期	2017.04.26
申请号	CN201611250142.9	申请日期	2016.12.29
申请人	北京奇艺世纪科技有限公司	发明人	余咸国;胡明清
分类号	H04N21/439(2011.01)I;H04N21/435(2011.01)I;G10L15/26(2006.01)I;G10L15/16(2006.01)I	主分类号	H04N21/439(2011.01)I
代理机构	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人	项京;马敬
主权项	一种视频字幕的确定方法，其特征在于，所述方法包括：获取目标视频片段的包含原始字幕的一个或多个视频帧图片以及与所述多个视频帧图片对应的音频信息，并从所述多个视频帧图片中选取一个作为目标视频帧图片；将所述音频信息转化成对应的文本信息；将所述目标视频帧图片的原始字幕转化成对应的文本信息；在所述音频信息对应的文本信息和所述目标视频帧图片的原始字幕对应的文本信息不相同的情况下，针对每个不相同的字符，采用神经网络语言模型分别对所述音频信息对应的文本信息和所述目标视频帧图片的原始字幕对应的文本信息进行预测；根据预测结果，确定所述目标视频片段的目标字幕。
地址	100080 北京市海淀区北一街2号鸿城拓展大厦10、11层

您可能感兴趣的专利

BREATHER STRUCTURE

LEG ALIGNMENT APPARATUS AND METHOD

GAS TURBINE ENGINE INCLUDING BLEED SYSTEM COUPLED TO UPSTREAM AND DOWNSTREAM LOCATIONS OF COMPRESSOR

INFLUENZA VACCINE CONSTRUCTS

TRANSMISSION DEVICE AND TIRE STATE MONITORING SYSTEM

PROCESS FOR PREPARING A HIGH MOLECULAR WEIGHT HETEROAROMATIC POLYESTER OR COPOLYESTER

FRAME FOR A LUMINESCENT SCREEN

GUIDE RAIL STRAIGHTNESS MEASURING SYSTEM FOR ELEVATOR INSTALLATIONS

SYSTEMS, METHODS, AND COMPUTER PROGRAM PRODUCTS FOR MANAGING REMOTE TRANSACTIONS

TRANSCODING AND SERVING RESOURCES

SPIROCYCLIC COMPOUNDS, COMPOSITIONS AND MEDICINAL APPLICATIONS THEREOF

MECHANICAL SEAL

COATED ARTICLE WITH LOW-E COATING HAVING LOW VISIBLE TRANSMISSION

OPENING RIGID WING

METHOD FOR PREPARING AN INORGANIC BINDING COMPOSITION

UNIFLOW SCAVENGING 2-CYCLE ENGINE

DECUBITUS TREATMENT SYSTEM

COMPONENT-EMBEDDED SUBSTRATE AND METHOD FOR PRODUCING SAME

OPTIMIZED CATALYST SHAPE FOR STEAM METHANE REFORMING PROCESSES