发明名称 一种多媒体语音字幕生成的系统和方法
摘要 本发明提供一种多媒体语音字幕生成系统和方法,所述字幕生成系统包括控制模块、字幕处理模块、语音处理模块、校对分段模块和字幕输出模块,所述字幕处理模块、语音处理模块、校对分段模和字幕输出模块均连接在所述控制模块上,所述控制模块另一端连接云端服务器,所述方法通过对音视频的获取、分析、识别、切分、生成字幕、校准和后期加工等步骤,完成多媒体语音字幕的自动生成,解决了影视字幕依靠手工拍字幕局限性,无论音视频文件是否具有语音标准文档(即台词),均可自动高效连续生成字幕,人性化的人机交互系统可根据实际情况选择字幕样式,包括每行字数、行数和字体等,多次精准校对使生成的字幕与视频匹配率达100%。
申请公布号 CN105245917A 申请公布日期 2016.01.13
申请号 CN201510628334.8 申请日期 2015.09.28
申请人 徐信 发明人 徐信
分类号 H04N21/235(2011.01)I;H04N21/233(2011.01)I;H04N21/234(2011.01)I;G10L13/08(2013.01)I 主分类号 H04N21/235(2011.01)I
代理机构 北京金智普华知识产权代理有限公司 11401 代理人 巴晓艳
主权项 一种多媒体语音字幕生成系统,其特征在于,所述字幕生成系统包括控制模块、字幕处理模块、语音处理模块、校对分段模块和字幕输出模块,所述字幕处理模块、语音处理模块、校对分段模和字幕输出模块均连接在所述控制模块上,所述控制模块另一端连接云端服务器。
地址 102206 北京市昌平区北农路7号