发明名称 |
生成字幕文件的方法及装置 |
摘要 |
本公开是关于一种生成字幕文件的方法及装置,属于语音识别技术领域。方法包括:通过获取视频中的音轨;根据该音轨对应在各个时刻的音量将该音轨分割成多个子音轨;对该多个子音轨中的音频进行语音识别,获得该多个子音轨中的音频对应原始语种的第一文本;将该第一文本翻译为目标语种对应的第二文本;根据该第二文本以及该多个子音轨各自对应的播放时间段生成该音轨对应的字幕文件,无需人工听译,而是通过终端或者服务器等装置自动完成读取视频中音轨、语音识别音轨、将语音识别后得到的文本翻译成字幕文件中所需的文本等步骤,达到自动快速将非母语视频中的音轨翻译成母语字幕,简化字幕制作的人工翻译步骤,缩短字幕制作周期的效果。 |
申请公布号 |
CN105828101A |
申请公布日期 |
2016.08.03 |
申请号 |
CN201610186623.1 |
申请日期 |
2016.03.29 |
申请人 |
北京小米移动软件有限公司 |
发明人 |
刘鸣;刘健全;伍亮雄 |
分类号 |
H04N21/233(2011.01)I;H04N21/439(2011.01)I;H04N21/488(2011.01)I |
主分类号 |
H04N21/233(2011.01)I |
代理机构 |
北京三高永信知识产权代理有限责任公司 11138 |
代理人 |
鞠永善 |
主权项 |
一种生成字幕文件的方法,其特征在于,所述方法包括:获取视频中的音轨;根据所述音轨对应在各个时刻的音量将所述音轨分割成多个子音轨,所述多个子音轨对应各自的播放时间段;对所述多个子音轨中的音频进行语音识别,获得所述多个子音轨中的音频对应原始语种的第一文本,所述原始语种是所述音频中的语音的语种;将所述第一文本翻译为目标语种对应的第二文本;根据所述第二文本以及所述多个子音轨各自对应的播放时间段生成所述音轨对应的字幕文件。 |
地址 |
100085 北京市海淀区清河中街68号华润五彩城购物中心二期9层01房间 |