发明名称 |
音视频字幕生成方法及装置 |
摘要 |
本发明公开了一种音视频字幕生成方法及装置,该方法包括:接收待生成字幕的语音数据及文本数据;根据发音人韵律对所述语音数据进行切分,得到符合说话人惯的各语音数据段;根据所述语音数据段对所述文本数据进行切分,得到与所述语音数据段对应的文本数据段;根据各语音数据段的时间信息获取与所述语音数据段对应的文本数据段的开始时间和结束时间。本发明可以简单高效地实现文本数据的显示与语音数据的同步,使生成的字幕更完整。 |
申请公布号 |
CN105244022A |
申请公布日期 |
2016.01.13 |
申请号 |
CN201510629172.X |
申请日期 |
2015.09.28 |
申请人 |
科大讯飞股份有限公司 |
发明人 |
周明;江源;王影;胡国平;胡郁;刘庆峰 |
分类号 |
G10L15/00(2013.01)I;G10L15/26(2006.01)I |
主分类号 |
G10L15/00(2013.01)I |
代理机构 |
北京维澳专利代理有限公司 11252 |
代理人 |
刘路尧;逢京喜 |
主权项 |
一种音视频字幕生成方法,其特征在于,包括:接收待生成字幕的语音数据及文本数据;根据发音人韵律对所述语音数据进行切分,得到符合说话人习惯的各语音数据段;根据所述语音数据段对所述文本数据进行切分,得到与所述语音数据段对应的文本数据段;根据各语音数据段的时间信息获取与所述语音数据段对应的文本数据段的开始时间和结束时间。 |
地址 |
230088 安徽省合肥市高新开发区望江西路666号 |