发明名称 音视频同步检测方法及其系统、语音检测方法及其系统
摘要 本发明公开了一种音视频同步检测方法及其系统,以及一种语音检测方法及其系统,该音视频同步检测方法包括:确定目标端所播放的音视频文件中,与音频参考数据匹配的音频段的起始播放时间,以及与视频参考数据匹配的视频帧的起始播放时间;根据所述与音频参考数据匹配的音频段的起始播放时间,以及所述与视频参考数据匹配的视频帧的起始播放时间,确定出所述音视频文件在目标端播放时的音视频播放时间差;获取所述音视频文件在源端播放时的音视频播放时间差,根据所述音视频文件在源端和目标端播放时的音视频播放时间差,确定出所述音视频文件在所述目标端播放时的音视频同步情况。采用本发明可提高音视频同步检测的准确度。
申请公布号 CN102056026B 申请公布日期 2013.04.03
申请号 CN200910237414.5 申请日期 2009.11.06
申请人 中国移动通信集团设计院有限公司 发明人 陈欣伟;方力;沈亮;高屹;常静;侯优优;阮征
分类号 H04N21/434(2011.01)I;H04N21/8547(2011.01)I;G10L25/03(2013.01)I;G10L25/57(2013.01)I;G10L25/90(2013.01)I 主分类号 H04N21/434(2011.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 郭润湘
主权项 一种音视频同步检测方法,其特征在于,包括如下步骤:确定目标端所播放的音视频文件中,与音频参考数据匹配的音频段的起始播放时间,以及与视频参考数据匹配的视频帧的起始播放时间;根据所述与音频参考数据匹配的音频段的起始播放时间,以及所述与视频参考数据匹配的视频帧的起始播放时间,确定出所述音视频文件在目标端播放时的音视频播放时间差;获取所述音视频文件在源端播放时的音视频播放时间差,根据所述音视频文件在源端和目标端播放时的音视频播放时间差,确定出所述音视频文件在所述目标端播放时的音视频同步情况;其中,所述音频参考数据为语音数据,确定与音频参考数据匹配的音频段的起始播放时间的过程,包括:检测出所播放的音视频文件中包含的语音段及其起止播放时间;通过将检测出的语音段与所述音频参考数据进行语音识别处理,确定出与所述音频参考数据匹配的语音段;其中,确定所播放的音视频文件中包含的语音段及其起止播放时间的过程,包括:根据语音信号短时平均幅度在所播放的音视频文件中搜索音频信号,当搜索到短时平均幅度超过第一幅度阈值的音频信号时,记为第一当前时刻;以及在该第一当前时刻后搜索到短时平均幅度首次下降到第一幅度阈值以下的音频信号时,记为第二当前时刻;当从第一当前时刻向前和从第二当前时刻向后搜索到短时平均幅度降到第二幅度阈值的音频信号时,根据短时平均过零率继续沿原搜索方向搜索音频信号;所述第二幅度阈值小于所述第一幅度阈值;当向前搜索到短时平均过零率降到过零率阈值以下的音频信号时,记为第三当前时刻,并将第三当前时刻作为语音段的起点,当向后搜索到短时平均过零率降到过零率阈值以下的音频信号时,记为第四当前时刻,并将第四当 前时刻作为语音段的终点。
地址 100080 北京市海淀区丹棱街甲16号
您可能感兴趣的专利