发明名称 一种实时音频比对方法
摘要 本发明的实时音频比对方法,用于判断两路信号是否为同样的内容:两路音频信号的初始同步和两路音频的周期比对;对两路音频信号分别读取N秒钟的音频,采样得到两组待同步的音频采样序列;通过移动延时值,将两路音频采样序列对齐,本次移动延时值是为粗同步;然后从两路音频采样序列的同一时间点开始向后各取长度为M的同步测试音频序列,得到两个同步测试音频序列的特征值序列,延时值分别为D0、D1和D2;分别计算这两个同步测试音频序列特征值的相关性值L0、L1和L2;定期的对两路音频进行音频信号采样,计算两列采样音频序列的MEL倒谱特征值并相关性;如果相关性仍然大于门限A,说明这段时间内两路音频还是保持内容一致的。
申请公布号 CN104505101A 申请公布日期 2015.04.08
申请号 CN201410814218.0 申请日期 2014.12.24
申请人 北京巴越赤石科技有限公司 发明人 张丹;胡志琳;李佳骅;石建
分类号 G10L25/51(2013.01)I 主分类号 G10L25/51(2013.01)I
代理机构 代理人
主权项 一种实时音频比对方法,用于对两路实时的音频信号进行比较分析,判断两路信号是否为同样的内容,具体包括:两路音频信号的初始同步和两路音频的周期比对;所述两路音频信号的初始同步,包括以下步骤:对第一路音频信号和第二路音频信号,分别读取N秒钟的音频,对两段音频进行采样得到两组待同步的音频采样序列;首先假设两路音频信号的延时值为D为D0,D0=0,进入第一级同步,也就是粗同步的过程;基于假设的延时值D0,移动两路音频采样序列,使其在时间上对齐;然后从两路音频采样序列的同一时间点开始向后各取长度为M的同步测试音频序列,分别计算这两路同步测试音频序列的MEL倒谱特征值,得到两个同步测试音频序列的特征值序列;对假定的延时值D0,减去和加上一个搜索步长S以后,分别得到两个新的假定延时值D1和D2;在延时值分别为D0、D1和D2时,分别计算这两个同步测试音频序列特征值的相关性值L0、L1和L2;根据所述相关值,判断下一步搜索方向继续搜索,一直搜索到确定了最终的取值区间范围;在这个区间内,缩小每一次搜索的步长S,也就是进入第二次同步即细同步,细同步的搜索步长小于粗同步;最后找出具体的延时值D值;所述两路音频的周期比对包括以下步骤:定期的对两路音频进行音频信号采样,计算两列采样音频序列的MEL倒谱特征值,然后比较他们的相关性;如果相关性仍然大于门限A,说明这段时间内两路音频还是保持内容一致的。
地址 100033 北京市海淀区西小府23号3幢1层1204室