发明名称 |
一种相似音频的确定方法及装置 |
摘要 |
本发明实施例公开了一种相似音频的确定方法及装置,该方法包括:确定目标音频的指定音频特征值序列;根据动态时间规整算法,分别计算目标音频的指定音频特征值序列与预先确定的N个基音频的指定音频特征值序列之间的DTW距离;将得到的N个DTW距离确定为目标音频的音频指纹;根据预设的公式,计算目标音频的音频指纹与标准音频的音频指纹的相似度;如果目标音频的音频指纹与标准音频的音频指纹相似度大于预设的预阈值,则确定目标音频与标准音频相似。与现有技术相比,不需要产生大量特征向量,这使得在整个音频指纹匹配过程中,不用大量的特征存储和检索,机器资源开销较小。而且,能减轻现有技术的局部鲁棒性不够高的问题,提高整体鲁棒性。 |
申请公布号 |
CN104464726A |
申请公布日期 |
2015.03.25 |
申请号 |
CN201410840295.3 |
申请日期 |
2014.12.30 |
申请人 |
北京奇艺世纪科技有限公司 |
发明人 |
刘祁跃;李典 |
分类号 |
G10L15/08(2006.01)I;G10L15/10(2006.01)I |
主分类号 |
G10L15/08(2006.01)I |
代理机构 |
北京柏杉松知识产权代理事务所(普通合伙) 11413 |
代理人 |
马敬;项京 |
主权项 |
一种相似音频的确定方法,其特征在于,包括:确定目标音频的指定音频特征值序列;根据动态时间规整算法,分别计算目标音频的指定音频特征值序列与预先确定的N个基音频的指定音频特征值序列之间的DTW距离;其中,所述N个基音频的指定音频特征值序列的确定方法与目标音频的指定音频特征值序列的确定方法相同;将得到的N个DTW距离确定为目标音频的音频指纹;根据预设的公式,计算目标音频的音频指纹与标准音频的音频指纹的相似度,其中,所述标准音频的音频指纹的确定方法与目标音频的音频指纹的确定方法相同;如果目标音频的音频指纹与标准音频的音频指纹相似度大于预设的预阈值,则确定目标音频与标准音频相似;其中,所述目标音频的指定音频特征值序列的确定方法包括:将目标音频按指定的分段规则进行分段处理,得到音频段;按预设的音频段选取规则选取目标音频的至少两个音频段;确定选取的各音频段的指定音频特征值;将已确定的各音频段的指定音频特征值按预设的顺序进行排列,得到目标音频的指定音频特征值序列。 |
地址 |
100080 北京市海淀区北一街2号鸿城拓展大厦10、11层 |