发明名称 音频匹配方法及装置
摘要 本发明公开了一种音频匹配方法及装置,其方法包括:分别计算被测音频与模版音频的二维Teager能量谱图;对被测音频与模版音频的Teager能量谱图分别逐行采用FFT算法计算被测音频与模版音频的POC相似度矩阵;对POC相似度矩阵按列进行平均得到一个一维的相似度值向量,选取相似度值向量中的极大值点的位置作为被测音频与模版音频匹配的结果。本发明的音频匹配方法及装置,基于Teager能量谱与POC进行音频匹配,Teager能量谱特征能够更好的反映语音在高频部分的特性,能够提升音频匹配算法定位的精度,利用POC对噪声引起的幅度谱变化不敏感的特点,提升了匹配算法的鲁棒性,并易于实现并行处理,运算速度快。
申请公布号 CN105989837A 申请公布日期 2016.10.05
申请号 CN201510063616.8 申请日期 2015.02.06
申请人 中国电信股份有限公司 发明人 屈振华;曹磊;龙显军;马涛;杨新章;郭英;李慧云;尹梅;陆钢
分类号 G10L15/10(2006.01)I 主分类号 G10L15/10(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 方亮
主权项 一种音频匹配方法,其特征在于,包括:分别计算被测音频与模版音频的短时Teager能量谱图;对被测音频与模版音频的Teager能量谱图分别逐行采用FFT算法计算被测音频与模版音频的POC相似度矩阵;对所述POC相似度矩阵按列进行平均后得到一个一维的相似度值向量,选取所述相似度值向量中的极大值点的位置作为被测音频与模版音频匹配的结果。
地址 100033 北京市西城区金融大街31号