发明名称 基于音频指纹特征的音乐检索系统
摘要 本发明属于信息检索技术领域,具体为一种基于音频指纹特征的音乐检索系统。该系统由预处理模块、特征提取模块、倒排索引模块和精匹配模块四部分组成。预处理模块主要完成音频信号的转换、重采样、滤波;特征提取模块是对音频文件的表示,采用音频指纹特征,通过两次基于动态阈值的筛选来选取频谱中最为稳定的点作为特征点,用一个点对表示一个特征;倒排索引模块是将特征作为关键词,由歌曲库的特征建立倒排索引,根据相同关键词多少返回索引结果;精匹配模块是结合音频特征间的时序关系,采用改进的编辑距离作为两个特征序列的相似度,以此优化索引结果。本系统适用海量音乐检索,尤其能对录音查询片段进行有效检索。
申请公布号 CN103440313A 申请公布日期 2013.12.11
申请号 CN201310378000.0 申请日期 2013.08.27
申请人 复旦大学 发明人 俞鹏飞;杨夙
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海正旦专利代理有限公司 31200 代理人 陆飞;盛志范
主权项 一种基于音频指纹特征的音乐检索系统,其特征在于包括预处理模块,特征提取模块,倒排索引模块和精匹配模块四个部分;其中:所述的预处理模块,用于音频文件格式统一,音频重采样和音频滤波;所述的特征提取模块,用于对音乐文件的结构化表示,采用基于动态阈值的音乐指纹特征;首先对歌曲序列进行分帧,对每帧进行快速傅里叶变换,处理完所有帧,得到频谱矩阵;接着,对频谱矩阵进行平滑处理;然后,在矩阵中选取极值点,并根据动态阈值对这些点进行两次筛选,取大于阈值的点作为特征点;最后,用一个点对表示一个特征,并经哈希函数变换,输出一个哈希值为一个特征;对于每个特征点,在其后续频段的邻近区域内,选取最多P个最近邻的特征点与该特征点一一组成特征;所有特征按帧的先后顺序和首次特征点筛选顺序组成一维特征序列;所述的倒排索引模块,用于系统的初次检索,以一个特征作为一个关键词,对数据库中的每首歌曲的特征建立倒排索引表;当查询时,通过倒排索引表统计查询片段每个关键词在各歌曲中出现的次数,并将所有关键词在各个歌曲中出现的次数求和,然后对求和的结果进行排序,排序结果所对应的歌曲作为初次检索结果;所述的精匹配模块,用于系统的二次检索,先根据初次检索返回的结果选定候选歌曲,接着读取各候选歌曲的特征序列,并对特征序列按查询特征序列长度进行分段,对每首歌曲筛选出最为相似的Q个特征序列片段,即其与查询特征序列具有最多的相同特征个数;然后,对这Q个片段与查询特征序列进行改进的编辑距离计算,取最小的编辑距离作为该歌曲片段与查询片段的相似度;最后,根据相似度对候选歌曲进行排序,得到最终的检索排名。
地址 200433 上海市杨浦区邯郸路220号