发明名称 一种基于音乐指纹特征的音乐检索方法及系统
摘要 本发明公开了一种基于音乐指纹特征的音乐检索方法及系统,其方法包括:构建音乐指纹索引,输入音频信号并进行预处理获取音频频谱图,在频谱图内选取第一锚点、第二锚块和第三锚块进行组合,得到指纹并将其插入到哈希表内,记录该指纹出现的歌曲ID和在歌曲内的位置;音乐检索,提取待检索音乐片段的指纹序列,通过查找哈希表得到各指纹对应的歌曲ID和歌曲位置链表,构建歌曲ID与指纹对应的匹配表,将匹配表内重复最多的歌曲内位置作为命中数,将命中数最多的歌曲作为检索结果。本发明实现当音乐库达到百万级时快速检索;克服信道漂移的问题;提高指纹的抗噪性、鲁棒性;解决最少录音时间的限制;获得更紧致,占更少内存空间的指纹特征。
申请公布号 CN103853836B 申请公布日期 2017.01.25
申请号 CN201410095561.4 申请日期 2014.03.14
申请人 广州酷狗计算机科技有限公司 发明人 孔秋强
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 张月光
主权项 一种基于音乐指纹特征的音乐检索方法,其特征在于,包括:构建音乐指纹索引,输入音频信号并进行预处理获取音频频谱图,在频谱图内选取第一锚点、第二锚块和第三锚块进行组合,得到指纹并将其插入到哈希表内,记录该指纹出现的歌曲ID和在歌曲内的位置;音乐检索,提取待检索音乐片段的指纹序列,通过查找哈希表得到各指纹对应的歌曲ID和歌曲位置链表,构建歌曲ID与指纹对应的匹配表,将匹配表内重复最多的歌曲内位置作为命中数,将命中数最多的歌曲作为检索结果;所述第一锚点的获取方式为:将频谱图切分为M×N块,其中M是指将频谱图纵向频域均匀划分为M个频带,每个频带为a个点;N是指将频谱图横向时域以步长b为单位切割为N个部分;在每块中选取一个幅值最大的点作为第一锚点,并将第一锚点附近R*R的区域内的点赋值为0;所述第二锚块的获取方式为:以第一锚点为起点,在时移b帧后的矩形区域内搜索第二锚块;将该矩形区域划分为X个3*3小块,在每个3*3小块内选择最大的幅值作为该3*3小块的小块代表值,在该矩形区域内选择小块代表值最大的3*3小块的作为第二锚块,并以第二锚块为中心将R*R的区域内的点赋值为0;所述第三锚块的获取方式为:以第一锚点为起点,在时移b帧后的大矩形区域内搜索第三锚块;将该大矩形区域划分为Y个小矩形区域,每个小矩形区域划分为y个2*2小块;在每个2*2小块内选择最大的幅值作为该2*2小块的小块代表值,在小矩形区域内选取出幅值最大的2*2小块,在大矩形区域内选择Z个2*2小块作为第三锚块。
地址 510665 广东省广州市天河区科韵路16号广州信息港B栋13楼