发明名称 一种基于动态规划的哼唱旋律提取匹配检索方法
摘要 本发明公开了一种基于动态规划的哼唱旋律提取匹配检索方法,其具体步骤如下:用户通过麦克风哼唱的一段歌曲以音频信号的形式进行采集;求出输入信号的对数能量曲线并对其平滑后,根据曲线极大值和极小值动态地估测有声区的能量阈值,切割出连续有声的片段,每个片段和一个哼唱的音符对应;基于时域自相关方法,求出每一帧哼唱信号的基频,然后通过下式转换成半音单位;采用基于规则的方法计算音频帧的音高,然后进行旋律曲线平滑以去掉噪声段,最终获得有效的哼唱旋律;针对3级音高轮廓线旋律表示,基于一种递归式音高轮廓线间最小编辑距离计算方法,与已索引的网络音频文件进行旋律匹配;将相似程度总分最高的若干首网络音频文件作为检索结果返回给用户。
申请公布号 CN105022744A 申请公布日期 2015.11.04
申请号 CN201410171206.0 申请日期 2014.04.24
申请人 上海京知信息科技有限公司 发明人 张军;宋惟忠
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于动态规划的哼唱旋律提取匹配检索方法,其具体步骤如下:1)用户通过麦克风哼唱的一段歌曲以音频信号的形式进行采集;2)求出输入信号的对数能量曲线并对其平滑后,根据曲线极大值和极小值动态地估测有声区的能量阈值,切割出连续有声的片段,每个片段和一个哼唱的音符对应;3)基于时域自相关方法,求出每一帧哼唱信号的基频,然后通过下式转换成半音单位;4)采用基于规则的方法计算音频帧的音高,然后进行旋律曲线平滑以去掉噪声段,最终获得有效的哼唱旋律;5)针对3级音高轮廓线旋律表示,基于一种递归式音高轮廓线间最小编辑距离计算方法,与已索引的网络音频文件进行旋律匹配;6)将相似程度总分最高的若干首网络音频文件作为检索结果返回给用户。
地址 200060 上海市普陀区陕西北路1388号1716A室