发明名称 |
一种基于音符建模的哼唱式音乐检索方法及系统 |
摘要 |
本发明适用于计算机应用技术领域,提供了一种基于音符建模的哼唱式音乐检索方法及系统。本发明采用高斯混合模型技术对标准音符进行建模和参数训练,将从哼唱语音中解析出来的音符及其时长序列与库中各关键旋律的标准音符及其时值序列进行相似度计算,取出最优结果。其最突出的特点是,当歌曲库新增歌曲时不需要进行新增模型和参数训练工作,具有推广应用前景。 |
申请公布号 |
CN103823867A |
申请公布日期 |
2014.05.28 |
申请号 |
CN201410066669.0 |
申请日期 |
2014.02.26 |
申请人 |
深圳大学 |
发明人 |
徐明 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市恒申知识产权事务所(普通合伙) 44312 |
代理人 |
陈健 |
主权项 |
一种基于音符建模的哼唱式音乐检索方法,其特征在于,所述哼唱识别方法包括下述步骤:步骤A,于用户的哼唱语音中,提取各语音帧的音高,并保存为哼唱语音音高序列;步骤B,根据预先建立的音符模型参数库,利用步骤A提取的音高分别计算出当前语音帧属于所述音符模型参数库中各个音符模型的概率值,根据计算的概率值以及音符模型参数库对当前语音帧进行音符模型匹配识别,若当前语音帧与其前一相邻语音帧分属不同的音符模型时,记录下当前语音帧的帧号;步骤C,重复步骤A到步骤B,当哼唱语音依序逐语音帧全部处理完毕后,得出所述哼唱语音所对应的音符模型序列以及序列中各个音符模型的起始语音帧号,依次计算出每个音符模型所持续的语音帧数,对应为该音符模型持续的时长;步骤D,结合步骤A中得到的哼唱语音音高序列对步骤C中得到的音符模型及其时长序列进行修正处理,最终确定出所述哼唱语音所包含的音符模型序列及其相对应的时长序列,并表示成<音符,时长>的二元组序列形式;步骤E,对步骤D中得到的<音符,时长>二元组序列在预先建立的歌曲及旋律乐素结构库中进行匹配和相似度计算,按照相似度值由高到低进行排序,选取前若干名相似度最高的旋律作为最终的识别结果进行输出。 |
地址 |
518060 广东省深圳市南山区南海大道3688号 |