发明名称 一种基于音符和时值建模的哼唱识谱方法及系统
摘要 本发明适用于计算机应用技术领域,提供了一种基于音符和时值建模的哼唱识谱方法,本发明建立有包括音符音高模型集和音符时值模型集在内的乐理高斯混合模型库,所述乐理高斯混合模型库中的所有模型均事先通过乐理高斯混合模型训练单元进行模型参数训练,并可选用乐理高斯混合模型重估训练单元进行模型参数的重估训练,哼唱识谱时,对采集的用户哼唱语音分别进行音高特征提取、乐理信息解码识别、节拍提取、乐理处理与变换,最后输出成标准乐谱。本发明方法设计的哼唱识谱系统识别率高、稳定性好,还能适应个人的唱歌行为特点,可作为专业人员或音乐爱好者的创作助手和备用工具,具有推广应用价值和产业化前景。
申请公布号 CN103824565A 申请公布日期 2014.05.28
申请号 CN201410066451.5 申请日期 2014.02.26
申请人 曾新;徐明;王利斌 发明人 曾新;徐明;王利斌
分类号 G10L21/06(2013.01)I 主分类号 G10L21/06(2013.01)I
代理机构 深圳市恒申知识产权事务所(普通合伙) 44312 代理人 陈健
主权项 一种基于音符和时值建模的哼唱识谱方法,其特征在于,所述方法包括下述步骤:步骤A,于用户的哼唱语音中,提取当前语音帧的音高;步骤B,根据预先建立的音符音高模型集,利用步骤A提取的音高分别计算出当前语音帧属于所述音符音高模型集中各个音符音高模型的概率值,根据计算的概率值以及音符音高模型集对当前语音帧进行音符音高模型匹配识别,若当前语音帧与其前一相邻语音帧分属不同的音符音高模型时,记录下当前语音帧号;步骤C,重复步骤A到步骤B,当哼唱语音依序逐语音帧全部处理完毕后,确定出哼唱语音所对应的音符音高模型序列以及序列中各个音符音高模型的起始语音帧号,计算出所述各个音符音高模型各自所持续的语音帧数,并累积分析语音帧的音高变化情况,判断出其中包含的旋律段后提取该旋律段的节拍信息;步骤D,根据预先建立的音符时值模型集,从步骤C确定的音符音高模型序列中依次选取出一个音符音高模型,利用其所持续的语音帧数分别计算出选取的音符音高模型属于所述音符时值模型集中各个音符时值模型的概率值,根据计算的概率值以及音符时值模型集对选取的音符音高模型进行音符时值模型匹配识别;步骤E,重复步骤D,当步骤C中确定的全部音符音高模型序列处理完毕后,得出哼唱语音所包含的各个音符音高模型序列以及各个音符音高模型持续语音帧数所对应的音符时值模型,形成一组<音符音高模型,音符时值模型>序列;步骤F,根据步骤A提取的音高和步骤C提取的节拍信息,对步骤E确定的哼唱语音的<音符音高模型,音符时值模型>序列进行乐理转换处理,得到对应的<标准音符,标准时值>序列,据此生成对应的乐谱。
地址 410083 湖南省长沙市中南大学信息可视艺术与设计研究中心