发明名称 单声道多音音乐信号的自动转录方法及装置
摘要 本发明提供了一种单声道多音音乐信号的自动转录方法及装置,该自动转录方法包括:接收单通道多音音乐信号;对所述单声道多音音乐信号进行分离,得到多路单音音乐信号;对各路单音音乐信号进行音色提取,确定演奏乐器信息;对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。上述单声道多音音乐信号的自动转录方法及装置,通过将多音音乐信号分离成多路单音音乐信号,对分离出的各路单音音乐信号分别进行音色和旋律、节奏及节拍的提取,获得演奏乐器信息和音频信息,进而根据所述演奏乐器信息和所述音频信息获得高准确率的多音音乐乐谱。
申请公布号 CN103854644B 申请公布日期 2016.09.28
申请号 CN201210516769.X 申请日期 2012.12.05
申请人 中国传媒大学 发明人 王晖;王雨田;朱兵;王颖;宫妍竹
分类号 G10L15/02(2006.01)I;G10L15/26(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京安信方达知识产权代理有限公司 11262 代理人 栗若木;曲鹏
主权项 一种单声道多音音乐信号的自动转录方法,其特征在于,该方法包括:接收单通道多音音乐信号;对所述单声道多音音乐信号进行分离,得到多路单音音乐信号,包括:将多音音乐信号进行分帧处理,获得多个音频帧,对各音频帧进行静音检测确定是否为静音帧,对每一非静音帧进行多基频检测,获得音符信息和基频检测值;对不同音符进行谐波数及幅度的估计,获得各音符的幅度和谐波信息,依据贝叶斯谐波模型,利用所述基频估计值,获得时域分音信号;依据预设的帧移及帧数,逐帧对时域分音信号进行合成;对各路单音音乐信号进行音色提取,确定演奏乐器信息,包括:将各路单音音乐信号分帧,将各帧单音音乐信号进行转换,得到各单音信号的内禀模态函数集合;利用非线性音色模型,提取各帧单音音乐信号的模型参数;将获得的模型参数与预存数据进行对比,判断演奏各路单音音乐信号的乐器信息;对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息,包括:将各路单音音乐信号分帧,按照启发式规则和各帧单音音乐信号频谱峰值信息,进行基频检测,得到音高和对应音符;将各帧单音音乐信号归一化,得到一阶差分包络,利用能量突起进行音符起始点检测;对差分后的边沿信号进行处理,得到其自相关信号和自相关相位熵序列,利用二者信息计算节拍检测待检信号;对音符起始点序列进行处理,根据音乐速度范围和音符之间关系将音符节拍分类,并利用各类在待检信号的峰值找出节拍长度作为候选节拍;选取不同的检测起点和节拍值,对整首音乐进行设定权值的多路径跟踪,得到与开始音符匹配的节拍值及节拍起始位置和各个节拍的位置;以及根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。
地址 100024 北京市朝阳区定福庄南里7号中国传媒大学逸夫综合楼802A