发明名称 一种结合HPSS的MFCC-多反复模型的音乐分离方法
摘要 本发明请求保护一种MFCC-多反复模型的音乐分离方法,涉及信号处理技术领域。考虑到平缓音源较易被忽略,及音乐的时变变化特性,本发明通过谐波、冲击源分离方法(HPSS)对音源类型进行分析,分离出谐波源,然后对剩下的音源提取MFCC特征参数,并对其进行相似运算,构建相似矩阵,以此建立一个适合曲调变换的音源的多反复结构模型,从而得到掩蔽矩阵,最后通过理想二元掩蔽(IBM)和傅里叶逆变换得到歌声及背景音乐的时域波形。该方法可以对不同类型的音源信号进行有效分离,提高了分离的精度,同时,该方法复杂度较低,处理速度快,稳定性较高,在歌手检索及歌曲检索、旋律提取、乐器背景下的语音识别等领域将具有广泛的应用前景。
申请公布号 CN104616663A 申请公布日期 2015.05.13
申请号 CN201510023609.5 申请日期 2015.01.16
申请人 重庆邮电大学 发明人 张天骐;徐昕;张刚;高超;阳锐;李灿
分类号 G10L21/028(2013.01)I;G10L25/81(2013.01)I 主分类号 G10L21/028(2013.01)I
代理机构 重庆华科专利事务所 50123 代理人 康海燕
主权项 一种基于HPSS的MFCC‑多反复结构音乐分离方法,其特征在于,包括以下步骤:在短时傅里叶变换STFT下进行谐波分离,将背景音乐中的谐波源分离出来;提取经谐波分离后剩余的音乐信息中的MFCC特征参数,对MFCC特征参数进行相似运算,得到相似矩阵S<sub>MFCC</sub>;根据相似矩阵S<sub>MFCC</sub>寻找相似片段;根据相似片段建立相应帧的反复结构模型S(i,j),调用反复结构模型进行中值滤波计算相应的反复结构处的背景音乐;根据公式:W(i,j)=min{S(i,j),V(i,j)},得到背景音乐的幅度谱W(i,j),根据幅度谱调用公式:<img file="FDA0000657415720000011.GIF" wi="381" he="157" />建立掩蔽矩阵M(i,j);对掩蔽矩阵M(i,j)采用理想二元掩蔽,经傅里叶逆变换恢复出歌声和背景音乐的时域波形,其中,V(i,j)为信号的幅度谱矩阵,j为帧数,i为频率点。
地址 400065 重庆市南岸区黄桷垭崇文路2号
您可能感兴趣的专利