发明名称 一种结合SVM和增强型PCP特征的和弦识别方法
摘要 本发明公开了一种结合SVM和增强型PCP特征的和弦识别方法,包括:音频输入并进行节拍跟踪、提取增强型音级轮廓特征PCP、支持向量机SVM分类参数的训练、两类和弦分类到多类和弦分类的转变、和弦类型的识别。和弦识别是自动音乐标注的基础,它在歌曲翻唱识别,音乐分割以及音频匹配等领域具有重要作用。针对不同乐器之间相同和弦的识别较低的问题,采用结合音高频率倒谱系数(PFCC)改进传统音级轮廓特征(PCP)的算法,并将增强型PCP特征作为新的和弦识别特征。实验结果表明采用增强型PCP特征比采用传统PCP特征的和弦识别率提高了2.5%~6.7%。
申请公布号 CN103714806A 申请公布日期 2014.04.09
申请号 CN201410008923.1 申请日期 2014.01.07
申请人 天津大学 发明人 李锵;闫志勇;关欣
分类号 G10H1/38(2006.01)I;G10L15/08(2006.01)I;G10L25/54(2013.01)I 主分类号 G10H1/38(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 李丽萍
主权项 一种结合SVM和增强型PCP特征的和弦识别方法,具体包括以下步骤:步骤一、音频输入并进行节拍跟踪:通过节拍跟踪获取与节拍构成相符的音频节拍时间点信息,并得到信号能量特征E;步骤二、提取增强型音级轮廓特征:对信号能量特征E进行音高倒谱系数的处理,采用音高尺度公式log(E*C+1)代替信号能量特征E,其中,C表示音高正常数,C=100;对使用对数表示的音级能量进行DCT变换获取音高倒谱系数;然后,保留高频音高倒谱系数,将低频音高倒谱系数置零,对处理后的音高倒谱系数进行DCT逆变换得到变换后的音级能量,然后进行频谱映射,得到12维增强型音级轮廓特征,记做lgE;对12维lgE特征的两两音级之间做互相关计算,将12维信号特征扩展为90维;步骤三、支持向量机分类参数的训练:提取每首歌曲的增强型音级轮廓特征并与相应歌曲的标签文件组合形成的特征向量输入到两类分类器支持向量机中进行训练;步骤四、两类和弦分类到多类和弦分类的转变:将音乐和弦分为25类,包括12类大调和弦(C,C#,…G)和12类小调和弦(c,c#,…g),其他和弦作为第25类和弦,采用DAG算法完成两类分类到多类分类的转换;步骤五、和弦类型的识别:通过步骤三和步骤四得到与25类和弦分别对应的分类器参数,将待识别歌曲输入到已经训练好的分类器中,从而得到该歌曲的和弦识别率。
地址 300072 天津市南开区卫津路92号