发明名称 |
一种基于共振峰曲线的语音信号动态特征提取方法 |
摘要 |
本发明提出一种基于共振峰曲线的语音信号动态特征提取方法,属于汉语音信号动态特征提取技术领域。步骤为:采集语音信号;对语音信号进行预处理;提取语音信号共振峰频率特征;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第一共振峰频率特征值进行组合获得第一共振峰曲线,依此类推,获得第二共振峰曲线、第三共振峰曲线及第四共振峰曲线;对获得的每条共振峰曲线进行快速傅里叶变换获得线性频谱;根据线性频谱获得能量谱;根据能量谱获得对数能量;对对数能量进行离散余弦变换。与现有方法相比,本发明提取的是语音信号动态特征,它具有时间相关性,揭示了语音信号前后以及相邻之间存在的密切关联,提高了语音识别的性能。 |
申请公布号 |
CN106024010A |
申请公布日期 |
2016.10.12 |
申请号 |
CN201610340935.3 |
申请日期 |
2016.05.19 |
申请人 |
渤海大学 |
发明人 |
韩志艳;王健;王东;周建壮;郭继宁;刘继行;曹丽 |
分类号 |
G10L25/15(2013.01)I;G10L25/24(2013.01)I;G10L15/02(2006.01)I;G10L15/04(2013.01)I;G10L25/18(2013.01)N;G10L25/21(2013.01)N |
主分类号 |
G10L25/15(2013.01)I |
代理机构 |
沈阳东大知识产权代理有限公司 21109 |
代理人 |
梁焱 |
主权项 |
一种基于共振峰曲线的语音信号动态特征提取方法,其特征在于,包括以下步骤:步骤1、采集语音信号;步骤2、对语音信号进行预处理,包括预加重、分帧加窗和端点检测;步骤3、采用基于Hibert‑Huang变换的方法,对预处理后语音信号的共振峰频率特征进行估算,获得每帧语音信号的第一共振峰特征值、第二共振峰特征值、第三共振峰特征值和第四共振峰特征值;步骤4、构成共振峰曲线,具体为:按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第一共振峰特征值进行组合获得第一共振峰曲线;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第二共振峰特征值进行组合获得第二共振峰曲线;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第三共振峰特征值进行组合获得第三共振峰曲线;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第四共振峰特征值进行组合获得第四共振峰曲线;步骤5、对获得的第一共振峰曲线、第二共振峰曲线、第三共振峰曲线和第四共振峰曲线进行快速傅里叶变换,获得每条共振峰曲线的线性频谱;步骤6、根据线性频谱获得每条共振峰曲线的能量谱;步骤7、根据能量谱获得每条共振峰曲线的对数能量;步骤8、对上述对数能量进行离散余弦变换获得倒频谱域,即获得语音信号动态特征参数。 |
地址 |
121013 辽宁省锦州市松山新区科技路19号渤海大学工学院 |