发明名称 |
语音信号处理方法、语音和声纹识别方法及其装置 |
摘要 |
本发明提出了一种语音信号处理方法,包括:对所获取的语音信号进行数字化、加窗分帧和傅立叶变换后得到第一频谱信号;基于第一频谱信号导出至少一个作为该第一频谱信号的变型的衍生频谱信号;对第一频谱信号和至少一个衍生频谱信号进行离散余弦变换,计算各自的倒谱系数向量;以及基于所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出每个短时语音帧的倒谱系数向量,作为与该短时语音帧对应的前端特征向量。 |
申请公布号 |
CN102723081A |
申请公布日期 |
2012.10.10 |
申请号 |
CN201210173657.9 |
申请日期 |
2012.05.30 |
申请人 |
林其灿 |
发明人 |
林其光 |
分类号 |
G10L17/00(2006.01)I;G10L15/02(2006.01)I;G10L21/02(2006.01)I |
主分类号 |
G10L17/00(2006.01)I |
代理机构 |
北京鸿元知识产权代理有限公司 11327 |
代理人 |
林锦辉 |
主权项 |
一种语音信号处理方法,包括:对所获取的语音信号进行数字化;将数字化后的语音信号加窗分帧为多个短时语音帧;针对每个短时语音帧进行下述处理:进行傅立叶变换,得到该短时语音帧的第一频谱信号;基于所得到的第一频谱信号,导出至少一个作为该第一频谱信号的变型的衍生频谱信号;对第一频谱信号和至少一个衍生频谱信号进行离散余弦变换,计算各自的倒谱系数向量;以及基于所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出每个短时语音帧的倒谱系数向量,作为与该短时语音帧对应的前端特征向量。 |
地址 |
214125 江苏省无锡市滨湖区锦溪路100号软件园A区2#楼403室 |