发明名称 |
语音识别系统 |
摘要 |
本发明提供一种语音识别系统,包括:存储单元,用于存储至少一个用户的语音模型;语音采集及预处理单元,用于采集待识别语音信号,对所述待识别语音信号进行格式转换及编码;特征提取单元,用于从编码后的所述待识别语音信号中提取语音特征参数;模式匹配单元,用于将所提取的所述语音特征参数与至少一个所述语音模型进行匹配,确定所述待识别语音信号所属的用户。该系统从语音的产生原理开始分析语音的特性,并使用MFCC参数,建立说话人的语音特征模型,实现说话人的特征识别算法,能够达到提高说话人检测可靠性的目的,使得最终能够在电子产品上实现说话人识别的功能。 |
申请公布号 |
CN103236260B |
申请公布日期 |
2015.08.12 |
申请号 |
CN201310109044.3 |
申请日期 |
2013.03.29 |
申请人 |
京东方科技集团股份有限公司;北京京东方显示技术有限公司 |
发明人 |
王健铭 |
分类号 |
G10L15/07(2013.01)I;G10L25/87(2013.01)I;G10L25/93(2013.01)I |
主分类号 |
G10L15/07(2013.01)I |
代理机构 |
北京银龙知识产权代理有限公司 11243 |
代理人 |
许静;黄灿 |
主权项 |
一种语音识别系统,其特征在于,包括:存储单元,用于存储至少一个用户的语音模型;语音采集及预处理单元,用于采集待识别语音信号,对所述待识别语音信号进行格式转换及编码;特征提取单元,用于从编码后的所述待识别语音信号中提取语音特征参数;模式匹配单元,用于将所提取的所述语音特征参数与至少一个所述语音模型进行匹配,确定所述待识别语音信号所属的用户;端点检测单元,用于计算进行格式转换及编码后的所述待识别语音信号的语音起点及语音终点,去除所述待识别语音信号中的静音信号,获得所述待识别语音信号中语音的时域范围;以及用于对所述待识别语音信号中的语音频谱进行傅里叶变换FFT分析,根据分析结果计算所述待识别语音信号中的元音信号、浊音信号及轻辅音信号;在确定了元音、浊音段后,再向前后两端扩展搜索包含语音端点的帧。 |
地址 |
100015 北京市朝阳区酒仙桥路10号 |