发明名称 语音识别系统及用于语音识别系统的特征矢量集的压缩方法
摘要 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量。本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。
申请公布号 CN1455389A 申请公布日期 2003.11.12
申请号 CN02148684.0 申请日期 2002.11.15
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 潘接林;韩疆;刘建;颜永红;庹凌云;张建平
分类号 G10L15/00;G10L15/02 主分类号 G10L15/00
代理机构 北京律诚同业知识产权代理有限公司 代理人 王凤华
主权项 1、一种语音识别系统,至少包括:模数变换单元,将输入语音的模拟信号变换为数字信号;特征提取单元,对该数字信号进行分帧处理,提取每一帧语音的特征参数,得到其特征矢量序列;特征码本,由一定数量的码字组成;量化编码单元,根据特征码本将输入语音的特征矢量序列转换为特征码字序列;概率表,存储了特征码本中每个码字对应高斯码本中每个码字的概率值;以及解码运算单元,对该特征码字序列进行解码运算得到识别结果,运算中对该特征码字序列中的各个码字,从概率表中直接查找与其具有最大匹配概率的高斯码字。
地址 100080北京市海淀区中关村路17号