发明名称 语音识别系统及用于语音识别系统的特征矢量集的压缩方法
摘要 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量。本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。
申请公布号 CN1455388A 申请公布日期 2003.11.12
申请号 CN02148683.2 申请日期 2002.11.15
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 潘接林;韩疆;刘建;颜永红;庹凌云;张建平
分类号 G10L15/00;G10L15/02 主分类号 G10L15/00
代理机构 北京律诚同业知识产权代理有限公司 代理人 王凤华
主权项 1、一种用于语音识别系统的特征矢量集的压缩方法,先将该特征矢集划分为若干子空间,再对每个子空间的所有矢量进行聚类得到一码本,各子空间码本生成的步骤包括:(a)将该子空间所有矢量划分到子集合中,计算该子集合的中心矢量,得到初始化码本;(b)将所有子集合一分为二,生成新的中心矢量以合成该子空间的新码本;(c)分别找到与该子空间各矢量距离度量最小的中心矢量,将各矢量分配到与其距离度量最小的中心矢量对应的子集合中;(d)计算出该子空间所有矢量的总距离度量变化率;(e)将该变化率与一预设变化率的门限值比较;若该变化率小于或小于等于该门限值,再判断是否已获得预定比特数的码本,若是,则结束,若否,则执行步骤(b);若该变化率大于等于或等于该门限值,则执行步骤(f);(f)基于各子集合中的矢量个数和平均距离度量,对某些子集合进行合并和分裂;以及(g)将分裂得到的子集合的中心矢量作为代表该子集合的码字,得到该子空间的新码本,并回到步骤(c)。
地址 100080北京市海淀区中关村路17号