发明名称 |
用于生成向量码本的方法、用于压缩数据的方法及装置、以及分布式语音识别系统 |
摘要 |
一种用于压缩数据的方法,所述数据由具有Q个特征的输入向量表示,其中,Q为大于1的整数,所述用于压缩数据的方法包括以下步骤:1)提供向量码本,该向量码本包括多个带索引的Q特征参考向量子集以及针对预定特征的、与所述多个子集相关联的阈值;2)通过将所述输入向量的、与所述预定特征相对应的特征的值与和所述多个子集相关联的阈值渐进地进行比较,以在所述多个子集之中识别一参考向量子集;3)识别如下参考向量,该参考向量在步骤2)中识别出的子集内提供针对所述输入向量的最低失真。 |
申请公布号 |
CN101019171B |
申请公布日期 |
2011.08.10 |
申请号 |
CN200480043981.2 |
申请日期 |
2004.07.23 |
申请人 |
意大利电信股份公司 |
发明人 |
茂瑞兹奥·福德瑞尼;多纳托·埃托尔;吉安马瑞奥·博拉诺 |
分类号 |
G10L15/28(2006.01)I;H03M7/30(2006.01)I;G06T9/00(2006.01)I |
主分类号 |
G10L15/28(2006.01)I |
代理机构 |
中国国际贸易促进委员会专利商标事务所 11038 |
代理人 |
杜娟 |
主权项 |
一种用于生成和使用向量码本的方法,该方法提供了始于向量码本的低数据压缩计算工作,所述向量码本包括N个参考向量的集,其中每个参考向量都包括Q个特征,其中,N和Q是大于1的正整数,所述方法包括以下步骤:a)针对所述N个参考向量的集的预定特征的值,按照升序或降序来对所述N个参考向量的集进行排序;b)将经排序的参考向量的集细分为多个子集;c)将针对所述预定特征的相应阈值与所述多个子集中的每一个相关联;其中该方法还包括进一步分割所述N个参考向量的集的步骤,所述进一步分割包括如下步骤:d)针对所述N个参考向量的集的另一预定特征的值,按照升序或降序来对所述多个子集中的每一个的参考向量进行排序;e)将多个经排序的参考向量子集中的每一个细分为多个子子集;f)将针对所述另一预定特征的相应子阈值与所述多个子子集中的每一个相关联,其特征在于该方法还包括步骤g),该步骤g)对于在步骤b)中获得的所述多个子集中的至少一个子集,利用相邻子集的至少一个参考向量对其进行扩展,对于根据步骤g)扩展的子集执行步骤d)和e);该方法还包括使用生成的向量码本来压缩语音数据的步骤。 |
地址 |
意大利米兰 |