发明名称 用于识别输入语音的重音的系统和方法
摘要 一种用于识别输入语音的重音的系统和方法,存储:培训用语数据、培训语音数据、以及培训边界数据。然后,在输入边界数据候选者后,根据输入用语数据、培训用语数据和培训边界数据来计算第一概率,所述第一概率是在输入文本中的字的韵律词组的每个边界与输入的边界数据候选者之一一致的概率。另外,在输入语音具有由输入的边界数据候选者之一指定的韵律词组的边界的情况下,也根据输入语音数据、培训语音数据和培训边界数据来计算第二概率。所述第二概率是在输入文本中的每个字的语音与由输入语音数据指定的语音一致的概率。其后,从输入的边界数据候选者搜索出最大化第一和第二概率的乘积的一个边界数据候选者,然后输出搜索结果。
申请公布号 CN101192404B 申请公布日期 2011.07.06
申请号 CN200710186763.X 申请日期 2007.11.16
申请人 纽昂斯通讯公司 发明人 立花隆辉;长野彻;西村雅史;仓田岳人
分类号 G10L13/00(2006.01)I;G10L13/08(2006.01)I;G10L15/00(2006.01)I 主分类号 G10L13/00(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 黄小临
主权项 一种识别输入语音的重音的系统,包括:存储单元,其在其中存储:培训用语数据,用于指示在培训文本中的每个字的用语;培训语音数据,用于指示在培训语音中的每个字的语音的特征;培训边界数据,用于指示是否在培训文本中的每个字是韵律词组的边界;以及培训重音数据,该培训重音数据指示在培训文本中的每个字的重音类型;第一计算单元,其中输入边界数据的候选者,即边界数据候选者,所述边界数据用于指示是否在输入语音中的每个字是韵律词组的边界,并且,所述第一计算单元根据输入用语数据、培训用语数据和培训边界数据,计算在输入文本中的字的韵律词组的边界的每个与输入的边界数据候选者之一一致的第一概率,所述输入用语数据用于指示在输入文本中的每个字的用语,所述输入文本用于指示输入语音的内容;第二计算单元,其中输入边界数据候选者,并且其根据输入语音数据、培训语音数据和培训边界数据,计算第二概率,所述第二概率是在输入语音具有由边界数据候选者的任何一个指定的韵律词组的边界的情况下,在输入文本中的每个字的语音与由输入语音数据指定的语音一致的概率,所述输入语音数据用于指示在输入语音中的每个字的语音的特征;以及韵律词组搜索单元,其从输入的边界数据候选者中搜索最大化第一概率和第二概率的乘积的一个边界数据候选者,然后输出被搜索出的边界数据候选者来作为用于将输入文本划分为韵律词组的边界数据,其中,所述系统还包括第三计算单元、第四计算单元和重音类型搜索单元,其中对于由所述韵律词组搜索单元搜索出的边界数据划分的每个韵律词组,所述第三计算单元接收在每个韵律词组中包含的相应字的重音类型候选者的输入,并且根据输入语音数据、培训用语数据和培训重音数据来计算第三概率,该第三概率是每个字的重音类型与输入的重音类型候选者之一一致的概率,第四计算单元接收重音类型候选者的输入,并且根据输入语音数据、培训语音数据和培训重音数据来计算第四概率,所述第四概率是在每个韵律词组中包含的每个字具有由重音类型候选者之一指定的重音类型的情况下,每个韵律词组的语音与由输入语音数据指定的语音一致的概率,并且所述重音类型搜索单元从输入的重音类型候选者中搜索最大化第三概率和第四概率的乘积的一个重音类型候选者,并且输出所搜索出的重音类型候选者来作为每个韵律词组的重音类型。
地址 美国马萨诸塞州