发明名称 用于生成语音谱的方法
摘要 一种用于从输入文字生成语音谱的方法可用于有效地提供涉及话音识别处理的音频反馈。该方法包括:将与输入文字关联的音素的长度与多个模型状态相调准(步骤315)。其后,通过为所述多个模型状态中的每一状态从多混合高斯密度模型状态中选择混合来生成状态序列(步骤320)。接下来,通过使用状态序列为输入文字生成语音参数序列(步骤325)。其后,将语音参数序列转换为语音谱(步骤330)。
申请公布号 CN101165776B 申请公布日期 2012.04.25
申请号 CN200610135662.5 申请日期 2006.10.20
申请人 纽昂斯通讯公司 发明人 曹振海;祖漪清
分类号 G10L13/00(2006.01)I;G10L13/02(2006.01)I;G10L13/04(2006.01)I;G10L15/08(2006.01)I;G10L15/14(2006.01)I 主分类号 G10L13/00(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 康建忠
主权项 一种用于从输入文字生成语音谱序列、确认来自用户的语音的识别精确性的方法,该方法包括:从用户接收语音输入;使用语音识别应用来识别语音输入中的每一个输入文字;将输入文字转换为模型序列;通过将与输入文字关联的音素的长度与多个模型状态相调准来生成状态序列;通过为使用文字语料所计算的每一模型状态定义默认混合而为所述多个模型状态中的每一状态从多混合高斯密度模型状态中选择混合来生成混合序列;通过使用混合序列为输入文字生成语音参数序列;将语音参数序列转换为语音谱序列;以及将所述输入文字播放为对所述语音识别应用的用户的音频反馈,从而改善并确认语音识别精度。
地址 美国马萨诸塞州
您可能感兴趣的专利