发明名称 |
用于自动语音识别的方法和装置 |
摘要 |
一种自动语音识别(ASR)系统,包括语音-响应应用程序和语音识别引擎。ASR系统生成用户提示以引出某些口语输入,当口语输入被识别时,语音-响应应用程序执行操作。识别引擎将输入音频信号中的声音与声学模型中的音素进行比较,以辨识候选匹配音素。对每个候选匹配音素计算识别置信度分值,置信度分值用于帮助辨识一个或者多个可能的匹配音素序列,该序列似乎匹配语音-响应应用程序的语法中的单词。根据预先定义的置信度分值标准(例如,低于“低置信度”阈值的辨识分值)评估每个音素的置信度分值,评估的结果用于影响随后的用户提示的选择。一种这样的系统使用置信度分值选择用于目标识别训练的提示-鼓励输入被识别为具有低置信度识别分值的音素。另一个系统选择提示以阻止输入不容易被识别的声音。 |
申请公布号 |
CN1783213A |
申请公布日期 |
2006.06.07 |
申请号 |
CN200510114906.7 |
申请日期 |
2005.11.11 |
申请人 |
国际商业机器公司 |
发明人 |
B·J·皮克林;T·D·波尔特尼;B·T·斯塔尼福德;M·惠特伯恩 |
分类号 |
G10L15/28(2006.01);G10L15/08(2006.01);G10L15/00(2006.01) |
主分类号 |
G10L15/28(2006.01) |
代理机构 |
北京市中咨律师事务所 |
代理人 |
于静;刘薇 |
主权项 |
1.一种用于控制自动语音识别(ASR)系统的操作的方法,包括以下步骤:将输入音频信号中的声音与声学模型中的音素进行比较,以辨识候选匹配音素;对各个候选匹配音素计算识别置信度分值;评估所述识别置信度分值,以辨识至少一个具有预定识别置信度特征的候选匹配音素;以及选择用于引出随后的用户输入的用户提示,其中所述选择取决于所辨识的至少一个音素和所辨识的至少一个音素的识别置信度特征。 |
地址 |
美国纽约 |