发明名称 用数字化语音中呈现的词来索引数字化语音的方法和装置
摘要 用数字化语音中呈现的词索引数字化语音的方法,用在支持用户交互的模式的多模式设备上操作的多模式数字音频编辑器实现,该用户交互的模式包括话音模式和一种或多种非话音模式,该多模式数字音频编辑器操作地耦合于ASR引擎,包括:由多模式数字音频编辑器向ASR引擎提供用于识别的数字化语音;在多模式数字音频编辑器中从ASR引擎接收被识别的用户语音,该被识别的用户语音包括被识别词,还包括指示在数字化语音中何处开始呈现被识别词的信息;以及由多模式数字音频编辑器将与指示在数字化语音中何处开始呈现被识别词的信息相关联的被识别词插入语音识别语法中,该语音识别语法话音使能与所述多模式数字音频编辑器的用户接口命令。
申请公布号 CN101271689B 申请公布日期 2012.06.27
申请号 CN200810083001.1 申请日期 2008.03.17
申请人 纽昂斯通讯公司 发明人 小查尔斯·W·克罗斯;弗兰克·L·贾尼亚
分类号 G10L15/00(2006.01)I;G10L15/08(2006.01)I;G10L15/22(2006.01)I;G06F17/30(2006.01)I 主分类号 G10L15/00(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 黄小临
主权项 一种用数字化语音中呈现的词索引所述数字化语音的方法,所述方法用在多模式设备上操作的多模式数字音频编辑器实现,所述多模式设备支持与所述多模式数字音频编辑器的用户交互的多种模式,所述用户交互的多种模式包括话音模式和一种或多种非话音模式,所述多模式数字音频编辑器操作地耦合于ASR引擎,所述方法包括:由所述多模式数字音频编辑器向ASR引擎提供用于识别的数字化语音;在所述多模式数字音频编辑器中从所述ASR引擎接收被识别的用户语音,所述被识别的用户语音包括被识别词,还包括指示在所述数字化语音中何处开始呈现被识别词的信息;以及在经由话音模式识别用户接口命令时由所述多模式数字音频编辑器将被识别词插入所述多模式数字音频编辑器所使用的语音识别语法中,以及由所述多模式数字音频编辑器在与被识别词相关联的语音识别语法中插入指示在所述数字化语音中何处开始被识别词的呈现的信息。
地址 美国马萨诸塞州