发明名称 使用上下文无关文法的文本规范化方法
摘要 一种文本规范化器(38),对从语音识别器(32)输出的文本进行规范化。文本的规范化所产生的文本(50),对文本的接收者来说是不太难处理的并且是更为惯用的。文本(50)可以被规范化而包括音频内容(58),视频内容(56),或者音频和视频内容的组合。文本(50)也可以被规范化而产生超文本文件(60)。文本的规范化是使用上下文无关文法进行的。上下文无关文法包括一些规定如何将文本规范化的规则。上下文无关文法可以被组成树形,用以对文本进行语法分析并使规范化简单易行。上下文无关文法是可扩充的并易于改变。
申请公布号 CN1285068C 申请公布日期 2006.11.15
申请号 CN98804789.6 申请日期 1998.04.03
申请人 微软公司 发明人 菲来农·A·埃利沃;米切尔·J·罗扎克;来瑞·J·伊萨尔
分类号 G10L15/00(2006.01);G06F17/27(2006.01) 主分类号 G10L15/00(2006.01)
代理机构 中科专利商标代理有限责任公司 代理人 刘晓峰
主权项 1.一种在计算机系统中应用的方法,该计算机系统具有能识别语音输入内容的语音识别机,该方法包括下列计算机实现步骤:接收与来自语音识别机的语音输入相应的文本;应用上下文无关文法,确定所接收的文本的替代内容;和以替代内容代替文本。
地址 美国华盛顿