发明名称 |
使用上下文无关文法的文本规范化方法 |
摘要 |
一种文本规范化器(38),对从语音识别器(32)输出的文本进行规范化。文本的规范化所产生的文本(50),对文本的接收者来说是不太难处理的并且是更为惯用的。文本(50)可以被规范化而包括音频内容(58),视频内容(56),或者音频和视频内容的组合。文本(50)也可以被规范化而产生超文本文件(60)。文本的规范化是使用上下文无关文法进行的。上下文无关文法包括一些规定如何将文本规范化的规则。上下文无关文法可以被组成树形,用以对文本进行语法分析并使规范化简单易行。上下文无关文法是可扩充的并易于改变。 |
申请公布号 |
CN1285068C |
申请公布日期 |
2006.11.15 |
申请号 |
CN98804789.6 |
申请日期 |
1998.04.03 |
申请人 |
微软公司 |
发明人 |
菲来农·A·埃利沃;米切尔·J·罗扎克;来瑞·J·伊萨尔 |
分类号 |
G10L15/00(2006.01);G06F17/27(2006.01) |
主分类号 |
G10L15/00(2006.01) |
代理机构 |
中科专利商标代理有限责任公司 |
代理人 |
刘晓峰 |
主权项 |
1.一种在计算机系统中应用的方法,该计算机系统具有能识别语音输入内容的语音识别机,该方法包括下列计算机实现步骤:接收与来自语音识别机的语音输入相应的文本;应用上下文无关文法,确定所接收的文本的替代内容;和以替代内容代替文本。 |
地址 |
美国华盛顿 |