发明名称 | 语法创造中的分段歧义的自动解析 | ||
摘要 | 生成基于规则的语法。在训练数据中识别分段歧义。列举歧义分段的重写规则并且为其每一个生成概率。基于该概率来解析歧义。在一个具体实施例中,通过应用期望最大(EM)算法来进行。 | ||
申请公布号 | CN1542650A | 申请公布日期 | 2004.11.03 |
申请号 | CN200410035225.7 | 申请日期 | 2004.04.05 |
申请人 | 微软公司 | 发明人 | 王野翊;A·埃西罗 |
分类号 | G06F17/27 | 主分类号 | G06F17/27 |
代理机构 | 上海专利商标事务所 | 代理人 | 李家麟 |
主权项 | 1、一种用于自然语言处理的生成基于规则的语法的方法:识别训练数据中的分段歧义,其中训练数据的分段是有歧义的;列举所有歧义分段的重写规则;以及通过基于由训练数据所支持的重写规则的发生来生成每个列举的重写规则的概率,从而自动解析分段歧义。 | ||
地址 | 美国华盛顿州 |