发明名称 定义提取
摘要 一种在文档中标识定义的方法包括接收文本单元作为输入。然后标识哪一文本单元包括提示短语。对于被标识为包括提示短语的文本单元,围绕该提示短语执行局部语法分析以确定包括该提示短语的文本单元是否包含定义。
申请公布号 CN101233484B 申请公布日期 2014.06.11
申请号 CN200680027965.3 申请日期 2006.08.01
申请人 微软公司 发明人 K·R·普维尔;K·W·亨姆菲耶斯;S·阿扎姆
分类号 G06F7/00(2006.01)I 主分类号 G06F7/00(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 张政权
主权项 一种在文档中标识定义的方法,所述方法包括:接收多个文本单元作为输入文本;标识所述多个文本单元中的哪一个包括提示短语;对于所述多个文本单元中不包括提示短语的文本单元,不认定其包含定义;对被标识为包括提示短语的文本单元,围绕所述提示短语执行局部语法分析以确定包括所述提示短语的所述文本单元是否包含定义,围绕所述文本单元的提示短语执行局部语法分析还包括:搜索和分析所标识的提示短语的邻域中的名词短语,所述搜索和分析包括基于一组评分规则将肯定评分和否定评分分别应用到所标识的左名词短语和右名词短语以获得短语评分,并基于所获得的短语评分来确认或否定文本单元包含定义。
地址 美国华盛顿州