发明名称 利用文本的语义表示进行信息检索
摘要 本发明涉及利用文本的语义表达进行信息检索。在一种优选实施例中,记号化器从输入字符串生成表征该输入字符串中所表达的语义关系的信息检索记号。记号化器首先从输入字符串建立表征输入字符串中的选定词之间的语义关系的原逻辑形式。接着记号化器确定和输入字符串中选定词之一具有“isa(是)”关系的超属词。然后记号化器从原逻辑形式构造一个或多个替代逻辑形式。通过为输入字符串中的一个或多个选定词中的每个选定词用为该选定词确定的某超属词代替原逻辑形式中的该选词,记号化器构造各替代逻辑形式。最后,记号化器生成代表原逻辑形式和替代逻辑形式的记号。最好使用记号化器生成记号,以便既用于构造代表目标文档的索引又用于对照索引处理查询。
申请公布号 CN1252876A 申请公布日期 2000.05.10
申请号 CN98804175.8 申请日期 1998.02.11
申请人 微软公司 发明人 约翰·J·麦瑟利;乔治·E·海德恩;斯蒂芬·D·理查德森;威廉·B·杜兰;卡轮·杰森
分类号 G06F17/30 主分类号 G06F17/30
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 酆迅
主权项 1.计算机系统中一种用于从输入字符串生成信息检索记号的方法,该方法包括步骤:从输入字符串建立表征该输入字符串中选定的词之间的语义关系的原逻辑形式;确定该输入字符串中各选定词的超属词;从该原逻辑形式构造一个或多个替代的逻辑形式,通过为该输入字符串中的一个或多个选定词中的每个词用对该选定词确定的超属词代替原逻辑形式中的该选定词,构造每个替代的逻辑形式;以及生成代表原逻辑形式以及替代逻辑形式的记号,所生成的记号可由信息检索引擎区分。
地址 美国华盛顿