发明名称 应用搜索结果的自然语言处理以改进整体精度的信息检索系统的设备和方法
摘要 应用自然语言处理以处理信息检索引擎(20)例如基于统计的常规搜索引擎的检索结果从而改进整体精度的信息检索系统(5)的设备和相伴方法。具体地,这类搜索最后产生一组检索文件。然后每个这类文件经受自然语言处理以产生一组逻辑形式。每个这类逻辑形式用“词-关系-词”方式将词组中的词之间的语义关系,具体是内容和修饰成分加以编码。以同样方式分析用户提供的查询以产生一组它们的相应的逻辑形式。按照文件和查询的逻辑形式的预定函数将文件排序。具体地,将查询的逻辑形式组和每个检索的文件的逻辑形式组比较以便确认在这两个组的任何逻辑形式之间的匹配。对每个具有至少一个匹配逻辑形式的文件探索性地计分,对匹配逻辑形式的每个不同关系赋予不同相应的预定权值。每个这类文件的分数是例如它的独一地匹配的逻辑形式的权值的预定函数。最后将留下的文件按下降分数排序并按此顺序呈现给用户。
申请公布号 CN1165858C 申请公布日期 2004.09.08
申请号 CN98808395.7 申请日期 1998.05.13
申请人 微软公司 发明人 利萨·布雷登-哈德;西蒙·H·科斯顿;威廉·B·多兰;露西·H·范德温德
分类号 G06F17/30 主分类号 G06F17/30
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 李德山
主权项 1.一种用于从一个信息库(10)中检索所存文件的信息检索系统(5)中所用的设备,所述系统具有一个检索系统(20),用于对一个查询作出响应而从该信息库中检索多个与该查询相关的所存文件以定义一个输出文件组;所述设备包括:一个处理器(340);及具有存在其中的可执行指令(400,600)的存储器(375);及其中该处理器对存于存储器中的指令作出响应从而:对查询作出响应而产生一个它的第一逻辑形式,其中第一逻辑形式描绘与该查询有关的词之间的语义关系;为输出的文件组中每个不同的文件获取一个相应的第二逻辑形式,其中第二逻辑形式描绘所述一个文件内与一个词组有关的词之间的语义关系;通过产生、比较和加权第一逻辑形式和输出文件组中多个文件中的每一个的第二逻辑形式的匹配来对输出文件组中多个文件进行排序以确定排序顺序;及按照所排顺序提供多个与输出文件组有关的所存条目作为输出(446)。
地址 美国华盛顿