发明名称 |
信息检索方法和装置 |
摘要 |
本发明提供一种信息检索方法和装置,用于解决现有技术中根据关键词在文档库中搜索相关文档,得到的搜索结果与用户需求不符的问题。其中,方法包括:获取用户的查询语句,查询语句中包括一个或多个词或词组;对查询语句进行语义识别,获取查询语句对应的第一语义组表达式;将第一语义组表达式与预先编制的索引表中的各个第二语义组表达式进行匹配,确定与第一语义组表达式相匹配的第二语义组表达式;在索引表中获取相匹配的第二语义组表达式的相关文档标识;在文档库中获取与相关文档标识对应的文档;将与相关文档标识对应的文档返回给用户。 |
申请公布号 |
CN103324678B |
申请公布日期 |
2016.06.01 |
申请号 |
CN201310200430.3 |
申请日期 |
2013.05.27 |
申请人 |
俞声 |
发明人 |
俞声 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
刘芳 |
主权项 |
一种信息检索方法,其特征在于,包括:获取用户的查询语句,所述查询语句中包括一个或多个词或词组;对所述查询语句进行语义识别,获取所述查询语句对应的第一语义组表达式,所述第一语义组表达式用于表示一个或多个语义元及其语义属性,若用于表示多个语义元,则所述第一语义组表达式还用于表示所述多个语义元之间的修饰关系;将所述第一语义组表达式,与预先编制的索引表中的各个第二语义组表达式进行匹配,确定与所述第一语义组表达式相匹配的第二语义组表达式,所述第二语义组表达式用于表示一个或多个语义元及其语义属性,若用于表示多个语义元,则所述第二语义组表达式还用于表示所述多个语义元之间的修饰关系;在所述索引表中获取所述相匹配的第二语义组表达式的相关文档标识;在文档库中获取与所述相关文档标识对应的文档;将与所述相关文档标识对应的文档返回给所述用户;所述对所述查询语句进行语义识别,获取所述查询语句对应的第一语义组表达式,包括:确定所述查询语句中所有语义元的属性,以及语义元之间的修饰关系,所述属性包括肯定或否定属性;针对所述查询语句生成第一语义组表达式,所述第一语义组表达式中包括所述查询语句中所有的语义元标识及其属性标识,以及语义元之间的修饰关系标识。 |
地址 |
100031 北京市西城区复兴门内大街2号 |