主权项 |
一种提高数据库检索信息相关度的方法,其特征在于,包括如下步骤:(A)建立概念树:利用所属领域的概念间内在的关联因素建立概念树,所述概念树分为多层,第1层为根结点,除根结点外,概念树中的每一结点至少包括一个或一个以上的数据库表中检索字段的值以及权值;(B)在概念树中搜索用户检索词,以得到更多相关检索词:当获取用户输入的检索词后,在所述概念树中按照一定的策略搜索检索字段的值,如果存在该结点检索字段的值与检索词相匹配,则按规则将该结点及其相关结点插入一个结点列表中,完成搜索后,返回该结点列表;(C)生成查询条件表达式:若返回的结点列表不为空,则顺序遍历结点列表中的结点,将检索字段的值与检索词相匹配的字段按“字段名=字段值”组成表达式,多个表达式之间用逻辑连词“OR”进行连接,当遍历完整个结点列表后,生成一个完整的SQL查询条件表达式,执行下一步骤(D),若返回的结点列表为空,则返回空的最终的检索结果;(D)检索数据库:根据生成的查询条件表达式,进一步生成完整的SQL查询语句,提交给数据库进行检索并返回结果集;(E)检索结果重新排序:对结果集在内存中按结点列表中结点的权值重新进行排序,并返回最终的检索结果,清空结点列表;步骤(B)中,若概念树为n层,为提高检索信息的相关度,所述搜索策略为:先搜索第n层,即先搜索叶结点,若搜索完第n层,有检索字段的值与检索词相匹配的结点,按规则插入结点列表,并返回结点列表,结束搜索;若没有搜索到,则继续搜索第n‑1层,以此类推,直到搜索到第1层的根结点,则表明搜索失败,返回空的结点列表。 |