发明名称 | 基于模式图的关键字查询改进方法 | ||
摘要 | 本发明公开了一种基于模式图的关键字查询改进方法,它包括以下步骤:步骤1.IR引擎模块借助于索引从数据库表导出需要的元组集,候选模块生成器把导出的元组集中的非空元组集和数据库模式图作为输入,生成一组候选网络,并把候选网络作为输出;步骤2.查询日志挖掘模块使用已有的树挖掘算法来对用户的查询日志进行挖掘,以获取用户偏好的频繁模式树;步骤3.利用树编辑距离来定义步骤1生成的候选网络与步骤2挖掘得到的频繁模式树的相似度,生成频繁模式树的相似度;步骤4、跟据步骤1生成的候选网络与步骤3生成的频繁子树的相似度对生成的候选网络进行排序并优先求解排位靠前的候选网络,以此来改进查询的质量和效率。 | ||
申请公布号 | CN102955860B | 申请公布日期 | 2015.10.28 |
申请号 | CN201210492445.7 | 申请日期 | 2012.11.27 |
申请人 | 山东大学;山东英佰德信息科技有限公司 | 发明人 | 禹晓辉;高磊;彭朝晖;闫中敏;杨敏 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 济南圣达知识产权代理有限公司 37221 | 代理人 | 郑华清 |
主权项 | 一种基于模式图的关键字查询改进方法,其特征是,它包括以下步骤:步骤1.IR引擎模块借助于IR索引从数据库表导出需要的元组集,候选模块生成器把导出的元组集中的非空元组集和数据库模式图作为输入,生成一组候选网络并用自由树的形式表示,并把表示后的候选网络作为输出;步骤2.查询日志挖掘模块使用已有的树挖掘算法来对用户的查询日志进行挖掘,以获取用户偏好的频繁模式树;步骤3.利用树编辑距离来定义步骤1生成的候选网络与步骤2挖掘得到的频繁模式树的相似度,生成频繁模式树的相似度;步骤4、根据步骤1生成的候选网络与步骤3生成的频繁模式树的相似度对生成的候选网络进行排序并优先求解排位靠前的候选网络,以此来改进查询的质量和效率。 | ||
地址 | 250061 山东省济南市历城区山大南路27号 |