发明名称 一种基于数据仓库内在特征的OLAP关键词查询方法
摘要 本发明涉及数据仓库搜索技术,尤其涉及一种基于数据仓库内在特征的OLAP关键词查询方法,将可能的查询结果返回给OLAP用户,简化用户多维分析的过程,本发明只对维度表建立索引,这样提高了索引的速度,消除了无关信息的噪音;在索引过程中,通过过滤非相关维度属性来减少无关信息对查询结果的影响,采用过滤重复的维度列的方法规避冗余数据对语义的影响;根据维度层次粒度产生了维度层次权重系数,通过在传统的全文检索排序策略上增加维度层次权重系数来提升命中结果准确度;通过Joins相似的排序评分方法提高了结果排序的准确性,解决了现有技术中存在的问题。
申请公布号 CN102306176B 申请公布日期 2013.09.25
申请号 CN201110247045.5 申请日期 2011.08.25
申请人 浙江鸿程计算机系统有限公司 发明人 吴勇;陈岭;肖敏;张云松
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于数据仓库内在特征的OLAP关键词查询方法,其特征在于包括如下步骤: 1)从数据空间中读取以维度形式存储的历史数据; 2)采用列结构创建数据仓库维度的全文索引,采用索引结构为:<维度、属性、属性级别、属性值>; 3)过滤维度表中非关键词属性和重复记录; 4)根据用户输入的关键词在上述全文索引的基础上进行检索,得到对应的维度层次; 5)根据维度层次系数对命中的维度层次进行排序,得到排序后的命中组; 6)对排序后属于不同维度的命中组集合进行连接,产生连接后的查询结果集; 7)最后将查询结果集返回给用户。
地址 310013 浙江省杭州市教工路1号11号楼1楼