发明名称 |
基于多层优化平衡树的数值与文本混合倒排索引算法 |
摘要 |
本发明实现了一种基于多层优化平衡树的数值与文本的混合倒排索引算法。传统的文本倒排索引仅仅支持对自由文本的索引,数值内容通常转换为文本后按照文本内容建立倒排索引。本发明对传统的文本倒排索引算法进行了优化和扩展,使之能够支持数值与文本的混合型数据的索引,并在查询性能、索引空间、构建性能方面实现合理的平衡。本发明的索引算法,适合于使用在混合型的数据管理引擎中,提高数值与文本混合型数据的复合查询性能。 |
申请公布号 |
CN102402540A |
申请公布日期 |
2012.04.04 |
申请号 |
CN201010282299.6 |
申请日期 |
2010.09.15 |
申请人 |
浙江天宇信息技术有限公司 |
发明人 |
郑益 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于多层优化平衡树的数值与文本混合倒排索引方法,其特征在于:在普通文本倒排索引结构的基础上,对数值倒排词典的二叉树结构进行增强,数值词典部分引入多层优化平衡树,使得查询性能不会随着数值的分布范围而急剧下降。该混合索引结构如图1所示。 |
地址 |
310006 浙江省杭州市环城西路33号省经济信息中心大楼B座五楼 |