发明名称 |
一种高效的倒排索引结构及组织方法 |
摘要 |
本发明公开了一种高效的倒排索引结构及组织方法。将记录倒排项和属性倒排项分开存储,减少信息冗余;采用分块方式对倒排索引进行存储,以数据库索引优化为切入点,综合利用链表和集中定位表的优势对倒排块进行管理,既有利于索引动态维护又便于SKIP技术下的随即访问;同时根据域间关联关系,采用了压缩技术,以达到尽量少的空间存储尽量多的信息量。所提供的倒排索引结构及组织方法,减少了存储空间、优化了访问时间,在一定程度解决了倒排索引优化问题,能够实现海量数据的有效管理。 |
申请公布号 |
CN103853772A |
申请公布日期 |
2014.06.11 |
申请号 |
CN201210511478.1 |
申请日期 |
2012.12.04 |
申请人 |
北京拓尔思信息技术股份有限公司 |
发明人 |
王弘蔚 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种高效倒排索引结构,其特征在于,该倒排索引由倒排项组成,倒排项被拆分成记录倒排项和属性倒排项,由此倒排索引被分为记录倒排索引和属性倒排索引。 |
地址 |
100088 北京市海淀区知春路6号锦秋国际大厦14层14B04 |