发明名称 一种海量数据下可靠索引更新系统及方法
摘要 本发明涉及一种海量数据下可靠索引更新系统,包括日志预写模块、日志数据库、断点控制模块、断点设置模块、资源缓存模块和内存索引存储区;本发明还涉及一种海量数据下可靠索引更新方法;本发明针对索引构建速度和资源数据更新速度不匹配以及宕机时内存索引易丢失的情况,加入了日志预写、断点设置的机制解决了以上问题,保证了索引更新的可靠性;其次,针对物联网实体资源数据动态变化速度快的特点,在传统的实时索引更新方法中的内存索引更新操作之前加入了资源缓存的机制,在10000个资源的属性重复更新100次的情况下将索引更新速度提升了10倍以上。
申请公布号 CN104899249A 申请公布日期 2015.09.09
申请号 CN201510221611.3 申请日期 2015.05.04
申请人 中国科学院信息工程研究所 发明人 朱红松;陈磊;孙利民;于楠;闫兆腾;黄伟武
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京轻创知识产权代理有限公司 11212 代理人 杨立
主权项 一种海量数据下可靠索引更新系统,其特征在于,包括日志预写模块(1)、日志数据库(2)、断点控制模块(3)、断点设置模块(4)、资源缓存模块(5)和内存索引存储区(6);所述日志预写模块(1),用于实时接收从物联网实体资源数据中心(7)推送来的资源更新信息,并将资源更新信息以“资源ID+属性参数”的格式写入日志数据库中;所述日志数据库(2),用于保存各条“资源ID+属性参数”的资源更新记录;所述断点控制模块(3),用于根据所述日志数据库(2)中保存的资源更新记录的增长情况判断是否达到阈值,如果达到阈值,将断点信号发送至所述断点设置模块(4)后,再发送更新信号至所述资源缓存模块(5)进行处理;所述断点设置模块(4),用于记录各组资源更新记录的断点信息,当接收到所述断点信号后,以本组资源更新记录中更新的最后一条资源更新记录作为断点来建立断点信息,并将断点信息写入断点记录表中;所述资源缓存模块(5),用于当接收到更新信号后,在建立的更新记录缓存区或所述内存索引存储区(6)中逐一对本组的资源更新记录的内容进行更新处理;所述内存索引存储区(6),用于当资源缓存模块(5)处理完成后,将在更新记录缓存区处理的资源更新记录的内容导入,并根据经过更新处理后的资源更新记录的内容对内存索引文件进行更新。
地址 100093 北京市海淀区闵庄路甲89号