发明名称 用于海量数据管理的数据处理方法和系统
摘要 本发明涉及一种用于海量数据管理的数据处理方法和系统。该方法包括:设置多个数据加载装置的步骤、设置元数据管理装置的步骤、在所述数据存储服务器上设置数据管理服务装置的步骤。该系统包括:多个数据加载装置、元数据管理装置、数据存储服务器。该方法和系统提高了海量数据的处理效率,降低了针对海量数据处理的复杂性,从而实现提高海量数据检索与挖掘的效率。
申请公布号 CN102332004A 申请公布日期 2012.01.25
申请号 CN201110217035.7 申请日期 2011.07.29
申请人 中国科学院计算技术研究所 发明人 吴广君;王树鹏;云晓春;张永铮;王明华
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 祁建国;梁挥
主权项 一种用于海量数据管理的数据处理方法,其特征在于,包括:A,设置多个数据加载装置的步骤,通过二维表结构管理不同类型的字段创建不同类型的索引,并以并发方式向通过网络连接的至少一个数据存储服务器加载索引数据源,实现数据加载与维护操作;B,设置元数据管理装置的步骤,用于记录由所述数据加载装置生成的索引分片的分布信息,记录并更新所述数据存储服务器的状态信息,以及记录所述索引分片与所述数据存储服务器的对应关系;C,在所述数据存储服务器上设置数据管理服务装置的步骤,用于存储、管理所述索引分片,并根据检索命令并发检索索引分片,并向所述元数据管理装置报告工作状态。
地址 100080 北京市海淀区中关村科学院南路6号