发明名称 |
基于Hadoop对海量数据进行实时统计的系统和方法 |
摘要 |
本发明提供一种基于Hadoop对海量数据进行实时统计的系统和方法,该系统包括:由多个节点组成的Hadoop集群及Hadoop集群中的Hbase数据库,内存数据库;还包括:网络数据处理单元,用于获取网络数据,对获取的网络数据进行解析;入队单元,用于将解析后的数据组织为结构化数据格式,存储到MQ队列中;Storm处理单元,用于通过Storm对MQ队列中的数据进行流式计算处理,获得处理后的数据,将获得的处理后的数据存入内存数据库中;上传单元,用于将所述内存数据库中预定量的数据汇总持久化至Hadoop集群的Hbase数据库中。本方案能够实现海量数据的实时存储到Hbase数据库。 |
申请公布号 |
CN104657502A |
申请公布日期 |
2015.05.27 |
申请号 |
CN201510109490.3 |
申请日期 |
2015.03.12 |
申请人 |
浪潮集团有限公司 |
发明人 |
牛硕;徐正礼;魏金雷;臧勇真;赵明超 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
济南信达专利事务所有限公司 37100 |
代理人 |
李世喆 |
主权项 |
一种基于Hadoop对海量数据进行实时统计的系统,其特征在于,包括:由多个节点组成的Hadoop集群及Hadoop集群中的Hbase数据库,内存数据库;还包括:网络数据处理单元,用于获取网络数据,对获取的网络数据进行解析;入队单元,用于将解析后的数据组织为结构化数据格式,存储到MQ队列中;Storm处理单元,用于通过Storm对MQ队列中的数据进行流式计算处理,获得处理后的数据,将获得的处理后的数据存入内存数据库中;上传单元,用于将所述内存数据库中预定量的数据汇总持久化至Hadoop集群的Hbase数据库中。 |
地址 |
250100 山东省济南市高新区浪潮路1036号 |