发明名称 |
并行计算系统及去重计数方法 |
摘要 |
本发明另提出一种并行计算系统及方法,其方法包括以下步骤:(1)设置多个节点数据库。(2)将源数据库中的海量数据按照关键字段进行分割,并分配到各个节点数据库。(3)判断统计内容是否是被分割的关键字段。(4)若是,则对关键字段进行非重复的计数运算。(5)若不是,对非关键字段进行分组统计运算。本发明可以大大提高大型数据库的统计速度,并可以确保数据统计的准确性。 |
申请公布号 |
CN101916281B |
申请公布日期 |
2012.12.19 |
申请号 |
CN201010255635.8 |
申请日期 |
2010.08.17 |
申请人 |
上海云数信息科技有限公司 |
发明人 |
李晓华 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海唯源专利代理有限公司 31229 |
代理人 |
曾耀先 |
主权项 |
一种并行计算系统,用于对一源数据库进行统计,其特征在于,包括:一数据分割服务器,与该源数据库相连,用于将该源数据库中的海量数据按照关键字段进行分割;多个节点服务器,均与该数据分割服务器相连,且每个节点服务器又进一步包括:一节点数据库,与该数据分割服务器相连,用于存放分割后的数据;一解析单元,用于判断统计内容是否是被分割的关键字段;一计数统计单元,分别与该节点数据库及该解析单元相连,用于对关键字段进行非重复的计数运算;一分组统计单元,分别与该节点数据库及该解析单元相连,用于对非关键字段进行分组统计运算;一汇总服务器,且该汇总服务器又进一步包括:一临时表存储单元,与各个节点服务器相连,用于存放各个节点服务器反馈的统计结果,并汇总形成一临时表;一主处理单元,与该临时表存储单元相连,用于对该临时表中的关键字段数据进行求和运算,以及对该临时表中的非关键字段数据进行非重复的计数运算,并形成最终的结果集。 |
地址 |
201112 上海市闵行区联航路1588号1幢业务楼B408室 |