发明名称 |
一种海量医疗数据的快速统计查询方法 |
摘要 |
本发明公开了一种海量医疗数据的快速统计查询方法。首先从不同的数据源收集、过滤和处理医疗数据,保存处理后的医疗数据到分布式文件系统hdfs或者hbase中;针对某个或某些基于统计的医疗数据,利用所述分布式文件系统hdfs或者hbase来创建并初始化统计树;针对新增的医疗数据进行一个或多个增量计算,并用增量计算的结果去更新所述统计树;服务端基于所创建的一个或者多个统计树来响应用户的统计查询请求,将所述统计查询请求解析成基于一个或者多个统计树的子查询,并合并成多个子查询的结果返回给所述用户。该方法可以迅速定位统计数据的位置,避免大数据量的访问,从而减轻了系统负载,提高了查询效率和访问的并发性。 |
申请公布号 |
CN103049556A |
申请公布日期 |
2013.04.17 |
申请号 |
CN201210587210.6 |
申请日期 |
2012.12.28 |
申请人 |
中国科学院深圳先进技术研究院 |
发明人 |
张帆;彭智;须成忠;闫茜;甘波 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳中一专利商标事务所 44237 |
代理人 |
梁珣 |
主权项 |
一种海量医疗数据的快速统计查询方法,其特征在于,所述方法包括:从不同的数据源收集、过滤和处理医疗数据,保存处理后的医疗数据到分布式文件系统hdfs或者hbase中;针对某个或某些基于统计的医疗数据,利用所述分布式文件系统hdfs或者hbase来创建并初始化统计树;针对新增的医疗数据进行一个或多个增量计算,并用增量计算的结果去更新所述统计树;服务端基于所创建的一个或者多个统计树来响应用户的统计查询请求,将所述统计查询请求解析成基于一个或者多个统计树的子查询,并合并成多个子查询的结果返回给所述用户。 |
地址 |
518055 广东省深圳市南山区西丽大学城学苑大道1068号 |