发明名称 |
基于位置网的创新平台数据管理方法及系统 |
摘要 |
本发明提出一种基于位置网的创新平台数据管理方法及系统。其中,方法包括:根据位置网提供的服务构建创新平台的框架,并利用Hadoop平台的HDFS与HBase将位置网数据库的数据信息及用户操作的信息转移存储到创新平台的框架上构建创新平台;利用创新平台提供的HDFS和HBase作为文件存储和数据库存储的支撑,并利用平台参数封装用户访问的API,使用户通过云桌面实现对分布式文件系统和数据库的操作与管理;以及根据MapReduce编程框架对常用的关系代数算法和分布式数据挖掘算法进行封装并集成开发环境进行数据预处理。根据本发明实施的方法,通过位置网位置与服务数据的转移与计算,为位置网的构建提供了相关统计数据信息,还对该平台API进行扩展提供了数据计算操作与管理接口。 |
申请公布号 |
CN103064670B |
申请公布日期 |
2016.12.07 |
申请号 |
CN201210553873.6 |
申请日期 |
2012.12.18 |
申请人 |
清华大学 |
发明人 |
黄永峰;罗芳;郑枫;陈跻 |
分类号 |
G06F9/44(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F9/44(2006.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
张大威 |
主权项 |
一种基于位置网的创新平台数据管理方法,其特征在于,包括以下步骤:S1:根据位置网提供的服务构建创新平台的框架,并利用Hadoop平台的HDFS与HBase将所述位置网数据库的数据信息及用户操作的信息转移存储到创新平台的框架上并进行数据挖掘统计构建创新平台;S2:利用所述创新平台提供的HDFS和HBase作为文件存储和数据库存储的支撑,并利用平台配置参数和表的路径参数封装用户访问的API,通过云主机对文件系统和数据库进行操作和管理;以及S3:根据所述创新平台提供的存储平台对MapReduce编程框架对常用的关系代数算法和数据挖掘算法进行封装,提供云端开发环境,并利用所述创新平台的框架对分布式算法进行封装形成插件,为用户数据提供计算处理能力,所述步骤S1具体包括:S11:在所述位置网提供的服务器平台上申请云服务器的使用;S12:将所述位置网的位置和服务数据转移到创新平台的数据库中;S13:对转移的所述位置网的位置和服务数据根据不同数据挖掘算法进行数据分析;以及S14:将分析后的数据进行统计并显示;所述步骤S2进一步包括:S21:搭建支撑底层存储与计算的Hadoop平台,其中,所述Hadoop平台包括HDFS、MapReduce和HBase;S22:整合Hadoop平台提供的所述HDFS和HBase相关的API;S23:将所述HDFS和HBase相关的API进行二次开发和封装;以及S24:调用封装后的所述HDFS和HBase相关的API生成数据存储管理界面对用户数据进行存储和管理。 |
地址 |
100084 北京市海淀区100084-82信箱 |