发明名称 |
一种面向海量Argo数据的分布式存储方法 |
摘要 |
本发明公开了一种面向海量Argo数据的分布式存储方法。该方法可以用来实现对多源异构、动态多维及海量的Argo数据进行高效的存储。其步骤如下:1)设计合理的表结构。2)针对Argo数据的不同特征和应用需求,本方法采用了不同的数据组织与管理方式。3)以HDFS为基础,实现Argo海量数据的分布式存储功能,并自动实现负载均衡。在数据传输中,系统采用了HDFS多节点与虚拟IP相结合的技术,解决了多节点无法同时与外界通信的问题。4)将海量argo数据自动化存入分布式云存储中。本发明在Argo数据管理中具有重要的实际应用价值,应用前景较广。 |
申请公布号 |
CN106372256A |
申请公布日期 |
2017.02.01 |
申请号 |
CN201610873026.6 |
申请日期 |
2016.09.30 |
申请人 |
浙江大学 |
发明人 |
杜震洪;张丰;刘仁义;吴森森;李志鹏 |
分类号 |
G06F17/30(2006.01)I;G06F17/50(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
杭州求是专利事务所有限公司 33200 |
代理人 |
张法高 |
主权项 |
一种面向海量Argo数据的分布式存储方法,其特征在于包括如下步骤:1)针对Argo数据格式、前台组合查询要求、大数据增量需求设计若干张表结构;2)针对多源Argo数据采用不同的数据组织与管理方式:地图切片数据以影像金字塔文件夹形式进行组织管理;Argo剖面数据和Argo元数据以表记录的形式在PostGreSQL中分别组织;Argo信息产品网格化数据基于MATLAB进行可视化后以文件形式进行组织;3)以Hadoop的HDFS为基础,将上述的多源Argo文件及文件夹数据以不同的组织管理方式在云端进行存储,相应表记录插入PostGreSQL数据库中存储;4)针对不同类型数据设置不同入库步骤,将海量Argo数据自动化解析并存入分布式云存储中。 |
地址 |
310058 浙江省杭州市西湖区余杭塘路866号 |