一种面向海量Argo数据的分布式存储方法,申请号CN201610873026.6-传众专利搜索

发明名称	一种面向海量Argo数据的分布式存储方法
摘要	本发明公开了一种面向海量Argo数据的分布式存储方法。该方法可以用来实现对多源异构、动态多维及海量的Argo数据进行高效的存储。其步骤如下：1)设计合理的表结构。2)针对Argo数据的不同特征和应用需求，本方法采用了不同的数据组织与管理方式。3)以HDFS为基础，实现Argo海量数据的分布式存储功能，并自动实现负载均衡。在数据传输中，系统采用了HDFS多节点与虚拟IP相结合的技术，解决了多节点无法同时与外界通信的问题。4)将海量argo数据自动化存入分布式云存储中。本发明在Argo数据管理中具有重要的实际应用价值，应用前景较广。
申请公布号	CN106372256A	申请公布日期	2017.02.01
申请号	CN201610873026.6	申请日期	2016.09.30
申请人	浙江大学	发明人	杜震洪;张丰;刘仁义;吴森森;李志鹏
分类号	G06F17/30(2006.01)I;G06F17/50(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	杭州求是专利事务所有限公司 33200	代理人	张法高
主权项	一种面向海量Argo数据的分布式存储方法，其特征在于包括如下步骤：1)针对Argo数据格式、前台组合查询要求、大数据增量需求设计若干张表结构；2)针对多源Argo数据采用不同的数据组织与管理方式：地图切片数据以影像金字塔文件夹形式进行组织管理；Argo剖面数据和Argo元数据以表记录的形式在PostGreSQL中分别组织；Argo信息产品网格化数据基于MATLAB进行可视化后以文件形式进行组织；3)以Hadoop的HDFS为基础，将上述的多源Argo文件及文件夹数据以不同的组织管理方式在云端进行存储，相应表记录插入PostGreSQL数据库中存储；4)针对不同类型数据设置不同入库步骤，将海量Argo数据自动化解析并存入分布式云存储中。
地址	310058 浙江省杭州市西湖区余杭塘路866号