发明名称 一种基于HBase的传染病数据管理方法
摘要 本发明公开了一种基于HBase的传染病数据管理方法,该方法包括传染病数据的存储和查询获取,所述传染病数据的存储包括非结构化数据的存储和从已有的结构化数据库获取的数据的存储,所述的查询获取包括结构化数据的获取和非结构化数据的获取。对于传染病数据量大的特点,非结构数据库采用键值数据模型,能够处理数据存储量大,能够支持高并发读写;对于传染病数据实时更新的特点,非结构化数据库采用列式数据存储,存储性能和查询效率得到提高;对于图片文本数据,非结构化数据库采用文档数据模型和图形数据模型,扩展性得到增强。本发明适用于存储与查询传染病数据。
申请公布号 CN104794567A 申请公布日期 2015.07.22
申请号 CN201510166304.X 申请日期 2015.04.10
申请人 华东师范大学 发明人 顾君忠;相晓敏;李舒媛;张学军
分类号 G06Q10/06(2012.01)I;G06Q50/22(2012.01)I;G06F17/30(2006.01)I 主分类号 G06Q10/06(2012.01)I
代理机构 上海蓝迪专利事务所 31215 代理人 徐筱梅;张翔
主权项 一种基于HBase的传染病数据管理方法,其特征在于该方法包括传染病数据的存储及查询获取;所述传染病数据的存储包括传染病非结构化数据的存储和从已有的结构化数据库获取的传染病结构化数据的存储;所述传染病数据的查询获取包括传染病结构化数据的查询获取和传染病非结构化数据的查询获取;其中:a、所述从已有的结构化数据库获取的传染病结构化数据的存储,包括以下步骤:⑴、在HBase非结构化数据库中,建立HBase传染病非结构化存储表;⑵、从已有的结构化数据库中,选取所有的传染病结构化数据;⑶、采用Thrift接口,调用该接口的Tput函数读取所有的传染病结构化数据,将所有的传染病结构化数据存储到HBase传染病非结构化存储表中;b、所述传染病非结构化数据的存储,包括以下步骤:⑴、建立传染病非结构化数据的存储文本;⑵、将传染病非结构化数据保存到已建立的传染病非结构化数据存储文本中;⑶、采用Thrift接口,调用该接口的Tput函数读取存储文本,将传染病非结构化数据以key, value形式存储在HBase 传染病非结构化存储表中;c、所述传染病结构化数据的查询获取,包括以下步骤:⑴、采用Thrift接口,向HBase传染病非结构化存储表发送查询传染病结构化数据的查询条件;⑵、Thrift接口调用Tget函数,查询HBase传染病非结构化存储表中与查询条件相符的传染病结构化数据并获取数据;⑶、建立存储文本,将步骤⑵获取数据存储到文本中;d、所述传染病非结构化数据的查询获取,包括以下步骤:⑴、采用Thrift接口,向HBase传染病非结构化存储表发送传染病非结构化数据的查询条件;⑵、调用Tget函数,查询HBase传染病非结构化存储表中与查询条件相符的传染病非结构化数据,并获取该数据;⑶、建立存储文本,把步骤⑵获取的数据存储到文本中;其中:所述传染病结构化数据为地区、年龄、性别、职业、病种、诊断医院和诊断科室的用户信息以及传染病的发病人数、死亡率、死亡人数和死亡率的疾病信息;所述传染病非结构化数据为B超视频流、CT视频流、医学影像图片、数字病历及医生开的医院诊断报告。
地址 200241 上海市闵行区东川路500号