发明名称 |
基于HBase的数据导入方法和系统 |
摘要 |
一种基于HBase的数据导入方法,包括以下步骤:文件名提取线程提取文件压缩池中新上报文件的文件名,将提取的文件名存放到无读写锁的队列;文件处理线程从无读写锁的队列中获取文件名,从所述文件压缩池中提取文件名对应的文件,读取文件为文件流;文件处理线程将文件流中的行数据转换为json对象;文件处理线程根据json对象构造HBase的Row对象;存储线程将构造的Row对象导入HBase中。上述基于HBase的数据导入方法,通过无读写锁队列以及多线程并发处理机制,可提高将数据导入HBase的速度。此外,还提供一种基于HBase的数据导入系统。 |
申请公布号 |
CN104778182A |
申请公布日期 |
2015.07.15 |
申请号 |
CN201410016490.4 |
申请日期 |
2014.01.14 |
申请人 |
博雅网络游戏开发(深圳)有限公司 |
发明人 |
郑壮杰 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州华进联合专利商标代理有限公司 44224 |
代理人 |
何平 |
主权项 |
一种基于HBase的数据导入方法,包括以下步骤:文件名提取线程提取文件压缩池中新上报文件的文件名,将提取的文件名存放到无读写锁的队列;文件处理线程从无读写锁的队列中获取文件名,从所述文件压缩池中提取文件名对应的文件,读取文件为文件流;文件处理线程将文件流中的行数据转换为json对象;文件处理线程根据json对象构造HBase的Row对象;存储线程将构造的Row对象导入HBase中。 |
地址 |
518057 广东省深圳市南山区中山园路1001号TCL产业园国际E城D3栋9B-C |