发明名称 |
基于MapReduce并行计算模型的XML文件处理方法和装置 |
摘要 |
本发明提供一种基于MapReduce并行计算模型的XML文件处理方法和装置,方法包括:设置split值和配置信息,获取待处理的目标XML文件,根据预先设置的split值,获取所述目标XML文件的各个预分切位置,根据预先设置的配置信息,对获取的各个预分切位置进行校正,根据校正后的各个预切分位置,对所述目标XML文件分切为两个以上的数据块,将各个数据块发送给MapReduce并行计算模型,以使MapReduce并行计算模型分别为各个数据块分配处理设备,以对各个数据块进行写入。根据上述方案提高了MapReduce并行计算模型对XML文件的处理效率。 |
申请公布号 |
CN104598562A |
申请公布日期 |
2015.05.06 |
申请号 |
CN201510009477.0 |
申请日期 |
2015.01.08 |
申请人 |
浪潮软件股份有限公司 |
发明人 |
徐正礼;周正德;魏金雷 |
分类号 |
G06F17/30(2006.01)I;G06F9/46(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
济南信达专利事务所有限公司 37100 |
代理人 |
李世喆 |
主权项 |
一种基于MapReduce并行计算模型的XML文件处理方法,其特征在于,设置split值和配置信息,包括:获取待处理的目标XML文件;根据预先设置的split值,获取所述目标XML文件的各个预分切位置;根据预先设置的配置信息,对获取的各个预分切位置进行校正;根据校正后的各个预切分位置,对所述目标XML文件分切为两个以上的数据块;将各个数据块发送给MapReduce并行计算模型,以使MapReduce并行计算模型分别为各个数据块分配处理设备,以对各个数据块进行写入。 |
地址 |
250100 山东省济南市高新区浪潮路1036号 |