发明名称 基于MapReduce并行计算模型的XML文件处理方法和装置
摘要 本发明提供一种基于MapReduce并行计算模型的XML文件处理方法和装置,方法包括:设置split值和配置信息,获取待处理的目标XML文件,根据预先设置的split值,获取所述目标XML文件的各个预分切位置,根据预先设置的配置信息,对获取的各个预分切位置进行校正,根据校正后的各个预切分位置,对所述目标XML文件分切为两个以上的数据块,将各个数据块发送给MapReduce并行计算模型,以使MapReduce并行计算模型分别为各个数据块分配处理设备,以对各个数据块进行写入。根据上述方案提高了MapReduce并行计算模型对XML文件的处理效率。
申请公布号 CN104598562A 申请公布日期 2015.05.06
申请号 CN201510009477.0 申请日期 2015.01.08
申请人 浪潮软件股份有限公司 发明人 徐正礼;周正德;魏金雷
分类号 G06F17/30(2006.01)I;G06F9/46(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南信达专利事务所有限公司 37100 代理人 李世喆
主权项 一种基于MapReduce并行计算模型的XML文件处理方法,其特征在于,设置split值和配置信息,包括:获取待处理的目标XML文件;根据预先设置的split值,获取所述目标XML文件的各个预分切位置;根据预先设置的配置信息,对获取的各个预分切位置进行校正;根据校正后的各个预切分位置,对所述目标XML文件分切为两个以上的数据块;将各个数据块发送给MapReduce并行计算模型,以使MapReduce并行计算模型分别为各个数据块分配处理设备,以对各个数据块进行写入。
地址 250100 山东省济南市高新区浪潮路1036号