发明名称 基于内存映射的大数据文件快速并行提取方法
摘要 本发明公开了一种基于内存映射的大数据文件快速并行提取方法,包括:任务域生成,将任务块组成任务域,所述任务块为任务域中的元素;任务池生成,将所述任务域中的元素按低通信代价的原则进行子任务域归并,将所述任务域中的元素的集合作为任务调度的任务池,根据调度的选择来提取任务供处理器执行;任务调度,根据任务的剩余量决策任务的调度粒度,将符合要求的任务提取出所述任务池,并为映射做好准备;处理器映射,将所述提取出的任务映射到当前空闲处理器去执行。本发明能够发挥多核的优势,提高内存映射文件的效率,可以应用在单个文件在4GB以下容量的大文件读取中,能够有效提高这类文件的读取速度,提高磁盘文件I/O吞吐率。
申请公布号 CN102231121A 申请公布日期 2011.11.02
申请号 CN201110209643.3 申请日期 2011.07.25
申请人 北方工业大学 发明人 马礼;李敬哲;杜春来;马东超
分类号 G06F9/46(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F9/46(2006.01)I
代理机构 北京康盛知识产权代理有限公司 11331 代理人 张良
主权项 一种基于内存映射的大数据文件快速并行提取方法,包括:任务域生成;将任务块组成任务域,所述任务块为任务域中的元素;任务池生成;将所述任务域中的元素按低通信代价的原则进行子任务域归并,将所述任务域中的元素的集合作为任务调度的任务池,根据调度的选择来提取任务供处理器执行;任务调度;根据任务的剩余量决策任务的调度粒度,将符合要求的任务提取出所述任务池,并为映射做好准备;处理器映射;将所述提取出的任务映射到当前空闲处理器去执行。
地址 100041 北京市石景山区晋元庄路5号