发明名称 基于流水线架构的海量文件指导型预取并行处理加速方法
摘要 本发明公开了一种基于流水线架构的海量文件指导型预取并行处理加速方法,该加速方法包括应用程序依据海量文件的预取信息,使用进程从外部存储器提取预取文件到内存缓冲区的步骤;进程对预取文件进行分阶段计算的步骤;进程对并行处理结果进行输出的步骤。本发明的加速方法基于流水线架构,采用指导型预取对海量文件进行提前处理,并且将海量文件的计算过程分为多个阶段,使其在多个阶段并行进行,提高了系统的执行效率。在数据预取阶段,本发明采用了指导型预取,将海量文件的预取行为置于应用程序的控制之下,使其更准确、更有预见性地进行预取,从而提高了海量文件预取和处理的效率。
申请公布号 CN103268219B 申请公布日期 2016.05.11
申请号 CN201310202556.4 申请日期 2013.05.28
申请人 北京航空航天大学 发明人 刘轶;刘弢;师明;王庆全;高飞
分类号 G06F9/38(2006.01)I 主分类号 G06F9/38(2006.01)I
代理机构 北京永创新实专利事务所 11121 代理人 李有浩
主权项 一种基于流水线架构的海量文件指导型预取并行处理加速方法,所述海量文件指导型预取并行处理加速方法的步骤有:第一步骤:预取阶段,应用程序依据海量文件的预取信息,使用进程从外部存储系统提取预取文件到内存缓冲区的步骤;第二步骤:处理阶段,进程对预取文件进行分阶段计算的步骤;第三步骤:结果输出阶段,进程对并行处理结果进行输出的步骤;其特征在于:上述三个步骤均是对海量文件的进程分为多个阶段进行并行处理;在第一步骤的预取阶段中,采用指导型预取;在第二步骤的处理阶段中,把海量文件的处理分成多个子处理阶段,所述处理阶段由子阶段1、子阶段2和子阶段3三个子处理阶段组成;每个子处理阶段将各自的处理结果交由下一个子处理阶段进行处理;每个子阶段以流水线的形式并行处理;在海量文件的并行处理中,以并行总时间为横坐标,纵坐标为流水段建立平面坐标系;且海量文件指导型预取并行处理的加速比<img file="FDA0000871539900000011.GIF" wi="183" he="136" />不小于1,T<sub>并总</sub>表示并行总时间,T<sub>串总</sub>表示串行总时间;对预取文件进行处理时,根据预取信息对预取文件进行不同的阶段使用不同的进程的处理为:第一个预取文件mf<sub>1</sub>顺次经预取阶段<img file="FDA0000871539900000012.GIF" wi="111" he="86" />第一子计算阶段<img file="FDA0000871539900000013.GIF" wi="127" he="87" />第二子计算阶段<img file="FDA0000871539900000014.GIF" wi="125" he="90" />……、最后子计算阶段<img file="FDA0000871539900000015.GIF" wi="119" he="84" />输出阶段<img file="FDA0000871539900000016.GIF" wi="127" he="86" />处理第一个预取文件mf<sub>1</sub>的时间记为<img file="FDA0000871539900000017.GIF" wi="111" he="82" />第二个预取文件mf<sub>2</sub>顺次经预取阶段<img file="FDA0000871539900000018.GIF" wi="114" he="79" />第一子计算阶段<img file="FDA0000871539900000019.GIF" wi="126" he="89" />第二子计算阶段<img file="FDA00008715399000000110.GIF" wi="126" he="90" />……、最后子计算阶段<img file="FDA00008715399000000111.GIF" wi="127" he="86" />输出阶段<img file="FDA00008715399000000112.GIF" wi="129" he="87" />处理第二个预取文件mf<sub>2</sub>的时间记为<img file="FDA00008715399000000113.GIF" wi="118" he="79" />第n个预取文件mf<sub>n</sub>顺次经预取阶段<img file="FDA00008715399000000114.GIF" wi="119" he="86" />第一子计算阶段<img file="FDA00008715399000000115.GIF" wi="127" he="89" />第二子计算阶段<img file="FDA00008715399000000116.GIF" wi="126" he="88" />……、最后子计算阶段<img file="FDA00008715399000000117.GIF" wi="127" he="86" />输出阶段<img file="FDA00008715399000000118.GIF" wi="132" he="86" />处理第n个预取文件mf<sub>n</sub>的时间记为<img file="FDA00008715399000000119.GIF" wi="117" he="86" />在并行处理时,对文件的并行总时间记为T<sub>并总</sub>,且<img file="FDA0000871539900000021.GIF" wi="639" he="87" />
地址 100191 北京市海淀区学院路37号