发明名称 数据网格中一种优化的副本分布方法
摘要 本发明主要设计数据网格中一种优化的副本分布方法,属于网格计算(Grid)领域,具体涉及网格系统,尤其是数据网格系统中副本的分布问题。本发明给出了数据网络中一种分布式动态自适应的副本分布方法,以降低资源请求方的访问代价为主要目的,通过资源的响应时间计算副本数量;综合考虑节点的负载率、节点性能,以及实时带宽等因素确定合适的副本放置地点,使副本分布能够动态地适应访问请求的变化和网络通讯状况。与现有单纯追求副本数量来提高数据访问性能的方法相比,本发明从系统全局角度评估副本数量和最佳的副本放置地点,能够有效平衡副本数量和副本维护开销之间的关系。该方法不仅适用于只读资源的数据网格系统,尤其适用于拥有可读写数据资源的数据网格系统。
申请公布号 CN101751309B 申请公布日期 2011.06.29
申请号 CN200910265421.6 申请日期 2009.12.28
申请人 北京理工大学 发明人 孙新;郑军;高春晓
分类号 G06F11/14(2006.01)I;G06F17/30(2006.01)I;H04L12/24(2006.01)I;H04L12/26(2006.01)I 主分类号 G06F11/14(2006.01)I
代理机构 代理人
主权项 1.一种优化的数据网格中副本分布方法,其特征在于:针对具有超级节点的数据网格系统,首先由超级节点P对自己管理的所有资源进行实时监控,当需要为资源LR<sub>j</sub>创建副本时,超级节点P统计单位时间间隔内资源LR<sub>j</sub>的访问情况,计算整个系统内资源LR<sub>j</sub>的平均响应时间以及每个域内所有节点访问资源LR<sub>j</sub>的平均响应时间,具体采用计算公式<img file="FSB00000480958000011.GIF" wi="371" he="231" />计算整个系统内资源LR<sub>j</sub>的平均响应时间ART<sub>j</sub>,其中Time<sub>j</sub>表示单位时间间隔内资源LR<sub>j</sub>所有副本被访问的次数,RT<sub>k</sub>表示单位时间间隔内第k次访问资源LR<sub>j</sub>副本的响应时间;采用计算公式<img file="FSB00000480958000012.GIF" wi="539" he="206" />计算域D<sub>k</sub>内节点访问资源LR<sub>j</sub>的平均响应时间<img file="FSB00000480958000013.GIF" wi="227" he="72" />其中RT<sub>j,i</sub>是域D<sub>k</sub>内节点P<sub>i</sub>访问资源LR<sub>j</sub>的响应时间,<img file="FSB00000480958000014.GIF" wi="184" he="71" />是单位时间内域D<sub>k</sub>内所有节点访问数据资源LR<sub>j</sub>的次数;如果某个域D<sub>k</sub>内节点访问资源LR<sub>j</sub>的平均响应时间<img file="FSB00000480958000015.GIF" wi="198" he="71" />大于整个系统内资源LR<sub>j</sub>的平均响应时间ART<sub>j</sub>,则说明资源LR<sub>j</sub>在域D<sub>k</sub>内的副本数量过少,需要在域D<sub>k</sub>内创建副本,其中,0≤j<n,n是整个数据网格系统内资源的个数;k=0,1,...,m,m是数据网格系统内域的个数,i=0,1,...,t,t为域D<sub>k</sub>内节点的个数;其次,在需要创建副本的域D<sub>k</sub>内,如果单位时间里域D<sub>k</sub>中的节点访问资源LR<sub>j</sub>的副本数目记做count,则域D<sub>k</sub>需要新增副本的数量<img file="FSB00000480958000016.GIF" wi="632" he="161" />其中,T<sub>avg</sub>表示域D<sub>k</sub>内节点访问资源LR<sub>j</sub>的平均访问时间,T<sub>low</sub>表示域D<sub>k</sub>内节点访问资源LR<sub>j</sub>的最小访问时间;然后,由需要创建副本的D<sub>k</sub>的域超级节点负责确定适合的副本放置地点;域D<sub>k</sub>内没有资源LR<sub>j</sub>副本的节点属于待选节点,域超级节点计算每个待选节点P<sub>i</sub>的复制因子<img file="FSB00000480958000021.GIF" wi="541" he="117" />其中Memory<sub>i</sub>是节点P<sub>i</sub>的可用内存,filesize是资源LR<sub>j</sub>所占空间的大小,AvgBW<sub>i</sub>是节点P<sub>i</sub>的平均可用带宽,节点的复制因子值越大,说明该节点越适合放置该副本,选择Δcount个具有最大复制因子的节点作为适合放置副本的最佳节点;最后,在所确定的适合放置副本的最佳节点创建副本。
地址 100081 北京市海淀区中关村南大街5号