发明名称 集中式数据中心数据冗余消除方法
摘要 一种集中式数据中心数据冗余消除方法,在现有的数据中心网络体系结构的中间节点中增加缓存;中间节点缓存数据中心服务器间发送的数据;数据中心集中模块通过对数据中心传输数据进行统计,估计在不同的时间发送的数据的期望;数据中心集中模块对数据缓存进行调度,使得不同的数据缓存到不同的中间节点,从而最大化缓存的效用;数据中心服务器发送数据时,根据中间节点中的缓存情况对数据进行压缩编码;中间节点对压缩编码进行解码,本发明不仅能够消除相同服务器发送的数据的冗余,同时不同服务器发送的数据之间的冗余也能得到消除,同时始终选择缓存效用最大的中间节点作为缓存数据中间节点,从而达到更高的冗余消除效果。
申请公布号 CN102546817A 申请公布日期 2012.07.04
申请号 CN201210023246.1 申请日期 2012.02.02
申请人 清华大学 发明人 崔勇;廖春鹏;王弘毅
分类号 H04L29/08(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 西安智大知识产权代理事务所 61215 代理人 贾玉健
主权项 1.集中式数据中心数据冗余消除方法,源服务器将数据通过中间节点发送至目标服务器,在所述中间节点增加缓存,传输数据时中间节点缓存已经传输的数据,从而在相同数据再次发送的时候可以先进行压缩编码,然后发送,在中间节点进行解码转发,完成数据传输,其特征在于,在源服务器、中间节点以及目标服务器组成的数据中心网络中,布置一个集中调度模块,利用该模块获取服务器之间传输的数据以及中间节点中缓存的数据,对于数据d<sub>i</sub>,缓存到不同的中间节点带来的缓存效用不同,选用缓存效用最大的中间节点作为其待缓存节点;其中,缓存效用<img file="FDA0000133676850000011.GIF" wi="715" he="105" />u(j,j,k)为冗余消除的效用,其计算方法如下:在数据中心网络中,需要发送的数据的集合为{d<sub>1</sub>,d<sub>2</sub>,......,d<sub>M</sub>),中间节点的集合为R={r<sub>1</sub>,r<sub>2</sub>,......,r<sub>|R|</sub>),路径集合为{p<sub>1</sub>,p<sub>2</sub>,......,p<sub>|P|</sub>),e<sub>ij</sub>为数据d<sub>i</sub>在路径p<sub>j</sub>的传输次数的期望,如果在中间节点r<sub>k</sub>中缓存了数据d<sub>i</sub>,并且中间节点r<sub>k</sub>对数据d<sub>i</sub>的压缩编码d′<sub>i</sub>进行解码,则冗余消除的效用<img file="FDA0000133676850000012.GIF" wi="865" he="84" />其中<img file="FDA0000133676850000013.GIF" wi="103" he="83" />是路径p<sub>j</sub>的源节点到中间节点r<sub>k</sub>的跳数;当前中间节点r<sub>k</sub>每缓存一个数据d<sub>i</sub>,其剩余缓存容量减1,如果其剩余缓存容量为0,则计算尚未被缓存数据的缓存效用时,跳过当前中间节点r<sub>k</sub>;直至所有的数据被缓存完毕,或者所有的中间节点的剩余缓存容量都为0,调度结束。
地址 100084 北京市海淀区100084信箱82分箱清华大学专利办公室