发明名称 用于容迟网络的路由决策方法
摘要 本发明公开了一种用于容迟网络的路由决策方法,主要解决现有技术未能充分利用网络节点运动规律及链路历史信息进行路由选择的缺陷。其具体过程为:(1)对时变链路容量函数离散化,构造描述网络拓扑变化的三维矩阵;(2)对链路容量进行二值量化,得到每条链路的齐次马尔科夫模型;(3)利用节点运动规律及链路历史信息,估计链路的连通与断开状态到达率;(4)根据得到的链路连通状与断开状态的到达率,计算任意时刻链路连通概率;(5)将容迟网络的路由决策过程定义为阶段有限的马尔科夫决策模型。(6)根据马尔科夫决策理论,定义全局最优方程,并采用后向迭代递归算法计算最优决策序列。本发明能够满足延时较大的容迟网络需求,为其选定最优路由决策序列。
申请公布号 CN102006237A 申请公布日期 2011.04.06
申请号 CN201010585504.6 申请日期 2010.12.13
申请人 西安电子科技大学 发明人 张文柱;孙发勇;赵贝;韩晓冬;刘伟;李红艳;赫佳星;翁珠恩;邵丽娜
分类号 H04L12/56(2006.01)I 主分类号 H04L12/56(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 1.一种用于容迟网络的路由决策方法,包括如下过程:(1)以离散化的链路连通特性描述网络拓扑状况:(1a)在观测时间段内,以给定的采样间隔Δ和平滑步长,将任意网络节点i和j间的时变链路容量函数c<sub>ij</sub>(t)离散化,得到离散序列c<sub>ij</sub>(t<sub>0</sub>+aΔ);(1b)各节点将采样所得离散序列传遍全网,使各节点整合出一个以离散的形式表征的三维矩阵:A={c<sub>ij</sub>(t<sub>0</sub>+aΔ)<sub>|V|×|V|×K</sub>,其中,V、E分别表示所考虑网络内的节点和边,|V|、|E|分别表示节点和边的数目;i,j=0,1,L,|V|-1;t为网络运行时间,t<sub>0</sub>为时间统计起点,a为采样的时间序列,a=0,1,L K,K为采样序列最大值;(2)根据已得到的三维矩阵A,采用二值量化表示链路容量,每条链路得到如下齐次马尔科夫模型为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>c</mi><mi>ij</mi></msub><mrow><mo>(</mo><msub><mi>t</mi><mn>0</mn></msub><mo>+</mo><mi>a&Delta;</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>该模型体现了各链路容量为一个在“0”和“1”状态间转移的马尔科夫过程;式中,“0”表示链路连通,“1”表示断开;(3)根据已得到的马尔科夫模型,以网络中各节点运动规律及统计得到的链路历史信息作为参考,利用随机过程参数估计方法,估计出各链路的连通状态与断开状态的到达率μ和λ;(4)根据估计所得的连通与断开状态到达率μ、λ及Kolmogorov方程,得到如下微分方程组为:<maths num="0002"><![CDATA[<math><mrow><mfenced open='{' close=''><mtable><mtr><mtd><msub><msup><mi>P</mi><mo>&prime;</mo></msup><mn>0</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mi>&lambda;</mi><msub><mi>P</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><mi>&mu;</mi><msub><mi>P</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><msub><msup><mi>P</mi><mo>&prime;</mo></msup><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>&lambda;</mi><msub><mi>P</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>-</mo><mi>&mu;</mi><msub><mi>P</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>求解以上微分方程组得:<maths num="0003"><![CDATA[<math><mrow><msub><mi>P</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mi>&mu;</mi><mrow><mi>&lambda;</mi><mo>+</mo><mi>&mu;</mi></mrow></mfrac><mo>+</mo><mfrac><mi>&lambda;</mi><mrow><mi>&lambda;</mi><mo>+</mo><mi>&mu;</mi></mrow></mfrac><msup><mi>e</mi><mrow><mo>-</mo><mrow><mo>(</mo><mi>&lambda;</mi><mo>+</mo><mi>&mu;</mi><mo>)</mo></mrow><mi>t</mi></mrow></msup><mo>,</mo></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><msub><mi>P</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mi>&lambda;</mi><mrow><mi>&lambda;</mi><mo>+</mo><mi>&mu;</mi></mrow></mfrac><mo>+</mo><mfrac><mi>&mu;</mi><mrow><mi>&lambda;</mi><mo>+</mo><mi>&mu;</mi></mrow></mfrac><msup><mi>e</mi><mrow><mo>-</mo><mrow><mo>(</mo><mi>&lambda;</mi><mo>+</mo><mi>&mu;</mi><mo>)</mo></mrow><mi>t</mi></mrow></msup><mo>;</mo></mrow></math>]]></maths>上式中,P<sub>0</sub>(t)、P<sub>1</sub>(t)分别表示在t时刻0状态与1状态的稳态概率,P′<sub>0</sub>(t)、P′<sub>1</sub>(t)分别表示在t时刻0状态和1状态的转出概率;(5)根据得到的各链路马尔科夫状态模型,将容迟网络的路由决策过程定义为一个阶段有限的离散时间决策的马尔科夫决策模型:{T,S,A(i),p(j′|i,e<sub>ij</sub>),r(i,e<sub>ij</sub>)},其中:T表示决策时刻,T={0,1,L,|V|-1},|V|-1表示路由跳数的最大允许值,即最多允许跳过除源节点之外的所有其它节点;S表示可能的状态,S=V,即一个节点表示一个状态;A(i)表示可能的行动集,A(i)=e<sub>ij</sub>,e<sub>ij</sub>∈E,i,j表示网络节点,e<sub>ij</sub>表示连接网络节点i和节点j的边;P<sub>t</sub>(j′|i,e<sub>ij</sub>)表示转移概率,<img file="FDA0000037915000000023.GIF" wi="817" he="149" />该式表示,i节点在t时刻采用行动e<sub>ij</sub>到达节点j′的概率,p(e<sub>ij</sub>)表示链路e<sub>ij</sub>的连通概率,p(e<sub>ij</sub>)=P<sub>0</sub>(t),i,j,j′∈S,e<sub>ij</sub>∈E,t∈[0,|V|-1];r<sub>t</sub>(i,e<sub>ij</sub>)表示报偿值,<img file="FDA0000037915000000024.GIF" wi="733" he="138" />该式表示,i节点在t时刻采用行动e<sub>ij</sub>所得到的,其中,c<sub>ij</sub>(t)是链路e<sub>ij</sub>在t时刻的链路容量,i,j∈S,e<sub>ij</sub>∈E,t∈T,N为结束时刻,N∈[0,|V|-1];(6)根据已建立的马尔科夫决策模型以及马尔科夫决策理论,定义全局最优方程如下:<img file="FDA0000037915000000025.GIF" wi="1414" he="225" />该式中,u<sub>t</sub>(h<sub>t</sub>)为t时刻的最优值;r<sub>t</sub>(i,e<sub>ij</sub>)为t时刻i状态采用行动e<sub>ij</sub>的报偿值;p<sub>t</sub>(j|i,e<sub>ij</sub>)为t时刻i状态采用行动e<sub>ij</sub>转移到j的概率;h<sub>t</sub>为t时刻前的轨迹向量,包括之前所经历的状态及所采取的行动;(7)根据马尔科夫决策理论中,有限阶段模型的最优策略求解过程,在已知初始状态和终止状态的情况下,采用后向迭代递归算法计算所述全局优化方程,得到一组连接初始状态和终止状态的最优决策序列。
地址 710071 陕西省西安市太白南路2号