发明名称 一种分布式的垂直切换和资源分配方法
摘要 本发明公开了一种分布式的垂直切换和资源分配方法,切换用户根据服务质量要求选择目的基站进行接入,目的基站根据网络效益对切换用户进行资源分配,特征是切换决策和资源分配以最大化时间维度上的全网收益为目标,综合根据基站状态、信道状态和移动设备的状态。本发明不需要集中式控制器,候选基站和移动终端经过简单地协调,可以在基站上进行资源分配,在移动终端商进行目的网络选择。本发明不局限于效用函数的具体定义,并且状态集合可以变化和扩展,具有极大的可扩展性和适应性。并且本发明不需要预先知道各个状态的收益值和状态转移概率,可以通过在线学的方式逐步获得,能够自动适应于复杂网络环境。
申请公布号 CN103209491B 申请公布日期 2016.04.20
申请号 CN201310133836.4 申请日期 2013.04.17
申请人 中国科学技术大学 发明人 方彬;范娟;张四海;周武旸;李磊
分类号 H04W72/04(2009.01)I;H04W36/08(2009.01)I 主分类号 H04W72/04(2009.01)I
代理机构 安徽省合肥新安专利代理有限责任公司 34101 代理人 汪祥虬
主权项 一种分布式的垂直切换和资源分配方法,切换用户根据服务质量要求选择目的基站进行接入,目的基站根据网络效益对切换用户进行资源分配,其特征在于:切换决策和资源分配以最大化时间维度上的全网收益为目标,综合根据基站状态、信道状态和移动设备的状态,按照以下五步进行切换决策和资源分配决策:第一步:基站初始化记基站m上的状态为S<sub>m</sub>,垂直切换决策和资源分配决策为动作A<sub>m</sub>;在每个基站上,保存两张查询表:基站在各个状态上的平均收益表<img file="FDA0000827773550000011.GIF" wi="198" he="71" />和状态转移概率表<img file="FDA0000827773550000012.GIF" wi="382" he="70" />在每个基站上保存一个表的更新次数值t<sub>m</sub>,并在初始化的时候设置更新次数值t<sub>m</sub>=0,对每一组的当前状态<img file="FDA0000827773550000013.GIF" wi="92" he="71" />转移状态<img file="FDA0000827773550000014.GIF" wi="62" he="70" />和动作<img file="FDA0000827773550000015.GIF" wi="87" he="69" />设定各个状态上初始收益值<img file="FDA0000827773550000016.GIF" wi="254" he="79" />和状态转移概率初始值<img file="FDA0000827773550000017.GIF" wi="406" he="79" />定义基站m上的状态S<sub>m</sub>=(X<sub>m</sub>,I<sub>c</sub>,θ<sub>m</sub>,G),其中X<sub>m</sub>是基站m上剩余的资源,包括带宽,功率,处理器处理资源,存储资源,I<sub>c</sub>为当前切换用户所在的基站,θ<sub>m</sub>为当前切换用户和基站m间的信道状态,G为当前业务的服务等级;定义基站m上的动作为A<sub>m</sub>=(s<sub>m</sub>,I(m=a)),其中s<sub>m</sub>表示基站m为切换用户分配的资源量,a表示切换中选择的目的基站的索引号;I(m=a)是一个指示函数,I(m=a)=0当m≠a,I(m=a)=1当m=a;当I(m=a)=0时必然有基站m为切换用户分配的资源满足s<sub>m</sub>=0,即基站m不会给没有选择它作为目的基站的用户分配资源;第二步:更新状态转移概率当有一个切换用户到达时,根据信噪比大于基本通信要求门限,确定可接入的候选基站集合;到达的切换用户利用其当前服务基站或者自身的多模接口,向每一个候选基站m汇报当前服务基站索引号I<sub>c</sub>、当前业务的服务等级G和到候选基站m的信道状态θ<sub>m</sub>;候选基站m收到切换用户的当前服务基站索引号I<sub>c</sub>、服务等级G和信道状态θ<sub>m</sub>后,和其当前的剩余资源X<sub>m</sub>一起组成了更新次数t<sub>m</sub>时更新的状态<img file="FDA0000827773550000018.GIF" wi="510" he="79" />然后根据下面的状态转移概率更新公式<math><![CDATA[<mrow><msubsup><mi>P</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>&lsqb;</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>|</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>A</mi><mi>m</mi><mi>i</mi></msubsup><mo>&rsqb;</mo><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub></msub><mo>)</mo></mrow><msubsup><mi>P</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mo>&lsqb;</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>|</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>A</mi><mi>m</mi><mi>i</mi></msubsup><mo>&rsqb;</mo><mo>+</mo><msub><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub></msub><mo>&CenterDot;</mo><mi>I</mi><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>=</mo><msubsup><mi>S</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827773550000019.GIF" wi="1214" he="87" /></maths>更新状态转移概率,其中临时变量i和j分别是当前状态和转移状态的编号;<img file="FDA00008277735500000110.GIF" wi="60" he="76" />是更新尺寸序列,满足下面条件<math><![CDATA[<mrow><munderover><mo>&Sigma;</mo><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>=</mo><mn>0</mn></mrow><mrow><mo>+</mo><mi>&infin;</mi></mrow></munderover><msub><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub></msub><mo>=</mo><mi>&infin;</mi><mo>,</mo><munder><mi>lim</mi><mrow><mi>t</mi><mo>&RightArrow;</mo><mi>&infin;</mi></mrow></munder><msub><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub></msub><mo>=</mo><mn>0</mn><mo>,</mo><munder><mi>lim</mi><mrow><mi>t</mi><mo>&RightArrow;</mo><mi>&infin;</mi></mrow></munder><munderover><mo>&Sigma;</mo><msub><mi>t</mi><mi>m</mi></msub><mi>&infin;</mi></munderover><msubsup><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub><mn>2</mn></msubsup><mo>&lt;</mo><mi>&infin;</mi><mo>;</mo></mrow>]]></math><img file="FDA00008277735500000111.GIF" wi="862" he="142" /></maths>对更新次数t<sub>m</sub>进行更新t<sub>m</sub>=t<sub>m</sub>+1;第三步:资源预分配对每一个候选基站m,执行以下操作;设定候选基站m上的效用函数为<img file="FDA0000827773550000021.GIF" wi="247" he="70" />设当前切换用户切入到基站m,则基站m在处于状态<img file="FDA0000827773550000022.GIF" wi="60" he="71" />时分配给该用户的资源<img file="FDA0000827773550000023.GIF" wi="60" he="71" />应该满足下面的最优资源分配等式<math><![CDATA[<mrow><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>=</mo><mi>arg</mi><mrow><mo>(</mo><mi>m</mi><mi>a</mi><mi>x</mi><mo>{</mo><msub><mi>h</mi><mi>m</mi></msub><mo>(</mo><mrow><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mrow><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo></mrow><mo>=</mo><mn>1</mn></mrow><mo>)</mo><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mo>{</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>}</mo></mrow></munder><msubsup><mi>P</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mo>&lsqb;</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>|</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>1</mn><mo>&rsqb;</mo><msubsup><mi>u</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>)</mo></mrow><mo>}</mo><mo>)</mo></mrow>]]></math><img file="FDA0000827773550000024.GIF" wi="1701" he="127" /></maths>计算接收切换用户与不接受切换用户的时间维度的期望收益分别为:<math><![CDATA[<mrow><msub><mi>v</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827773550000025.GIF" wi="422" he="71" /></maths>和<math><![CDATA[<mrow><msub><mi>v</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>0</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000827773550000026.GIF" wi="462" he="71" /></maths>其表达式分别为:<math><![CDATA[<mrow><msub><mi>v</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><msub><mi>h</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><mi>&beta;</mi><munder><mo>&Sigma;</mo><mrow><mo>{</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>}</mo></mrow></munder><msubsup><mi>P</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mo>&lsqb;</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>|</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>1</mn><mo>&rsqb;</mo><msubsup><mi>u</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827773550000027.GIF" wi="1870" he="120" /></maths><math><![CDATA[<mrow><msub><mi>v</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>0</mn><mo>)</mo></mrow><mo>=</mo><msub><mi>h</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>=</mo><mn>0</mn><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>0</mn><mo>)</mo></mrow><mo>+</mo><mi>&beta;</mi><munder><mo>&Sigma;</mo><mrow><mo>{</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>}</mo></mrow></munder><msubsup><mi>P</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mo>&lsqb;</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>|</mo><msubsup><mi>S</mi><mi>m</mi><mi>i</mi></msubsup><mo>,</mo><msubsup><mi>s</mi><mi>m</mi><mi>i</mi></msubsup><mo>=</mo><mn>0</mn><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><msup><mi>a</mi><mi>i</mi></msup></mrow><mo>)</mo><mo>=</mo><mn>0</mn><mo>&rsqb;</mo><msubsup><mi>u</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><mi>j</mi></msubsup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827773550000028.GIF" wi="1878" he="114" /></maths>其中β为折扣因子,且满足0<β≤1;第四步:切换目的网络选择每一个候选基站m将计算出的接收切换用户的时间维度收益的期望<img file="FDA00008277735500000213.GIF" wi="429" he="71" />和不接收切换用户时间维度收益的期望<img file="FDA00008277735500000214.GIF" wi="439" he="71" />传输给当前切换用户;切换用户为每一个基站m按照下面的全网收益期望计算公式计算当接入基站m时全网预计收益值<math><![CDATA[<mrow><msub><mi>bid</mi><mi>m</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>k</mi><mo>&NotEqual;</mo><mi>m</mi></mrow><mi>M</mi></munderover><msub><mi>v</mi><mi>k</mi></msub><mrow><mo>(</mo><msub><mi>S</mi><mi>k</mi></msub><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>k</mi><mo>=</mo><mi>a</mi></mrow><mo>)</mo><mo>=</mo><mn>0</mn><mo>)</mo></mrow><mo>+</mo><msub><mi>v</mi><mi>m</mi></msub><mrow><mo>(</mo><msub><mi>S</mi><mi>m</mi></msub><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><mi>a</mi></mrow><mo>)</mo><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000827773550000029.GIF" wi="1117" he="149" /></maths>其中M为候选基站的个数;目的基站a满足下面的最大化全网收益等式<math><![CDATA[<mrow><mi>a</mi><mo>=</mo><mi>arg</mi><mrow><mo>(</mo><munder><mrow><mi>m</mi><mi>a</mi><mi>x</mi></mrow><mi>m</mi></munder><mo>{</mo><msub><mi>bid</mi><mi>m</mi></msub><mo>}</mo><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA00008277735500000210.GIF" wi="428" he="87" /></maths>然后切换用户将目的基站选择结果告知所有候选基站;第五步:状态收益值的更新各个基站得到切换结果后,计算当前状态时间维度收益期望<math><![CDATA[<mrow><msub><mi>u</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>)</mo></mrow><mo>=</mo><msub><mi>v</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>,</mo><mi>I</mi><mo>(</mo><mrow><mi>m</mi><mo>=</mo><mi>a</mi></mrow><mo>)</mo><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA00008277735500000211.GIF" wi="574" he="71" /></maths>按下面的状态上收益期望更新公式进行对当前状态的时间维度收益值期望进行更新<math><![CDATA[<mrow><msubsup><mi>u</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub></msub><mo>)</mo></mrow><msubsup><mi>u</mi><mi>m</mi><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>)</mo></mrow><mo>+</mo><msub><mi>&delta;</mi><msub><mi>t</mi><mi>m</mi></msub></msub><mo>&CenterDot;</mo><msub><mi>u</mi><mi>m</mi></msub><mrow><mo>(</mo><msubsup><mi>S</mi><mi>m</mi><msub><mi>t</mi><mi>m</mi></msub></msubsup><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA00008277735500000212.GIF" wi="862" he="86" /></maths>当有新的切换用户到达时,按照第二步到第五步进行网络选择和资源分配。
地址 230026 安徽省合肥市包河区金寨路96号