发明名称 实现邻区列表和负载均衡联合优化的系统
摘要 本发明公开了一种实现邻区列表和负载均衡联合优化的系统,所述系统包括:负载监测模块,用于对服务小区和邻区的负载状态进行周期性监测,并交互负载状态;邻区信号统计模块,用于统计服务小区中终端测量的邻区的信号质量;邻区列表建立模块,用于依据服务小区和邻区各自的负载状态及统计的信号质量建立邻区列表,并发送邻区列表给参数调整模块;参数调整模块,用于根据所述邻区列表动态调整切换参数,以进行切换,并将调整后的参数反馈给负载检测模块和邻区信号统计模块。本发明的邻区列表兼顾信号强度和小区负载,根据该邻区列表进行切换参数调整,并按切换参数对用户进行小区切换,相对于现有的切换方式更合理。
申请公布号 CN102905307B 申请公布日期 2014.12.31
申请号 CN201210337833.8 申请日期 2012.09.12
申请人 北京邮电大学 发明人 滕颖蕾;宋梅;王景尧;秦文聪;王莉;张勇;张羽;牟善文;邢益海
分类号 H04W24/10(2009.01)I;H04W28/08(2009.01)I;H04W36/00(2009.01)I;H04W36/30(2009.01)I 主分类号 H04W24/10(2009.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种实现邻区列表和负载均衡联合优化的系统,其特征在于,所述系统包括:负载监测模块,用于对服务小区和邻区的负载状态进行周期性监测,并交互负载状态;邻区信号统计模块,用于统计服务小区中终端测量的邻区的信号质量;邻区列表建立模块,用于依据服务小区和邻区各自的负载状态及统计的信号质量建立邻区列表,并发送邻区列表给参数调整模块;参数调整模块,用于根据所述邻区列表动态调整切换参数,以进行切换,并将调整后的参数反馈给负载检测模块和邻区信号统计模块;所述切换参数为指A3事件触发条件中的小区偏置H:Mn&gt;Mp+H其中Mn是邻区信号强度;Mp是服务小区信号强度;H是小区偏置;其中,所述负载监测模块中负载状态的计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>l</mi><mi>s</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>T</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></munderover><mi>l</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mi>T</mi><mo>+</mo><mi>k</mi><mo>&CenterDot;</mo><mfrac><mi>T</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></mfrac><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000560931640000011.GIF" wi="563" he="136" /></maths>其中,l<sub>s</sub>(t)为小区负载指示器在(t-T,t)的时间间隔内对负载n次抽样并求平均值,T为监测周期;其中,所述邻区列表建立模块建立邻区列表的过程为:按照预设的负载优先级的大小对邻区做优先级排序;计算邻区信号强度的优先级,按照信号强度优先级顺序对相同负载的邻区再排序;其中,所述邻区信号强度优先级的计算方法为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>p</mi><mi>i</mi></msub><mo>=</mo><mfrac><msub><mi>m</mi><mi>i</mi></msub><mrow><munder><mi>&Sigma;</mi><mi>j</mi></munder><msub><mi>m</mi><mi>j</mi></msub></mrow></mfrac></mrow>]]></math><img file="FDA0000560931640000021.GIF" wi="238" he="170" /></maths>其中,m<sub>i</sub>是邻区i的A3事件测量报告数量,m<sub>j</sub>是邻区j的A3事件报告数量;其中,所述参数调整模块参数调整的过程为:初始化Q(s,a),设定折扣因子γ和初始学习率α,以及动作选择算法中的初始探索概率ε,Q(s,a)为强化学习函数;获取当前状态s,s∈S,系统状态空间S:{vh,h,m,l,vl}vh,h,m,l,vl表示负载由高到低的5个等级;选择执行的动作a,a∈A,可选动作集A:{‑Δ,‑2Δ,+Δ,+2Δ},Δ是参数H的单位调整步长,以Δ为基本单位,根据此状态的动作函数值Q<sub>t</sub>(s,a),采用ε贪婪算法,从动作集中选择动作a并执行,具体以概率(1-ε)选择Q<sub>t</sub>(s,a)值最大的动作,而以探索概率ε选择其它任一个动作;获取回报r和下一时刻的状态s',根据动作执行结果按照r(t)=(F<sup>*</sup>‑F)+α(D<sup>*</sup>‑D)+β(L<sup>*</sup>‑L)计算当前回报r,其中:F<sup>*</sup>是(t-T,t)时间内服务小区统计的异常切换次数占总切换次数的比例上限;F是(t-T,t)内服务小区统计的到目标邻区的异常切换次数占总切换次数的比例;α、β是相关系数,由运营商设定依据相互关系设定;D<sup>*</sup>是(t-T,t)内服务小区统计的掉话次数上限;D是(t-T,t)内服务小区统计的掉话次数;L<sup>*</sup>是服务小区高负载门限;L是服务小区当前负载;找到下一状态的动作值函数最大值<img file="FDA0000560931640000022.GIF" wi="323" he="90" />根据<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>Q</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>s</mi><mo>,</mo><mi>a</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>&alpha;</mi><mi>t</mi></msub><mo>)</mo></mrow><msub><mi>Q</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>,</mo><mi>a</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>&alpha;</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>r</mi><mi>t</mi></msub><mo>+</mo><mi>&gamma;</mi><munder><mi>max</mi><msup><mi>a</mi><mo>&prime;</mo></msup></munder><msub><mi>Q</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>s</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>a</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000560931640000023.GIF" wi="1041" he="90" /></maths>更新Q<sub>t</sub>(s,a),其中:α<sub>t</sub>是t时刻的学习率,是一个变步长的参数,且0&lt;α<sub>t</sub>&lt;1;γ为折扣因子,且0≤γ≤1,<img file="FDA0000560931640000031.GIF" wi="281" he="90" />中的a′是系统在t时刻处于s′状态时,对应的所有行为中Q值最大的那个动作;每轮迭代结束后更新学习率和贪婪算法中的探索概率ε,使学习率和探索概率以负指数规律随着学习的过程逐渐减少为0。
地址 100876 北京市海淀区西土城路10号