发明名称 基于Q学的异构网络接入控制优化选择方法
摘要 基于Q学的异构网络接入控制优化选择方法,属于无线网络领域,本发明为解决针对WCDMA/WLAN融合异构网络系统,采用基于测量的接入方案选择网络类型不能实现全局最优,而采用基于模型的接入方案选择网络类型计算过于复杂,很难应用于实际系统的问题。本发明所述基于Q学的异构网络接入控制优化选择方法包括以下步骤:步骤一、判断接入新用户时的异构网络状态;步骤二、查询Q值表,选择步骤一所述异构网络状态对应的Q值表中的最大Q值对应的子网络作为新用户的接入网络。本发明方法用于新用户接入时能根据当前的实际情况快速选择接入的网络类型。
申请公布号 CN102647773B 申请公布日期 2014.08.06
申请号 CN201210132200.3 申请日期 2012.05.02
申请人 哈尔滨工业大学 发明人 马琳;陈佳美;徐玉滨;邓志安;刘宁庆
分类号 H04W48/16(2009.01)I 主分类号 H04W48/16(2009.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 张果瑞
主权项 基于Q学习的异构网络接入控制优化选择方法,其特征在于,该方法包括以下步骤: 步骤一、判断接入新用户时的异构网络状态; 所述异构网络指的是WCDMA子网络和WLAN子网络采用松耦合的方式组成的融合异构网络, 所述异构网络状态是根据WCDMA子网络的基于干扰的四种网络状态和WLAN子网络的基于信道繁忙率的四种网络状态共同确定的, WCDMA子网络的基于干扰的四种网络状态向量s<sub>c</sub>=[I<sub>very low</sub>,I<sub>low</sub>,I<sub>high</sub>,I<sub>very high</sub>],WLAN子网络的基于信道繁忙率的四种网络状态向量s<sub>w</sub>=[R<sub>b‑very low</sub>,R<sub>b‑low</sub>,R<sub>b‑high</sub>,R<sub>b‑very high</sub>], 则所述WCDMA子网络和WLAN子网络构成的异构网络的网络状态向量s为: s=[R<sub>b‑very low</sub>I<sub>very low</sub>,R<sub>b‑very low</sub>I<sub>low</sub>,R<sub>b‑very low</sub>I<sub>high</sub>,R<sub>b‑very low</sub>I<sub>very high</sub>, R<sub>b‑low</sub>I<sub>very low</sub>,R<sub>b‑low</sub>I<sub>low</sub>,R<sub>b‑low</sub>I<sub>high</sub>,R<sub>b‑low</sub>I<sub>very high</sub>, R<sub>b‑high</sub>I<sub>very low</sub>,R<sub>b‑high</sub>I<sub>low</sub>,R<sub>b‑high</sub>I<sub>high</sub>,R<sub>b‑high</sub>I<sub>very high</sub>,; R<sub>b‑very high</sub>I<sub>very low</sub>,R<sub>b‑very high</sub>I<sub>low</sub>,R<sub>b‑very high</sub>I<sub>high</sub>,R<sub>b‑very high</sub>I<sub>very high</sub>] 确定WCDMA子网络的基于干扰的四种网络状态的规则为: 当0≤I<sub>total</sub>+△I&lt;I<sub>1</sub>时,WCDMA子网络处于I<sub>very low</sub>状态; 当I<sub>1</sub>≤I<sub>total</sub>+△I&lt;I<sub>2</sub>时,WCDMA子网络处于I<sub>low</sub>状态; 当I<sub>2</sub>≤I<sub>total</sub>+△I&lt;I<sub>3</sub>时,WCDMA子网络处于I<sub>high</sub>状态; 当I<sub>total</sub>+△I≥I<sub>3</sub>时,WCDMA子网络处于I<sub>very high</sub>状态; 其中,I<sub>1</sub>=4~7,I<sub>2</sub>=8~9,I<sub>3</sub>=10~12, I<sub>total</sub>为WCDMA子网络的基站接入新用户前的N个用户的总干扰, △I为接入新用户增加的干扰,且按如下公式获取: <img file="FDA0000470819200000011.GIF" wi="512" he="156" />式中:△L为新接入用户的负载因子,且按公式 <img file="FDA0000470819200000021.GIF" wi="741" he="160" />获取;其中:W为码片速率; v<sub>new</sub>为接入新用户的激活因子; R<sub>new</sub>为接入新用户的比特速率; (E<sub>b</sub>/N<sub>0</sub>)<sub>new</sub>为接入新用户的信噪比; η为基站中各条链路的负载因子之和,且按公式 <img file="FDA0000470819200000022.GIF" wi="860" he="274" />获取,其中:f为其他小区与本小区的干扰之比,且f=0.55; v<sub>i</sub>为第i个用户的激活因子,i=1,2,…,N,N为WCDMA子网络的基站接入新用户前的用户数量; R<sub>i</sub>为第i个用户的比特速率; (E<sub>b</sub>/N<sub>0</sub>)<sub>i</sub>为第i个用户的信噪比; 步骤二、查询Q值表,选择步骤一所述异构网络状态对应的Q值表中的最大Q值对应的子网络作为新用户的接入网络; Q值表的获取过程为: 步骤a、初始化Q值表,在[0,1]区间内随机赋值Q值表中的<img file="FDA0000470819200000023.GIF" wi="552" he="111" />j=1,2,...16,Q值表 <img file="FDA0000470819200000031.GIF" wi="1418" he="2399" />步骤b、接入新用户,作出选择动作,记录立即回报函数r<sub>s</sub>(a),记录规则为: 当接入新用户为办理数据业务,作出的选择动作为选择WCDMA子网络即a=1时,记录r<sub>s</sub>(a)=1; 当接入新用户为办理数据业务,作出的选择动作为选择WLAN子网络即a=2时,记 录r<sub>s</sub>(a)=2; 当接入新用户为办理语音业务,作出的选择动作为选择WCDMA子网络即a=1时,记录r<sub>s</sub>(a)=2; 当接入新用户为办理语音业务,作出的选择动作为选择WLAN子网络即a=2时,记录r<sub>s</sub>(a)=1; 当WCDMA子网络和WLAN子网络都没有足够资源,呼叫阻塞时,记录r<sub>s</sub>(a)=‑5; 步骤c、根据公式 <img file="FDA0000470819200000041.GIF" wi="1726" he="144" />更新Q值表, 其中,α是学习强度,α=0.1~0.2, γ为折扣因子,且0&lt;γ&lt;1, Q<sub>s,t+1</sub>(a)为当前时刻、异构网络状态为s选择动作为a时Q值, Q<sub>s,t</sub>(a)为前一时刻、异构网络状态为s选择动作为a时Q值, 步骤d、当满足收敛条件△Q(s,a)&lt;ε,<img file="FDA0000470819200000042.GIF" wi="174" he="68" />a∈A,停止迭代,迭代门限ε=0.005,△Q(s,a)为某个异构网络状态s选择动作为a的前后两次Q值的差值,△Q(s,a)=|Q<sub>s,t+1</sub>(a)‑Q<sub>s,t</sub>(a)|, S为异构网络的状态集合,A为所有动作的集合, 重复执行步骤b至步骤d,直至将Q值表中所有Q值都更新完毕。 
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号