发明名称 异构无线网络中优化用户QoE的动态网络选择方法
摘要 一种异构无线网络中优化用户QoE的动态网络选择方法,该方法结合传输的业务类型和当前用户接入的网络,周期的动态更新接入网络;该方法包括以下步骤:建立三种业务类型的用户QoE需求函数以及初始化Q学中变量的步骤;采用Q学方法进行网络选择决策及执行切换的步骤;和Q学方法中变量更新的步骤。本发明从用户的角度出发,区分不同的业务特性,优化用户的QoE;本发明提供了一种动态的网络选择方法,能够高效的利用异构无线网络资源;本发明基于强化学,不需要先验的网络状态信息,具有较强的灵活性,能够适应各种动态的网络环境。
申请公布号 CN103327556B 申请公布日期 2016.05.11
申请号 CN201310280666.2 申请日期 2013.07.04
申请人 中国人民解放军理工大学通信工程学院 发明人 吴启晖;王金龙;杜智勇;杨盘隆;郑学强
分类号 H04W36/30(2009.01)I;H04W28/24(2009.01)I 主分类号 H04W36/30(2009.01)I
代理机构 南京天华专利代理有限责任公司 32218 代理人 夏平
主权项 一种异构无线网络中优化用户QoE的动态网络选择方法,其特征是该方法结合传输的业务类型和当前用户接入的网络,周期的动态更新接入网络;该方法包括以下步骤:建立三种业务类型的用户QoE需求函数以及初始化Q学习中变量的步骤;采用Q学习方法进行网络选择决策及执行切换的步骤;和Q学习方法中变量更新的步骤;具体包括以下步骤:步骤1.初始化,完成以下工作:1.1建立三种业务类型的用户QoE需求函数,所述的三种业务类型包括视频业务、音频业务和弹性业务,QoE需求函数将网络服务质量性能参数映射成用户的QoE回报;前述QoE需求函数输入为QoS参数,输出为评分值,评分值的取值范围为1~5,评分越高,代表用户的体验好或满意度高,三种业务对应的QoE需求函数分别如下:1)视频业务,记为s<sub>video</sub>:视频业务的QoE取决于接收信号的峰值信躁比P<sub>snr</sub>,其QoE需求函数F<sub>video</sub>(P<sub>snr</sub>)定义为<img file="FDA0000820138830000011.GIF" wi="807" he="154" />其中,参数b<sub>1</sub>确定QoE的增长速度;参数b<sub>2</sub>确定函数的中点位置,即QoE取中间值2.75时所需的峰值信躁比;调整b<sub>1</sub>和b<sub>2</sub>能够满足不同用户对视频业务的个性化要求情况;2)音频业务,记为s<sub>audio</sub>:音频业务的QoE与数据包的丢包率e和时延d有关,丢包率和时延可以分别由下式计算e=e<sub>network</sub>+(1‑e<sub>network</sub>)e<sub>playout</sub>d=d<sub>codec</sub>+d<sub>playout</sub>+d<sub>network</sub>其中,e<sub>network</sub>为网络传输中引起的丢包率,e<sub>playout</sub>为播放缓冲时的丢包率,d<sub>codec</sub>为编码器产生的时延,d<sub>playout</sub>为播放缓冲导致的时延,d<sub>network</sub>为网络传输中产生的时延;上述的丢包和时延导致的音频业务的性能损失I<sub>e</sub>和I<sub>d</sub>分别为I<sub>e</sub>=γ<sub>1</sub>+γ<sub>2</sub>ln(1+γ<sub>3</sub>e)I<sub>d</sub>=0.024d+0.11(d‑177.3)I<sub>{d‑177.3}</sub>其中,参数γ<sub>1</sub>,γ<sub>2</sub>和γ<sub>3</sub>取决于采用的编解码器,时延d的单位为毫秒,177.3毫秒为常用的时延门限值,I<sub>{</sub><sub>·</sub><sub>}</sub>为指示函数,由I<sub>e</sub>和I<sub>d</sub>导致的总体性能损失定义为R<sub>f</sub>指数,R<sub>f</sub>=94.2‑I<sub>e</sub>‑I<sub>d</sub>由R<sub>f</sub>指数,得到音频业务的QoE需求函数F<sub>audio</sub>(R<sub>f</sub>) F<sub>audio</sub>(R<sub>f</sub>)=1+0.035R<sub>f</sub>+7·10<sup>‑6</sup>R<sub>f</sub>(R<sub>f</sub>‑60)(100‑R<sub>f</sub>) 3)弹性业务,记为s<sub>elastic</sub>:弹性业务的QoE与吞吐量θ有关,其QoE需求函数F<sub>elastic</sub>(θ)定义为F<sub>elastic</sub>(θ)=b<sub>3</sub>log(b<sub>4</sub>θ)给定用户的最小期望吞吐量θ<sub>1</sub>和最大期望吞吐量θ<sub>2</sub>,参数<img file="FDA0000820138830000021.GIF" wi="287" he="160" /><img file="FDA0000820138830000022.GIF" wi="325" he="145" />1.2初始化Q学习中的变量:记业务类型集为S={s<sub>video</sub>,s<sub>audio</sub>,s<sub>elastic</sub>},可用网络集为<img file="FDA0000820138830000024.GIF" wi="345" he="78" />定义x=[s,n]∈X为用户的状态,x表示的状态是用户当前所在网络为n且新到达的业务对应的类型为s,<img file="FDA0000820138830000025.GIF" wi="234" he="64" />为用户状态空间,<img file="FDA0000820138830000026.GIF" wi="151" he="54" />为切换目标网络,即切换到的网络,初始化Q值为Q(x,n)=0,系统时隙长度为T,初始化网络切换开销矩阵<img file="FDA0000820138830000027.GIF" wi="442" he="90" />其中c<sub>m,n</sub>≥0表示从网络m切换至网络n的切换开销,并且c<sub>n,n</sub>=0;这里的开销表征的是网络切换中产生的协议开销;步骤2.采用Q学习方法进行网络选择决策及执行切换,完成以下工作:2.1在第t个时隙的起始时刻,t时隙传输的业务类型为s(t);2.2结合当前接入的网络n(t),得到x(t)=[s(t),n(t)],并按照下面的规则选择切换网络:以概率ε(t)随机选择一个网络<img file="FDA0000820138830000028.GIF" wi="210" he="79" />接入;以概率1‑ε(t)选择网络<img file="FDA0000820138830000023.GIF" wi="532" he="101" />接入,ε(t)随着t会变小,始终大于0;2.3执行网络切换,建立连接;步骤3.Q学习方法中变量更新:3.1建立连接后,进行业务传输;3.2当第t个时隙的传输结束,根据所传输的业务类型,计算相应业务类型的QoE回报即F<sub>s(t)</sub>,然后,计算用户的净回报r(x(t),δ(t))r(x(t),δ(t))=F<sub>s(t)</sub>‑ρc<sub>n(t),</sub><sub>δ</sub><sub>(t)</sub>其中0≤ρ≤1为开销权重;3.3在第t+1时隙的起始时刻,业务类型为s(t+1),系统状态转移到新状态x(t+1)=[s(t+1),δ(t)];3.4按下式更新Q值<img file="FDA0000820138830000031.GIF" wi="1667" he="120" />其中α<sub>t</sub>&lt;1为Q学习中的控制参数,随t增大而减小,满足<img file="FDA0000820138830000032.GIF" wi="455" he="140" />3.5t=t+1,回到步骤2。
地址 210016 江苏省南京市御道街标营2号