异构无线网络中优化用户QoE的动态网络选择方法,申请号CN201310280666.2-传众专利搜索

发明名称	异构无线网络中优化用户QoE的动态网络选择方法
摘要	一种异构无线网络中优化用户QoE的动态网络选择方法，该方法结合传输的业务类型和当前用户接入的网络，周期的动态更新接入网络；该方法包括以下步骤：建立三种业务类型的用户QoE需求函数以及初始化Q学中变量的步骤；采用Q学方法进行网络选择决策及执行切换的步骤；和Q学方法中变量更新的步骤。本发明从用户的角度出发，区分不同的业务特性，优化用户的QoE；本发明提供了一种动态的网络选择方法，能够高效的利用异构无线网络资源；本发明基于强化学，不需要先验的网络状态信息，具有较强的灵活性，能够适应各种动态的网络环境。
申请公布号	CN103327556B	申请公布日期	2016.05.11
申请号	CN201310280666.2	申请日期	2013.07.04
申请人	中国人民解放军理工大学通信工程学院	发明人	吴启晖;王金龙;杜智勇;杨盘隆;郑学强
分类号	H04W36/30(2009.01)I;H04W28/24(2009.01)I	主分类号	H04W36/30(2009.01)I
代理机构	南京天华专利代理有限责任公司 32218	代理人	夏平
主权项	一种异构无线网络中优化用户QoE的动态网络选择方法，其特征是该方法结合传输的业务类型和当前用户接入的网络，周期的动态更新接入网络；该方法包括以下步骤：建立三种业务类型的用户QoE需求函数以及初始化Q学习中变量的步骤；采用Q学习方法进行网络选择决策及执行切换的步骤；和Q学习方法中变量更新的步骤；具体包括以下步骤：步骤1.初始化，完成以下工作：1.1建立三种业务类型的用户QoE需求函数，所述的三种业务类型包括视频业务、音频业务和弹性业务，QoE需求函数将网络服务质量性能参数映射成用户的QoE回报；前述QoE需求函数输入为QoS参数，输出为评分值，评分值的取值范围为1～5，评分越高，代表用户的体验好或满意度高，三种业务对应的QoE需求函数分别如下：1)视频业务，记为s<sub>video</sub>：视频业务的QoE取决于接收信号的峰值信躁比P<sub>snr</sub>，其QoE需求函数F<sub>video</sub>(P<sub>snr</sub>)定义为<img file="FDA0000820138830000011.GIF" wi="807" he="154" />其中，参数b<sub>1</sub>确定QoE的增长速度；参数b<sub>2</sub>确定函数的中点位置，即QoE取中间值2.75时所需的峰值信躁比；调整b<sub>1</sub>和b<sub>2</sub>能够满足不同用户对视频业务的个性化要求情况；2)音频业务，记为s<sub>audio</sub>：音频业务的QoE与数据包的丢包率e和时延d有关，丢包率和时延可以分别由下式计算e＝e<sub>network</sub>+(1‑e<sub>network</sub>)e<sub>playout</sub>d＝d<sub>codec</sub>+d<sub>playout</sub>+d<sub>network</sub>其中，e<sub>network</sub>为网络传输中引起的丢包率，e<sub>playout</sub>为播放缓冲时的丢包率，d<sub>codec</sub>为编码器产生的时延，d<sub>playout</sub>为播放缓冲导致的时延，d<sub>network</sub>为网络传输中产生的时延；上述的丢包和时延导致的音频业务的性能损失I<sub>e</sub>和I<sub>d</sub>分别为I<sub>e</sub>＝γ<sub>1</sub>+γ<sub>2</sub>ln(1+γ<sub>3</sub>e)I<sub>d</sub>＝0.024d+0.11(d‑177.3)I<sub>{d‑177.3}</sub>其中，参数γ<sub>1</sub>，γ<sub>2</sub>和γ<sub>3</sub>取决于采用的编解码器，时延d的单位为毫秒，177.3毫秒为常用的时延门限值，I<sub>{</sub><sub>·</sub><sub>}</sub>为指示函数，由I<sub>e</sub>和I<sub>d</sub>导致的总体性能损失定义为R<sub>f</sub>指数，R<sub>f</sub>＝94.2‑I<sub>e</sub>‑I<sub>d</sub>由R<sub>f</sub>指数，得到音频业务的QoE需求函数F<sub>audio</sub>(R<sub>f</sub>) F<sub>audio</sub>(R<sub>f</sub>)＝1+0.035R<sub>f</sub>+7·10<sup>‑6</sup>R<sub>f</sub>(R<sub>f</sub>‑60)(100‑R<sub>f</sub>) 3)弹性业务，记为s<sub>elastic</sub>：弹性业务的QoE与吞吐量θ有关,其QoE需求函数F<sub>elastic</sub>(θ)定义为F<sub>elastic</sub>(θ)＝b<sub>3</sub>log(b<sub>4</sub>θ)给定用户的最小期望吞吐量θ<sub>1</sub>和最大期望吞吐量θ<sub>2</sub>，参数<img file="FDA0000820138830000021.GIF" wi="287" he="160" /><img file="FDA0000820138830000022.GIF" wi="325" he="145" />1.2初始化Q学习中的变量：记业务类型集为S＝{s<sub>video</sub>,s<sub>audio</sub>,s<sub>elastic</sub>}，可用网络集为<img file="FDA0000820138830000024.GIF" wi="345" he="78" />定义x＝[s,n]∈X为用户的状态，x表示的状态是用户当前所在网络为n且新到达的业务对应的类型为s，<img file="FDA0000820138830000025.GIF" wi="234" he="64" />为用户状态空间，<img file="FDA0000820138830000026.GIF" wi="151" he="54" />为切换目标网络，即切换到的网络，初始化Q值为Q(x,n)＝0，系统时隙长度为T，初始化网络切换开销矩阵<img file="FDA0000820138830000027.GIF" wi="442" he="90" />其中c<sub>m,n</sub>≥0表示从网络m切换至网络n的切换开销，并且c<sub>n,n</sub>＝0；这里的开销表征的是网络切换中产生的协议开销；步骤2.采用Q学习方法进行网络选择决策及执行切换，完成以下工作：2.1在第t个时隙的起始时刻，t时隙传输的业务类型为s(t)；2.2结合当前接入的网络n(t)，得到x(t)＝[s(t),n(t)]，并按照下面的规则选择切换网络：以概率ε(t)随机选择一个网络<img file="FDA0000820138830000028.GIF" wi="210" he="79" />接入；以概率1‑ε(t)选择网络<img file="FDA0000820138830000023.GIF" wi="532" he="101" />接入，ε(t)随着t会变小，始终大于0；2.3执行网络切换，建立连接；步骤3.Q学习方法中变量更新：3.1建立连接后，进行业务传输；3.2当第t个时隙的传输结束，根据所传输的业务类型，计算相应业务类型的QoE回报即F<sub>s(t)</sub>，然后，计算用户的净回报r(x(t),δ(t))r(x(t),δ(t))＝F<sub>s(t)</sub>‑ρc<sub>n(t),</sub><sub>δ</sub><sub>(t)</sub>其中0≤ρ≤1为开销权重；3.3在第t+1时隙的起始时刻，业务类型为s(t+1)，系统状态转移到新状态x(t+1)＝[s(t+1),δ(t)]；3.4按下式更新Q值<img file="FDA0000820138830000031.GIF" wi="1667" he="120" />其中α<sub>t</sub><1为Q学习中的控制参数，随t增大而减小，满足<img file="FDA0000820138830000032.GIF" wi="455" he="140" />3.5t＝t+1，回到步骤2。
地址	210016 江苏省南京市御道街标营2号