发明名称 无线MIMO网络中基于非合作重复博弈的功率调度方法
摘要 本发明公布了一种无线MIMO网络中基于非合作重复博弈的功率调度方法,属于无线通信技术领域,特别涉及无线分布式MIMO网络中的功率调度。本发明各链路的功率调度被建模为使效用函数最大化的非合作博弈。在效用函数中引入考虑发送功率和链路质量的定价机制,获得网络吞吐量的帕累托改善。把所有发送窗的功率调度看作重复博弈,建立惩罚机制防止链路为获得超额收益的背离行为。仿真结果表明,与梯度投影算法相比较,本算法在不明显牺牲总吞吐量的情况下,以较低的计算复杂度实现了资源的分布式调度。
申请公布号 CN101784107B 申请公布日期 2012.08.15
申请号 CN201010017907.0 申请日期 2010.01.15
申请人 东南大学 发明人 徐平平;周超
分类号 H04W52/24(2009.01)I;H04B7/04(2006.01)I 主分类号 H04W52/24(2009.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 1.一种无线MIMO网络中基于非合作重复博弈的功率调度方法,其特征在于包括如下步骤:1)在无线MIMO网络中包含L条点对点链路,每条链路受到来自其它L-1条链路的同频干扰,每一节点拥有N根天线,初始化时,各链路将最大发送功率P<sub>max</sub>平均分配给N根发送天线,其中N、L都为自然数;2)第i链路的发送信号x<sub>i</sub>为N×1的复随机向量,其协方差矩阵<img file="FSB00000802661700011.GIF" wi="331" he="86" />N×N矩阵P<sub>i</sub>为功率分配矩阵;第i链路的发送功率为tr{P<sub>i</sub>}≤P<sub>max,i</sub>;噪声n<sub>i</sub>为N×1的独立同分布标准正态加性白高斯向量,其协方差矩阵<img file="FSB00000802661700012.GIF" wi="195" he="57" />I<sub>N</sub>为单位矩阵;第i链路的基带接收信号为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>y</mi><mi>i</mi></msub><mo>=</mo><msqrt><mfrac><msub><mi>&rho;</mi><mi>i</mi></msub><mi>N</mi></mfrac></msqrt><msub><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>x</mi><mi>i</mi></msub><mo>+</mo><munderover><mi>&Sigma;</mi><munder><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>&NotEqual;</mo><mi>i</mi></mrow></munder><mi>L</mi></munderover><msqrt><mfrac><msub><mi>&beta;</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mi>N</mi></mfrac></msqrt><msub><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><msub><mi>x</mi><mi>j</mi></msub><mo>+</mo><msub><mi>n</mi><mi>i</mi></msub><mo>,</mo></mrow></math>]]></maths>其中N×N矩阵H<sub>i,j</sub>是在本发送窗内第j链路发送天线与第i链路接收天线间的信道矩阵,ρ<sub>i</sub>为第i链路的信噪比SNR,β<sub>i,j</sub>为第j链路的发送节点到第i链路的接收节点的干扰噪声比INR,P<sub>max,i</sub>为第i链路的最大发送功率,i、j∈(1,2,3,...,L);3)采用块衰落block fading模型,信道矩阵在相干时间T<sub>c</sub>内是准静态的;将发送窗大小设为T<sub>c</sub>,并分为T个时隙,各链路的发送协方差矩阵P<sub>i</sub>随时间变化,即<img file="FSB00000802661700014.GIF" wi="503" he="85" />发送功率约束为:<maths num="0002"><![CDATA[<math><mrow><mfrac><mn>1</mn><mi>T</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></munderover><mi>tr</mi><mo>{</mo><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>}</mo><mo>=</mo><mi>M</mi><mo>&le;</mo><msub><mi>P</mi><mrow><mi>max</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>L</mi><mo>,</mo></mrow></math>]]></maths>P<sub>i</sub>(t)≥0,t=1,...,T;i=1,...,L,4)以每条链路的吞吐量作为优化目标,同时考虑链路质量和发送信号的代价,博弈收益函数为:<maths num="0003"><![CDATA[<math><mrow><msub><mi>u</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mo>,</mo><msub><mi>P</mi><mrow><mo>-</mo><mi>i</mi></mrow></msub><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></msubsup><msub><mi>log</mi><mn>2</mn></msub><mo>|</mo><msub><mi>I</mi><mi>N</mi></msub><mo>+</mo><mfrac><msub><mi>&rho;</mi><mi>i</mi></msub><mi>N</mi></mfrac><msub><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msubsup><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow><mi>H</mi></msubsup><msubsup><mi>R</mi><mi>i</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>|</mo><mo>-</mo><msub><mi>c</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中价格函数<maths num="0004"><![CDATA[<math><mrow><msub><mi>c</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>=</mo><msub><mi>&gamma;</mi><mi>i</mi></msub><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></msubsup><mo>|</mo><mo>&PartialD;</mo><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>/</mo><mo>&PartialD;</mo><mi>SIN</mi><msub><mi>R</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>|</mo><mi>tr</mi><mo>{</mo><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>}</mo></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><mo>=</mo><msub><mi>&gamma;</mi><mi>i</mi></msub><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></msubsup><msup><mrow><mo>|</mo><mrow><mo>(</mo><msub><mi>&rho;</mi><mi>i</mi></msub><mo>/</mo><mi>N</mi><mo>)</mo></mrow><msub><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow></msub><msubsup><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow><mi>H</mi></msubsup><msubsup><mi>R</mi><mi>i</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>|</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mi>tr</mi><mo>{</mo><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>}</mo><mo>,</mo></mrow></math>]]></maths><maths num="0006"><![CDATA[<math><mrow><msub><mi>SINR</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><msub><mi>&rho;</mi><mi>i</mi></msub><mo>/</mo><mi>N</mi><mo>)</mo></mrow><msub><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msubsup><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi></mrow><mi>H</mi></msubsup><msubsup><mi>R</mi><mi>i</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><maths num="0007"><![CDATA[<math><mrow><msub><mi>R</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>I</mi><mi>N</mi></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>j</mi><mo>&NotEqual;</mo><mi>i</mi></mrow><mi>L</mi></munderover><mfrac><msub><mi>&beta;</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mi>N</mi></mfrac><msub><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><msub><mi>P</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msubsup><mi>H</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow><mi>H</mi></msubsup><mo>,</mo></mrow></math>]]></maths>γ<sub>i</sub>为定价因子;更新功率调度:<img file="FSB00000802661700025.GIF" wi="688" he="101" />k表示迭代次数,判断所有链路前后两次迭代获得的发送功率矩阵是否满足二范数小于ε,若满足二范数小于ε则跳出迭代循环,当前的发送功率矩阵即为博弈的纳什均衡解;若不满足二范数小于ε,则返回步骤4进入下一次迭代更新功率调度,其中ε为一个趋于零的正实数,为10<sup>-4</sup>;5)各链路使用统一的定价因子γ,使总收益<img file="FSB00000802661700026.GIF" wi="167" he="122" />最大的定价因子为最佳定价因子γ<sub>opt</sub>;初始化定价因子γ=0,以Δγ为增量更新定价因子γ←γ+Δγ,执行步骤4,若u<sup>γ+Δγ</sup>≥u<sup>γ</sup>,则继续以增量Δγ提高定价因子,执行步骤4;否则迭代结束,取前一次博弈的定价因子为最佳定价因子γ<sub>opt</sub>,待发送数据将按照最佳定价因子γ<sub>opt</sub>功率调度矩阵发送,其中←表示赋值,u<sub>i</sub>表示第i链路的预期收益;6)按照步骤5)的设置发送数据,数据发送在第T个时隙结束时统计各链路的实际收益,与步骤5)的预期收益相比较,将实际收益大于预期收益的链路判定存在背离行为,此后各发送窗均设定其定价因子γ<sub>i</sub>→+∞参与博弈,此时γ<sub>i</sub>为10<sup>-4</sup>,第i链路将选择发送功率矩阵P<sub>i</sub>=0,未来收益将为零,若未发现背离行为,则正常初始化第i链路的定价因子γ<sub>i</sub>=0,操作完成后进入下一发送窗,返回步骤1)。
地址 214135 江苏省无锡市新区菱湖大道99号