发明名称 认知无线电系统中基于隐马尔可夫模型的频谱接入方法
摘要 本发明公开了一种认知无线电系统中基于隐马尔可夫模型的频谱接入方法,涉及无线电通信领域。所述方法包括步骤:建立隐马尔可夫模型;根据频谱感知获得的信道观测值,对所述隐马尔可夫模型的参数进行训练更新;根据马尔可夫决策原理建立频谱接入的长期累积报偿方程;根据所述隐马尔可夫模型的参数求解所述长期累积报偿方程,得到索引值最小的接入动作,按照所述索引值最小的接入动作接入相应的频谱。所述方法,通过频谱感知得到信道状态的观测值,基于隐马尔可夫模型得到耗能最小的频谱接入策略,从而有效降低了频谱接入过程的能量消耗,具有广泛的应用前景。
申请公布号 CN102595570B 申请公布日期 2014.09.24
申请号 CN201210007671.1 申请日期 2012.01.11
申请人 北京邮电大学 发明人 魏翼飞;宋梅;于非;马跃;王莉;张勇;满毅;刘宁宁;滕颖蕾;刘洋;刘建玲
分类号 H04W52/02(2009.01)I;H04W74/08(2009.01)I 主分类号 H04W52/02(2009.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种认知无线电系统中基于隐马尔可夫模型的频谱接入方法,其特征在于,包括步骤: A:建立隐马尔可夫模型; B:根据频谱感知获得的信道观测值,对所述隐马尔可夫模型的参数进行训练更新; C:根据马尔可夫决策原理建立频谱接入的长期累积报偿方程; D:根据所述隐马尔可夫模型的参数求解所述长期累积报偿方程,得到索引值最小的接入动作,按照所述索引值最小的接入动作接入相应的频谱; 所述步骤A具体包括步骤: A1:定义N个可用无线信道{C<sub>1</sub>,C<sub>2</sub>,...,C<sub>N</sub>},将全部传输时间分为T个时隙,t∈{1,2,…T}表示需要做出频谱接入决策的时刻;N和T均为非0自然数; A2:定义所述无线信道具有的K个状态构成状态空间S,s(t)表示所述无线信道在t时刻的状态,p<sub>ij</sub>表示所述无线信道从t时刻的状态i转移到(t+1)时刻的状态j的概率,构造K×K阶信道状态转移概率矩阵如下: P=[p<sub>ij</sub>]<sub>K</sub><sub>×</sub><sub>K</sub>其中,<img file="FDA0000481895120000011.GIF" wi="702" he="112" />并且i,j∈S,K为非0自然数;A3:定义Θ={θ<sub>1</sub>,θ<sub>2</sub>,...,θ<sub>L</sub>}表示所有时刻的L个观测值,b<sub>j</sub>(l)表示所述无线信道的状态为j而观测值为θ<sub>l</sub>的概率,构造K×L阶观测概率矩阵如下: B=[b<sub>j</sub>(l)]<sub>K</sub><sub>×</sub><sub>L</sub>其中,<img file="FDA0000481895120000012.GIF" wi="638" he="104" />1≤l≤L,L为非0自然数;A4:所述K×K阶信道状态转移概率矩阵P,所述K×L阶观测概率矩阵B,以及K维初始状态空间概率分布π,共同构成用于描述隐 马尔可夫模型的参数ζ={P,B,π}; 所述步骤B具体包括步骤: B1:定义在t<sub>N</sub>∈{1,2,...,T}时刻得到所述无线信道的状态序列为S<sub>N</sub>={s(t<sub>1</sub>),s(t<sub>2</sub>),...,s(t<sub>N</sub>)},观测值序列为Θ<sub>N</sub>={θ(t<sub>1</sub>),θ(t<sub>2</sub>),...,θ(t<sub>N</sub>)}; B2:定义前向变量<img file="FDA0000481895120000026.GIF" wi="162" he="80" />表示得到终止状态为j的观测值序列的概率,并且t<sub>n</sub>∈{1,2,...,T},1≤t<sub>n</sub>≤t<sub>N</sub>≤T,则<img file="FDA0000481895120000021.GIF" wi="1200" he="98" />B3:定义后向变量<img file="FDA0000481895120000027.GIF" wi="177" he="86" />表示得到当前状态为j的观测值序列的概率,则<img file="FDA0000481895120000022.GIF" wi="1162" he="105" />B4:利用前后向算法计算出在给定参数ζ的条件下,产生所述观测值序列Θ<sub>N</sub>={θ(t<sub>1</sub>),θ(t<sub>2</sub>),...,θ(t<sub>N</sub>)}的后验概率Pr{Θ<sub>N</sub>|ζ}的公式如下: <img file="FDA0000481895120000023.GIF" wi="1382" he="176" />B5:通过计算确定所述隐马尔可夫模型参数ζ={P,B,π},所述隐马尔可夫模型参数ζ={P,B,π}使得所述后验概率Pr{Θ<sub>N</sub>|ζ}的数值最大; B6:根据所述隐马尔可夫模型参数ζ={P,B,π},定义时刻t=t<sub>n</sub>时处于状态i且时刻t=t<sub>n+1</sub>时处于状态j的概率公式如下: <img file="FDA0000481895120000024.GIF" wi="1635" he="348" />B7:根据所述观测值序列Θ<sub>N</sub>={θ(t<sub>1</sub>),θ(t<sub>2</sub>),...,θ(t<sub>N</sub>)}和所述隐马尔可夫模型参数ζ={P,B,π},定义在时刻t=t<sub>n</sub>时处于状态i的后验概率公式如下: <img file="FDA0000481895120000025.GIF" wi="1232" he="148" />B8:利用下面的公式计算得到所述无线信道的信道状态转移概率 矩阵中各元素的数值: <img file="FDA0000481895120000031.GIF" wi="475" he="205" />所述步骤C具体包括步骤: C1:根据接收信号的平均信噪比,得到无线通信的误比特率P<sub>b</sub> 的计算公式如下: <img file="FDA0000481895120000032.GIF" wi="458" he="125" />其中,<img file="FDA0000481895120000033.GIF" wi="48" he="66" />表示接收信号的平均信噪比,p<sub>tr</sub>表示发射功率,η表示自适应调制编码比率,k<sub>1</sub>和k<sub>2</sub>为与调制星座有关的常数;C2:根据所述误比特率P<sub>b</sub>,得到数据帧发生错误的概率F<sub>err</sub>的计算公式如下: <img file="FDA0000481895120000034.GIF" wi="502" he="99" />其中,L<sub>fr</sub>表示链路层数据帧的长度; C3:根据所述数据帧发生错误的概率F<sub>err</sub>,得到链路层数据帧的平均发送次数N<sub>tr</sub>的计算公式如下: <img file="FDA0000481895120000035.GIF" wi="1177" he="155" />其中,N<sub>max</sub>表示链路层最大重传次数; C4:根据所述平均发送次数N<sub>tr</sub>,得到传送一个数据帧需要的能量E<sub>tr</sub>的计算公式如下: <img file="FDA0000481895120000036.GIF" wi="451" he="142" />其中,p<sub>tr</sub>表示信号发射功率,T<sub>s</sub>表示信号的持续时间; C5:根据马尔可夫决策原理,得到无线信道C<sub>n</sub>在状态s<sub>n</sub>(t)时在t时刻执行动作a<sub>n</sub>(t)后得到的瞬时报偿<img file="FDA0000481895120000037.GIF" wi="142" he="103" />的表达式如下:<img file="FDA0000481895120000038.GIF" wi="762" he="78" />其中,动作a<sub>n</sub>(t)={a<sub>s</sub>(n),a<sub>m</sub>(n),a<sub>p</sub>(n),a<sub>f</sub>(n)},a<sub>s</sub>(n)表示信道选择决策,a<sub>m</sub>(n)表示调制编码决策,a<sub>p</sub>(n)表示发射功率决策,a<sub>f</sub>(n)表示链路层帧长度决策,p<sub>tr</sub>(t)表示无线信道C<sub>n</sub>在t时刻的发射功率,η(t)表示无 线信道C<sub>n</sub>在t时刻的自适应调制编码比率,L<sub>fr</sub>(t)表示无线信道C<sub>n</sub>在t时刻的链路层数据帧的长度; C6:根据所述瞬时报偿<img file="FDA0000481895120000041.GIF" wi="138" he="115" />建立频谱接入的长期累积报偿方程如下:<img file="FDA0000481895120000042.GIF" wi="1208" he="175" />其中,u∈U表示马尔可夫策略,χ是折扣因子并且0&lt;χ&lt;1;所述步骤D具体包括步骤: D1:将所述长期累积报偿方程转化为线性规划表达式如下: <img file="FDA0000481895120000043.GIF" wi="1047" he="136" />其中,<img file="FDA0000481895120000044.GIF" wi="971" he="99" />表示被性能向量x在所有马尔可夫策略u∈U下扩展后对应的性能区域,性能测量变量<img file="FDA0000481895120000045.GIF" wi="145" he="86" />表示无线信道C<sub>n</sub>按照马尔可夫策略,当状态为s<sub>n</sub>(t)时执行动作为a<sub>n</sub>(t)的总折扣时间的期望值;D2:转化所述线性规划表达式得到一阶放宽表达式如下: <img file="FDA0000481895120000046.GIF" wi="921" he="134" />subject to <img file="FDA0000481895120000047.GIF" wi="947" he="82" /><img file="FDA0000481895120000048.GIF" wi="396" he="160" />其中,<img file="FDA0000481895120000049.GIF" wi="70" he="78" />表示马尔可夫决策过程多面体在<img file="FDA00004818951200000410.GIF" wi="128" he="101" />空间的投影;D3:转化所述线性规划表达式得到双重表达式如下: <img file="FDA00004818951200000411.GIF" wi="877" he="161" />subject to <img file="FDA00004818951200000412.GIF" wi="999" he="131" /><img file="FDA00004818951200000413.GIF" wi="953" he="138" />λ≥0. D4:用<img file="FDA0000481895120000051.GIF" wi="144" he="93" />表示所述一阶放宽表达式的最优原始解,用<img file="FDA0000481895120000052.GIF" wi="156" he="89" />表示所述双重表达式的双重成对解,得到相应的最优缩减成本系数如下:<img file="FDA0000481895120000053.GIF" wi="643" he="126" /><img file="FDA0000481895120000054.GIF" wi="814" he="139" />D5:得到当前状态为i<sub>n</sub>的无线信道C<sub>n</sub>对应的索引值表达式如下: <img file="FDA0000481895120000055.GIF" wi="384" he="133" />D6:根据所述信道状态转移概率矩阵和所述索引值表达式,得到索引值最小的接入动作,按照所述索引值最小的接入动作接入相应的频谱。 
地址 100876 北京市海淀区西土城路10号
您可能感兴趣的专利