主权项 |
1.一种认知无线网络机会频谱接入方法,其特征在于,包括如下步骤:第一步:依次在认知无线网络的每个信道上连续接入预先设定的时长M,统计二级用户在各个信道上收益的总和,所述认知无线网络为多个未知信道和单个二级用户构成,初始化提前采样长度K,虚拟时间s=1,时间T=1,二级用户在虚拟时间s内在信道n上获得的总收益用S<sub>n,s</sub>表示,二级用户在虚拟时间s内接入信道n的次数用τ<sub>n,s</sub>表示,用户在虚拟时间s内接入信道n的虚拟次数用<img file="FDA00003389412700011.GIF" wi="74" he="106" />表示;第二步:根据接入信道的历史记录计算当前时刻二级用户应该接入的信道,根据历史记录找出目前平均收益最大的信道l<sub>s</sub>,<img file="FDA00003389412700012.GIF" wi="362" he="103" />其中<img file="FDA00003389412700013.GIF" wi="233" he="152" />为用户在信道n上的收益的平均值,找到当前时刻的备选信道r<sub>s</sub>,r<sub>s</sub>=s||N=smodN+1,如果<img file="FDA00003389412700014.GIF" wi="498" he="169" />则二级用户应该接入的信道为n=l<sub>s</sub>,否则二级用户接入的信道n为n=r<sub>s</sub>,其中<img file="FDA00003389412700015.GIF" wi="244" he="86" />根据如下定义算出:<maths num="0001"><![CDATA[<math><mrow><mi>I</mi><mrow><mo>(</mo><msub><mi>θ</mi><mi>i</mi></msub><mo>,</mo><msub><mi>θ</mi><mi>j</mi></msub><mo>)</mo></mrow><mover><mo>=</mo><mi>Δ</mi></mover><munderover><mo>∫</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mo>[</mo><mi>log</mi><mrow><mo>(</mo><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>;</mo><msub><mi>θ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>/</mo><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>;</mo><msub><mi>θ</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>]</mo><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>;</mo><msub><mi>θ</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>dx</mi><mo></mo></mrow></mrow></math>]]></maths>上式中f(x;θ<sub>j</sub>)为信道j的收益的概率密度分布函数;第三步:根据第二步的结果以及历史记录决定二级用户的行为,如果<img file="FDA00003389412700017.GIF" wi="234" he="103" />则二级用户需要在信道n上进行提前采样,在K个连续时隙内接入信道n;如果<img file="FDA00003389412700018.GIF" wi="233" he="105" />则二级用户并不接入任何信道;第四步:更新系统中的各个统计值,并返回第二步,所述统计值更新的方法如下:如果在步骤三中,用户在K个连续的时间内接入了信道n,则<img file="FDA00003389412700019.GIF" wi="281" he="105" />τ<sub>n,s</sub>=τ<sub>n,s</sub>+K,s=s+1,并且需要将这K次的收益累计到信道n的总收益S<sub>n,s</sub>中。 |