发明名称 一种无线传感器网络的节点能量自适应管理策略
摘要 本发明公开了一种无线传感器网络的节点能量自适应管理策略,由于无线传感器节点能量有限性,而节点在不同工作模式所消耗的能量是不一样的,针对无线传感器节点的这些特点,首先构建一种基于信道和缓冲区状态的自适应传输机制,其次在普通传输机制的基础上进一步引入了数据包虚拟分片技术,形成基于信道和缓冲区自适应分片传输机制,通过将问题建模成马尔可夫决策过程模型,利用一种智能学优化算法求解出最优策略,解决了在不同网络信道和节点缓冲区状态下,合理选择节点工作模式和数据包的分片大小,提高节点的能量利用效率。
申请公布号 CN102958109B 申请公布日期 2016.06.15
申请号 CN201210418441.4 申请日期 2012.10.26
申请人 合肥工业大学 发明人 唐昊;周雷;苏红;孙晶;李慧子;毛沙;任玲
分类号 H04W28/14(2009.01)I;H04W52/02(2009.01)I 主分类号 H04W28/14(2009.01)I
代理机构 安徽合肥华信知识产权代理有限公司 34112 代理人 余成俊
主权项 一种无线传感器网络的节点能量自适应管理策略,其特征在于,具体包括以下步骤:(1)衡量当前无线信道的状态:将连续的无线信道离散化,在时间片i,无线传感器节点通过与接收节点交换控制信息完成连接,无线传感器节点通过分析封装在控制信息中的反馈信号获得无线衰减信道的当前状态,通过将接收到的瞬时信噪比γ划分为k个区间,当接收到的信噪比落在γ<sub>k‑1</sub>到γ<sub>k</sub>区间,则认为信道状态为k,假设信道状态转移发生在一个时间片的边界,并且只转移到相邻状态之间;(2)检测当前节点自身缓冲区状态:传感器节点在时间片i,感知和接收从其它相邻节点转发而来的数据按相同的数学分布到达节点缓冲区中,节点缓冲区中的数据包的个数即为缓冲区状态;(3)强化学习算法:①传感器节点主要由处理器单元,感知单元和收发器单元组成,所述传感器节点具有8种不同的工作模式,结合节点自身的缓冲区状态以及当前无线信道状态,传感器节点决策以选择合理的节点工作模式和数据传输的方式,发送节点通过相关路由控制协议与接收节点通信;②根据接收到的控制信息估计当前的无线信道质量,引入虚拟分片技术,将一个完整的帧分成多个数据片,在信道状态比较好的时候可以选择多发送些完整的数据包,在信道差的时候选择发送几个分片帧,在信道非常差的时候延迟发送数据包;③在时间片i,通过发送节点接收到接收节点发送来的控制信息检测当前系统状态为s<sub>i</sub>=(g<sub>i</sub>,b<sub>i</sub>),其中g<sub>i</sub>为信道状态,b<sub>i</sub>为缓冲区中数据包的个数;用a<sub>i</sub>表示在时间片i下执行的控制行动,其包括节点工作模式为<img file="FDA0000966707800000011.GIF" wi="98" he="71" />节点的传输功率为P<sub>t,i</sub>;节点发送的数据包个数为c<sub>t,i</sub>;然后按(1)式计算节点所花费的立即代价R:<img file="FDA0000966707800000012.GIF" wi="1179" he="141" />在式(1)中:第一项<img file="FDA0000966707800000021.GIF" wi="117" he="107" />为每处理一个数据包所消耗的能量,P<sub>i</sub>表示在时间片i时节点消耗的功率,包括节点感知单元、接收器和发送器的功耗;T<sub>p</sub>表示一个时间片的长度;U表示节点在一个时间片内从感知单元感知到的数据包个数,接收器从相邻节点接收到的数据包个数,以及发送器发送的数据包个数;D(b<sub>i</sub>,a<sub>i</sub>)表示在时间片i由于缓冲区溢出造成丢失的平均数据包数,p(n)表示缓冲区空白为n的概率;D(b<sub>i</sub>,a<sub>i</sub>)一定程度体现了节点发送数据与接收数据的速度,当D(b<sub>i</sub>,a<sub>i</sub>)比较大的时候显示了信道质量不怎么好,节点发送数据的速度大于接收数据的速度;而当D(b<sub>i</sub>,a<sub>i</sub>)小的时候,数据溢出的数据包个数比较小;<img file="FDA0000966707800000022.GIF" wi="247" he="77" />表示从工作模式<img file="FDA0000966707800000023.GIF" wi="89" he="79" />到工作模式<img file="FDA0000966707800000024.GIF" wi="71" he="71" />的切换代价;<img file="FDA0000966707800000025.GIF" wi="48" he="55" />表示采取分片传输所产生的分片代价;④根据步骤③中所述立即代价函数R,利用即时差分公式d<sub>i</sub>,按照(2)式对系统的状态‑行动对值函数Q<sub>β</sub>(s<sub>i</sub>,a<sub>i</sub>)进行更新:Q<sub>β</sub>(s<sub>i</sub>,a<sub>i</sub>):=Q<sub>β</sub>(s<sub>i</sub>,a<sub>i</sub>)+ζ<sub>i</sub>d<sub>i</sub>   (2)式(2)中,ζ<sub>i</sub>=1/i为学习步长;(4)判断是否满足强化学习算法停止条件:为算法中所有状态‑行动对值函数的学习更新次数总和设置一个固定值,学习更新次数没有超过该固定值,转到步骤(3)继续学习;否则,强化学习算法学习终止,得出最优的节点自适应数据发送策略,系统即按照最优节点发送策略运行,选择合理的节点工作模式和数据传输方案。
地址 230009 安徽省合肥市屯溪路193号