发明名称 一种基于移动群智感知的路况信息汇集方法
摘要 一种基于移动群智感知的路况信息汇集方法,涉及无线通信技术与智能交通技术领域。服务器向相关地区的手机用户广播征集路况报告的通知;服务器接收到手机用户的路况报告后,按照路况报告的精确度对其划分等级;服务器汇总所有接收到的路况报告后,确定服务器在此刻的状态s,获得系统增益G(s);在目标最优定价不确定的情况下,服务器通过Q学,学如何对手机用户的任务路况报告的奖励金额定价,以获取服务器的最大收益;对不同质量等级l的路况报告有不同的定价y(l),在一次学过程中规定服务器的最大任务发布次数为K,第k次任务发布中的服务器状态是s<sup>k</sup>,服务器对路况报告的总定价是y<sup>k</sup>。
申请公布号 CN104700640B 申请公布日期 2016.09.28
申请号 CN201510127406.0 申请日期 2015.03.23
申请人 厦门大学 发明人 肖亮;李炎达;刘金亮;李燕
分类号 G08G1/0967(2006.01)I;G06Q30/06(2012.01)I 主分类号 G08G1/0967(2006.01)I
代理机构 厦门南强之路专利事务所(普通合伙) 35200 代理人 马应森
主权项 一种基于移动群智感知的路况信息汇集方法,其特征在于包括以下步骤:步骤1:服务器向相关地区的手机用户广播征集路况报告的通知,包括手机用户的地理位置信息、周边路况信息、对路况报告的定价范围P;步骤2:服务器接收到手机用户的路况报告x后,按照路况报告x的精确度对其划分等级,服务器规定路况报告的质量等级表为:[‑1,0,…,L],其中L表示路况报告质量的最高等级,依照质量等级表,将路况报告x的等级定为l,‑1≤l≤L,即x=l;步骤3:服务器汇总所有接收到的路况报告后,确定服务器在此刻的状态s,获得系统增益G(s):<img file="FDA0001058184660000011.GIF" wi="397" he="86" />其中M是发送路况报告的用户总数,s是服务器接收到的总体的路况报告质量,G(x<sub>j</sub>)是手机用户j的路况报告x<sub>j</sub>带给服务器的效益值,不同等级的路况报告带给服务器的效益是不同的,规定不同等级的路况报告的效益表为:[G(‑1),G(0),…,G(L)];与此对应,服务器根据路况报告的不同等级给予不同的支付价格y,规定不同等级的路况报告的定价表为:[y(‑1),y(0),…,y(L)],服务器的即时收益U<sub>s</sub>(s,y)是系统增益和服务器对手机用户的支付之差,即<img file="FDA0001058184660000012.GIF" wi="563" he="86" />步骤4:在目标最优定价不确定的情况下,服务器通过Q学习,学习如何对手机用户的任务路况报告的奖励金额定价,以获取服务器的最大收益;对不同质量等级l的路况报告有不同的定价y(l),在一次学习过程中规定服务器的最大任务发布次数为K,第k次任务发布中的服务器状态是s<sup>k</sup>,服务器对路况报告的总定价是y<sup>k</sup>,其中Q学习包括以下步骤:(1)初始化Q值矩阵:对于每一次任务发布中的服务器每一个可用状态s<sup>k</sup>下,对服务器的所有可选择的定价分配一个对应的Q值,对每个初始Q值赋值为0,设置学习因子α,0<α<1和折扣因子δ,0<δ<1;(2)在第k次任务发布中,服务器根据状态s<sup>k</sup>从定价范围P内选择y<sup>k</sup>(l)作为对质量等级l的路况报告的定价,根据公式:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>Q</mi><mrow><mo>(</mo><msup><mi>s</mi><mi>k</mi></msup><mo>,</mo><msup><mi>y</mi><mi>k</mi></msup><mo>(</mo><mi>l</mi><mo>)</mo><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>&alpha;</mi><mo>)</mo></mrow><mi>Q</mi><mrow><mo>(</mo><msup><mi>s</mi><mi>k</mi></msup><mo>,</mo><msup><mi>y</mi><mi>k</mi></msup><mo>(</mo><mi>l</mi><mo>)</mo><mo>)</mo></mrow><mo>+</mo><mi>&alpha;</mi><mrow><mo>(</mo><msub><mi>U</mi><mi>s</mi></msub><mo>(</mo><mrow><msup><mi>s</mi><mi>k</mi></msup><mo>,</mo><msup><mi>y</mi><mi>k</mi></msup><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></mrow><mo>)</mo><mo>+</mo><mi>&delta;</mi><munder><mrow><mi>m</mi><mi>a</mi><mi>x</mi></mrow><mrow><mi>y</mi><mo>&Element;</mo><mi>P</mi></mrow></munder><mi>Q</mi><mo>(</mo><mrow><msup><mi>s</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>,</mo><mi>y</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></mrow><mo>)</mo><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001058184660000013.GIF" wi="1452" he="118" /></maths>对Q值矩阵更新,Q(s<sup>k</sup>,y<sup>k</sup>(l))是服务器在s<sup>k</sup>状态下采用y<sup>k</sup>(l)值为定价时的Q值,<img file="FDA0001058184660000021.GIF" wi="339" he="86" />是服务器在s<sup>k+1</sup>状态下,采用让Q值最大化的定价y(l);(3)重复步骤(2),直到第n次的任务发布后满足<img file="FDA0001058184660000022.GIF" wi="466" he="150" />时,定价y(l)收敛,y<sup>n</sup>(l)即是服务器最优定价,其中n≤K;(4)服务器将报酬y<sup>n</sup>(l)发送给路况报告等级为l手机用户。
地址 361005 福建省厦门市思明南路422号