发明名称 一种基于Sarsa学的中心式动态路径诱导方法
摘要 一种基于Sarsa学的中心式动态路径诱导方法, 该方法可通过Sarsa学计算所有可能目的地的Q值表,为所有车辆提供路径诱导。建立Q值表具体包括以下两个步骤:第一,交通中心根据路网信息以及以往路段通行时间,利用基于Q值的动态规划算法初始化各个目的地的Q值表;第二,交通信息中心根据利用车联网技术采集的车辆实时信息,每隔时间T利用Sarsa学方法更新Q值表。交通信息中心根据车辆的位置及目的地信息,读取Q值表中相应路段Q值,通过结合全局和局部参数的Boltzmann分布为车辆分配路段,实现路径诱导。本发明能够使用Sarsa学方法,为所有可能终点计算Q值表,从而为所有车辆提供最优的路径诱导。
申请公布号 CN104658297A 申请公布日期 2015.05.27
申请号 CN201510055467.0 申请日期 2015.02.04
申请人 沈阳理工大学 发明人 文峰;王星乔;苗维平;于洋;黄海新
分类号 G08G1/0969(2006.01)I 主分类号 G08G1/0969(2006.01)I
代理机构 沈阳利泰专利商标代理有限公司 21209 代理人 李枢
主权项 一种基于Sarsa 学习的中心式动态路径诱导方法,其特征在于包括下述步骤:步骤 1:初始化Q 值表;交通信息中心根据地理信息库中路网信息包括路网拓扑结构,路段长度,车道数和采集到的各路段车辆通行时间,利用基于Q 值的动态规划初始化各个可能终点<i>d </i>的Q 值表;步骤 2:车辆将自身信息及目的地信息通过车联网技术发送到交通信息中心;步骤3:通过使用结合全局和局部参数控制策略的Boltzmann 分布来为每辆车进行路径诱导;(1) 交通信息中心提取将步骤2 中获得的各个车辆的车载控制单元发送的数据包中车辆位置信息和目的地经纬度信息;(2) 信息中心根据车辆位置信息与目的地经纬度信息,在地理信息库中查询当前所驾驶车辆以及目的地所处的路段;(3) 信息中心根据当前系统中车辆的数量计算当前<i><img file="dest_path_image001.GIF" wi="16" he="19" /></i>值,公式如下所示:<img file="271705dest_path_image002.GIF" wi="145" he="43" />式中,<img file="dest_path_image003.GIF" wi="38" he="28" />是<i><img file="969534dest_path_image001.GIF" wi="16" he="19" /></i>的最大值,NV是当前系统中车辆的数量,<img file="672785dest_path_image004.GIF" wi="62" he="34" />是参数;(4) 信息中心计算车辆所在路段的相连路段的车道占有率,公式如下:<img file="dest_path_image005.GIF" wi="304" he="109" />式中,N 是路段中车辆的数量,V<sub>k</sub>是路段中第k辆车,length(V<sub>k</sub>)是车辆长度,length(S<sub>ij</sub>)是路段S<sub>ij</sub>的长度,mingap 是车辆间的最小间距,numlane(S<sub>ij</sub>)是路段S<sub>ij</sub>的车道数;(5)信息中心根据车辆所在路段和目的地所处路段从交通信息中心数据库&lt;Q 值表&gt;中读取对应当前目的地的车辆所在路段的下一路段的Q值,根据结合全局和局部参数控制策略的Boltzmann分布计算车辆所应行驶的下一路段,公式如下所示:<img file="684735dest_path_image006.GIF" wi="226" he="114" />式中,P<sub>d</sub>(i,j)是车辆选择路段S<sub>ij</sub>的概率,Q<sub>d</sub>(i,j)是车辆通过路段S<sub>ij</sub>到达目的地d的时间的估计,mi是局部控制参数,取决于交通节点i相连路段的车道占有率,<i><img file="602881dest_path_image001.GIF" wi="16" he="19" /></i>是全局控制参数,它取决于系统中总的交通状况,EQ<sub>d</sub> (i)是节点i周围路段到终点d的Q值的平均值; (6) 交通信息中心将上式得到的车辆所应行驶的下一路段,通过无线通讯模块发送到车载控制单元中,最终通过车载控制单元发送到车载导航地图中进行显示;步骤4:交通信息中心根据车辆数据包获得实时交通信息,具体为:(1)交通信息中心提取步骤2 中车载控制单元发送的数据包的信息,存入交通信息中心数据库车辆信息表中;(2)交通信息中心读取交通信息中心数据库车辆信息表,计算车辆通过路段的运行时间,将车辆通过路段的运行时间及车辆所选择的下一路段存于交通信息中心数据库实时交通信息表中;步骤5:交通信息中心根据实时交通信息,利用Sarsa 学习方法更新Q 值表;交通信息中心根据路网内全部车辆状态信息,每隔T时刻,从交通信息中心数据库实时交通信息表中读取对应各个目的地编号的更新时间最晚的各个路段,通过时间以及下一路段编号,从交通信息中心数据库的Q 值表中读取各路段对应的Q值,利用Sarsa学习方法更新Q值表,Sarsa学习公式如下所示:<img file="dest_path_image007.GIF" wi="412" he="29" />式中,<img file="658562dest_path_image008.GIF" wi="22" he="18" />是学习率,<i>t</i><sub>ij</sub>(<i>v</i>)是车辆<i>v </i>通过路段<i>s</i><sub>ij</sub>的实际通过时间;将新的Q值存入交通信息中心Q值表中。
地址 110159 辽宁省沈阳市浑南新区南屏中路6号