发明名称 智能化动态路线诱导系统
摘要 本发明公开了一种智能化动态路线诱导系统,该系统包括交通流过程、检测单元、辨识单元、预测学单元、预测单元、诱导学单元、决策单元、评价单元以及知识库,与现有技术相比,本发明针对交通诱导系统除了能够依据实时检测到的交通流过程提供交通诱导策略以外,还能够通过学流程,对系统中优于标准状态的诱导策略通过智能学的方式完成诱导策略的知识储备,并且,这些通过学得到的诱导策略能够结合到实时检测的交通流,为其提供更多更优的诱导策略,更有效率地实现对交通路网的智能化路线诱导。
申请公布号 CN101604477B 申请公布日期 2011.11.02
申请号 CN200910067720.9 申请日期 2009.01.16
申请人 天津大学 发明人 钟石泉;马寿峰;刘建美;贾宁
分类号 G08G1/00(2006.01)I 主分类号 G08G1/00(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 李素兰
主权项 一种智能化动态路线诱导系统,该系统包括交通流过程、检测单元、辨识单元、预测学习单元、预测单元、诱导学习单元、决策单元、评价单元以及知识库,其特征在于:检测单元实测交通流过程中的路网交通状态信息,该信息包括交通系统中有关人、交通工具、交通网络和各种交通信息,实测结果传送到辨识单元作辨识处理、传送到预测单元为预测提供依据、传送到预测学习单元为预测学习提供依据,以及传送到诱导学习单元为诱导学习提供依据;预测学习单元学习诱导策略,并将学习到的诱导策略传送到预测单元;预测单元将预测的诱导单元状态以及学习到的诱导策略提供给辨识单元;诱导学习单元用于执行诱导策略的学习流程;辨识单元接收预测策略与检测结果,并对它们进行辨识处理,辨识的诱导单元状态输出到决策单元;决策单元一方面根据辨识的诱导单元状态提供诱导策略,存入知识库中,另一方面,决策单元从诱导策略库获取诱导策略,所获取的诱导策略用于交通流过程的交通路线诱导;评价单元对诱导学习单元的输出的学习完毕的诱导策略进行状态最优诱导策略判别条件的检验,当不满足该条件时,确定下一步的搜索方向,重新进入学习流程,对该诱导策略进行学习,诱导学习单元的输出结果存入知识库中的学习策略库中,以便作为该系统的策略储备;知识库包括诱导策略库、评价数据库和学习策略库,包含了所有诱导策略,评价数据和诱导学习策略,诱导策略及学习策略提供给实时检测的交通流,为其提供诱导策略所述诱导策略的学习流程包括以下步骤:初始化学习策略库;实测诱导单元子区在诱导周期内的各路段饱和度之后,并行执行以下两个流程分支:分支一:实时诱导流程计算诱导单元子区在一个诱导周期内的路网饱和度;判断上述路网饱和度是否在需要进行诱导的最大/最小饱和度区域;如否,则返回,则获取下一诱导周期,并重新实测当前诱导单元子区该新的诱导周期内的各路段饱和度;如是,则对当前计算出的路网饱和度,以及上一路网饱和度进行加权,得到加权后的路网饱和度;对上述加权后的路网饱和度进行状态辨识,得到标准化的诱导单元状态;搜索学习策略库中的诱导单元状态所对应的当前诱导策略;执行上述诱导策略后,转至下一诱导周期;分支二:后台学习流程计算路网平衡度在当前诱导周期的前三个诱导周期中是否有诱导策略 如否,则不进行诱导,转至下一诱导周期;如是,则根据上述前三个诱导周期的路网平衡度,评价当前诱导周期之前的第三个诱导周期的诱导策略,得到其诱导策略的评价值;从学习策略库中搜寻标准状态的最优诱导策略以及对应的评价值;判断当前诱导周期之前的第三个诱导周期的诱导策略的评价值是否优于上述标准状态的最优诱导策略的评价值;如否,则设定将步长设定为λ/2;在标准状态的最优诱导策略的基础上,以学习步长λ/2,根据学习规则生成当前诱导周期之前的第三个诱导周期的诱导单元状态的当前诱导策略,并将当前诱导策略连续优于最优诱导策略的次数ND设为0,进入下一个诱导周期,开始新的学习流程;如是,进一步判断当前诱导周期之前的第三个诱导周期的诱导策略的评价值连续优于上述标准状态的最优诱导策略的评价值的次数是否大于某个阈值N*,N*取2‑4;如是,说明当前诱导周期之前的第三个诱导周期的诱导策略的评价值连续优于上述标准状态对应的最优诱导策略的评价值的次数达到系统预设要求的次数,则将标准状态对应的最优诱导策略设置为当前诱导周期之前的第三个诱导周期的诱导策略,同时将标准状态对应的最优诱导策略的评价值设置为当前诱导周期之前的第三个诱导周期的诱导策略的评价值;设定学习步长λ为初始步长λ0,λ0取0.38;在上述新的标准状态的最优诱导策略的基础上,以初始步长λ0,根据学习规则生成当前诱导周期之前的第三个诱导周期的诱导单元状态的当前诱导策略,并将当前诱导策略连续优于最优诱导策略的次数ND设置为0,进入下一个诱导周期,开始新的学习流程;如否,说明当前诱导周期之前的第三个诱导周期的诱导策略的评价值连续优于上述标准状态的最优诱导策略的评价值的次数没有达到系统预设要求的次数,则将当前诱导周期之前的第三个诱导周期的诱导策略作为当前诱导周期之前的第三个诱导周期的诱导策略,同时当前诱导策略连续优秀的评价次数ND累加1,进入下一诱导周期,开始新的学习流程。
地址 300191 天津市南开区卫津路92号