发明名称 基于演化博弈的交通信号周期自适应控制方法
摘要 本发明设计了一种基于演化博弈的交通信号周期自适应控制方法,将演化博弈理论应用于交通信号自适应控制中,充分考虑了交通流和信号控制的动态特性,建立了信号灯自适应控制模型,应用于解决当前区域城市交通号灯控制的问题。该方法是一种完全分布式的控制方法,可以很好的解决交通系统的不确定性、随机性、非线性、局部性等特点,此外,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。
申请公布号 CN103177589B 申请公布日期 2015.07.22
申请号 CN201310139809.8 申请日期 2013.04.22
申请人 福州大学 发明人 余春艳;李建明;吴丽丽
分类号 G08G1/081(2006.01)I 主分类号 G08G1/081(2006.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;S3:各路口根据过程S1、S2得到的配时方案,配置运行;所述过程S1中绿信比的优化方法指在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,以基于演化博弈的优化方法得到下一周期路口使用的绿信比,具体步骤如下:S21:演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益值u<sub>t</sub>;S22:重复步骤S21直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略s<sub>i</sub>的相位的平均博弈收益值<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mover><mi>u</mi><mo>&OverBar;</mo></mover><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>s</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>MaxNum</mi></munderover><mi>u</mi><mrow><mo>(</mo><msub><mi>s</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>/</mo><mi>MaxNum</mi><mo>;</mo></mrow>]]></math><img file="FDA0000706793180000011.GIF" wi="642" he="148" /></maths>S23:确定相位选择纯策略s<sub>i</sub>的增长率,并更新演化下一时期采用纯策略s<sub>i</sub>的相位在单交叉路口的所有相位中所占的比例;S24:重复上述步骤S22至S23,直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数;S25:根据步骤S24的结果配置单交叉路口各相位的绿灯时长,转到步骤S22;所述的博弈收益值u<sub>t</sub>指第t时期,相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:<img file="FDA0000706793180000012.GIF" wi="292" he="145" />其中,n1为单交叉路口相位总数;d<sub>it</sub>为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1‑λ)<sup>2</sup>)/(2(1‑λx))+x<sup>2</sup>/(2q(1‑x))‑0.65(c/q<sup>2</sup>)<sup>1/3</sup>x<sup>2+5λ</sup>,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率;相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,其中,纯策略s<sub>i</sub>指交叉路口上的一个合理有效的配时方案;相位若选择纯策略s<sub>1</sub>,那么纯策略s<sub>1</sub>中绿灯所对应相位上的绿灯时长延长Δt<sub>ex</sub>(Δt<sub>ex</sub>&gt;0),纯策略s<sub>1</sub>中红灯所对应相位上的绿灯时长增加Δt′<sub>ex</sub>(Δt′<sub>ex</sub>&lt;0),并满足(n‑1)*|Δt′<sub>ex</sub>|=Δt<sub>ex</sub>;同理可得相位选择纯策略s<sub>2</sub>,s<sub>3</sub>,…,s<sub>n</sub>的预测收益值u(s<sub>2</sub>),u(s<sub>3</sub>),…,u(s<sub>n</sub>);这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区