发明名称 一种基于时空相关性的交通流量数据恢复方法
摘要 本发明公开了一种基于时空相关性的交通流量数据恢复方法。该方法包括前期交通数据转换、异常数据筛选方法和后续的交通流数据恢复方法。其中数据筛选方法,根据实际交通流数据的异常情况涉及了阈值筛选、零数据筛选和质量筛选法。然后根据交通流数据在时间上和空间上的相关性,结合时间序列法和多元线性回归法,即基于时间相关性和空间相关性的数据恢复方法,设计了基于时空相关性的综合交通流数据恢复方法。本发明方法简单快速,能够满足实时处理的要求,且所得结果的精确度高。
申请公布号 CN103971520B 申请公布日期 2015.11.18
申请号 CN201410154792.8 申请日期 2014.04.17
申请人 浙江大学 发明人 宋春跃;吴俏;沈国江;王慧
分类号 G08G1/01(2006.01)I;G06F19/00(2011.01)I 主分类号 G08G1/01(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 一种基于时空相关性的交通流量数据恢复方法,其特征在于该方法包括以下步骤:步骤(1).交通流量数据格式转换:将检测点由车辆检测器检测得到的原始交通流量数据q<sub>orig</sub>单位换算成标准小时流量数据,然后对该标准小时流量数据进行加权平均转换成固定周期T的交通流量数据集q;所述的固定周期T的交通流量数据集q={q(1),…,q(k),…,q(n)};q(k)表示k时间段的交通流量数据,其中k=1,2,…,n,<img file="FDA0000772039980000011.GIF" wi="237" he="139" />所述的标准小时流量数据表示单位为车辆/小时的交通流量数据;步骤(2).交通流量数据筛选2.1阈值筛选:对步骤(1)得到的固定周期T的交通流量数据集q进行阈值筛选,即对交通流量数据集q中的交通流量数据q(k)进行逐个比较,根据公式(1)进行筛选,剔除交通流量数据集q中不符合公式(1)的数据:0<q(k)<Q<sub>max</sub>   (1);Q<sub>max</sub>=f<sub>c</sub>×C   (2);其中阈值Q<sub>max</sub>的单位为veh/h;C表示车道的基本通行能力,单位为veh/h;f<sub>c</sub>为常数;2.2零数据筛选:对步骤2.1筛选后得到的交通流量数据集进行零数据筛选,具体步骤如下:根据泊松分布原理得到时间间隔t内到达车辆数的概率P(x)见公式(3):<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msup><mrow><mo>(</mo><mi>&lambda;</mi><mi>t</mi><mo>)</mo></mrow><mi>x</mi></msup><msup><mi>e</mi><mrow><mo>-</mo><mi>&lambda;</mi><mi>t</mi></mrow></msup></mrow><mrow><mi>x</mi><mo>!</mo></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000021.GIF" wi="728" he="166" /></maths>式中P(x)为时间间隔t内到达x辆车的概率,x为自然数;λt为时间间隔t内平均到达的车辆数;若置信水平α=0.01,采样间隔内有车辆通过,即x>0的概率为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><mi>x</mi><mo>&gt;</mo><mn>0</mn><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><mi>P</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mrow><msup><mrow><mo>(</mo><mi>&lambda;</mi><mi>t</mi><mo>)</mo></mrow><mn>0</mn></msup><msup><mi>e</mi><mrow><mo>-</mo><mi>&lambda;</mi><mi>t</mi></mrow></msup></mrow><mrow><mn>0</mn><mo>!</mo></mrow></mfrac><mo>=</mo><mn>0.99</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000022.GIF" wi="1117" he="184" /></maths>由此可得:λt≈4.6(veh/(tmin))   (5);<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>Q</mi><mn>0</mn></msub><mo>=</mo><mi>&lambda;</mi><mi>t</mi><mo>&times;</mo><mfrac><mn>60</mn><mi>t</mi></mfrac><mrow><mo>(</mo><mi>v</mi><mi>e</mi><mi>h</mi><mo>/</mo><mi>h</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000023.GIF" wi="743" he="149" /></maths>其中Q<sub>0</sub>表示时间间隔t内的标准小时交通流量数据;若时间间隔t等于固定周期T,当k时段的历史平均交通流量<img file="FDA0000772039980000024.GIF" wi="135" he="101" />大于Q<sub>0</sub>,且实际检测到的交通流量数据q(k)显示为零时,则从步骤2.1筛选后得到的交通流量数据集中筛选出该数据,如公式(7)所示:<img file="FDA0000772039980000025.GIF" wi="761" he="209" />2.3质量筛选:对步骤2.2筛选后的交通流量数据集进行质量筛选,剔除不符合式(8)的数据;<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>min</mi><mo>{</mo><mover><mi>q</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mn>2</mn><msub><mi>&sigma;</mi><mi>q</mi></msub><mo>,</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><mover><mi>d</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mn>2</mn><msub><mi>&sigma;</mi><mi>d</mi></msub><mo>}</mo><mo>&le;</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>&le;</mo><mi>max</mi><mo>{</mo><mover><mi>q</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>+</mo><mn>2</mn><msub><mi>&sigma;</mi><mi>q</mi></msub><mo>,</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><mover><mi>d</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>+</mo><mn>2</mn><msub><mi>&sigma;</mi><mi>d</mi></msub><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000026.GIF" wi="1956" he="198" /></maths>其中<img file="FDA0000772039980000027.GIF" wi="126" he="112" />为k时段的历史平均交通流量,σ<sub>q</sub>为<img file="FDA0000772039980000028.GIF" wi="127" he="101" />的方差;<img file="FDA0000772039980000029.GIF" wi="138" he="99" />为k时段与k‑1时段的流量平均差值,σ<sub>d</sub>为<img file="FDA00007720399800000210.GIF" wi="122" he="97" />的方差;步骤(3).交通流量数据恢复:3.1利用基于时间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据的预测值:首先采用简单移动平均法构造时间序列模型以得到步骤(2)筛选后的交通流量数据中缺失数据车道流量数据的预测值<img file="FDA0000772039980000031.GIF" wi="193" he="102" />见公式(9):<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mover><mi>q</mi><mo>^</mo></mover><mi>T</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>2</mn><mo>)</mo></mrow><mo>+</mo><mo>...</mo><mo>+</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mrow><mi>n</mi></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000032.GIF" wi="1285" he="137" /></maths>其中n为移动平均个数;3.2利用基于空间相关性的交通流量数据恢复方法,得到缺失数据车道流量数据预测值:首先采用多元线性回归分析,以步骤(2)筛选后的交通流量数据中缺失数据车道流量数据检测点交叉口的上下游交叉口的交通流量数据为自变量,建立多元回归模型,得到当前交叉口交通流量预测值<img file="FDA0000772039980000036.GIF" wi="152" he="107" />然后<img file="FDA0000772039980000037.GIF" wi="129" he="102" />乘以数据缺失车道j在该时段k的车道占有率f<sub>j</sub>(k),得到缺失数据车道流量数据预测值<img file="FDA0000772039980000038.GIF" wi="192" he="115" />见公式(10);<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mover><mi>q</mi><mo>^</mo></mover><mi>S</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mover><mi>Q</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>&times;</mo><msub><mi>f</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000033.GIF" wi="902" he="129" /></maths>若上游交叉口有a个方向车流驶向检测路段,同时有驶出路段的车辆分b个方向驶向下游交叉口,则共有i=a+b个自变量Q<sub>1</sub>(k)、Q<sub>2</sub>(k)、……、Q<sub>i</sub>(k);<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mover><mi>Q</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>&beta;</mi><mn>0</mn></msub><mo>+</mo><msub><mi>&beta;</mi><mn>1</mn></msub><msub><mi>Q</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>&beta;</mi><mn>2</mn></msub><msub><mi>Q</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>+</mo><mo>...</mo><mo>+</mo><msub><mi>&beta;</mi><mi>i</mi></msub><msub><mi>Q</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>11</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000034.GIF" wi="1405" he="122" /></maths>式中β<sub>0</sub>、……、β<sub>i</sub>为回归系数;<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>f</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>Hq</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mrow><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>Hq</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>12</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000035.GIF" wi="789" he="229" /></maths>式中<img file="FDA0000772039980000039.GIF" wi="186" he="98" />表示数据缺失车道j在时段k内的历史交通流量,m为检测点车道数;3.3利用基于时空相关性的交通流量数据恢复方法,得到最终的缺失数据车道流量数据恢复值:根据公式(13)、(14)计算上述步骤3.1、3.2两模型预测值的百分比相对误差R<sub>T</sub>和R<sub>S</sub>,并根据公式(15)确定综合模型的权重系数θ;<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msub><mi>R</mi><mi>T</mi></msub><mo>=</mo><mrow><mo>(</mo><mo>|</mo><mrow><msub><mover><mi>q</mi><mo>^</mo></mover><mi>T</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>|</mo><mo>/</mo><mi>q</mi><mo>(</mo><mi>k</mi><mo>)</mo><mo>)</mo></mrow><mo>&times;</mo><mn>100</mn><mi>%</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>13</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000041.GIF" wi="1194" he="130" /></maths><maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><msub><mi>R</mi><mi>S</mi></msub><mo>=</mo><mrow><mo>(</mo><mo>|</mo><mrow><msub><mover><mi>q</mi><mo>^</mo></mover><mi>S</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>|</mo><mo>/</mo><mi>q</mi><mo>(</mo><mi>k</mi><mo>)</mo><mo>)</mo></mrow><mo>&times;</mo><mn>100</mn><mi>%</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>14</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000042.GIF" wi="1281" he="140" /></maths><maths num="0011" id="cmaths0011"><math><![CDATA[<mrow><mi>&theta;</mi><mo>=</mo><mfrac><msub><mi>R</mi><mi>T</mi></msub><mrow><msub><mi>R</mi><mi>T</mi></msub><mo>+</mo><msub><mi>R</mi><mi>S</mi></msub></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>15</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000043.GIF" wi="670" he="179" /></maths>最后根据式(16)得到最终的缺失数据车道流量数据恢复值;<maths num="0012" id="cmaths0012"><math><![CDATA[<mrow><mover><mi>q</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mi>&theta;</mi><mover><msub><mi>q</mi><mi>T</mi></msub><mo>^</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>&theta;</mi><mo>)</mo></mrow><mover><msub><mi>q</mi><mi>S</mi></msub><mo>^</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>16</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000772039980000044.GIF" wi="934" he="100" /></maths>步骤4.根据公式(17)将步骤3得到的最终的缺失数据车道流量数据恢复值<img file="FDA0000772039980000045.GIF" wi="116" he="108" />补充至步骤2筛选后的交通流量数据集中;<img file="FDA0000772039980000046.GIF" wi="776" he="212" />
地址 310027 浙江省杭州市西湖区浙大路38号