发明名称 一种城市道路路段动态交通流基础数据的预处理方法
摘要 一种城市道路路段动态交通流基础数据的预处理方法,包括步骤:动态获取交通流基础数据并进行时间规整;分车道交通流基础数据有效性检验;分车道交通流基础数据时间汇集;分车道交通流基础数据单个车辆行驶方向断面空间汇集;单个车辆行驶方向断面动态交通流缺失数据估计。本发明基于固定式车辆检测器采集数据特点,采用阈值法结合交通流理论的基本思想,提供了一套数据有效性检验方法;针对不同的数据缺失模式,合理利用历史数据,最大限度地保证数据的连续性和完整性;数据预处理涉及的算法同时兼顾实时性和准确性的要求,数据分析处理能力较强,对城市智能运输系统建设、提高道路交通信息化水平、改善道路运营管理水平有积极意义。
申请公布号 CN102800197B 申请公布日期 2014.07.16
申请号 CN201210045464.5 申请日期 2012.02.27
申请人 东南大学 发明人 夏井新;黄卫;陆振波;张韦华;安成川;聂庆慧
分类号 G08G1/01(2006.01)I 主分类号 G08G1/01(2006.01)I
代理机构 南京天翼专利代理有限责任公司 32112 代理人 朱戈胜
主权项 一种城市道路路段动态交通流基础数据的预处理方法,其特征是包括如下步骤:1)以一定时间间隔获取固定式车辆检测器采集的分车道交通流基础数据,规整数据的时间戳属性为最近相邻的整分钟时刻;2)分车道交通流基础数据有效性检验,依次对各车道的交通流基础数据进行有效性检验:2‑1)数据非空检验,若数据为空,则标记为无效数据,转入步骤2‑7);2‑2)日期时间戳有效性检验,若为日期时间戳错误数据,则标记为无效数据,转入步骤2‑7);2‑3)非重复数据检验,若为重复数据,则标记为无效数据,转入步骤2‑7);2‑4)车辆存在检验,若交通流基础数据属性变量值均为零,则标记为无效数据,转入步骤2‑7);2‑5)单车道交通流基础数据阈值法检验;2‑6)单车道交通流基础数据交通流理论法检验;2‑7)若所有车道交通流基础数据均已完成有效性检验,则转入步骤3),否则进行下一车道交通流基础数据有效性检验;3)判断原始数据累计采集时间间隔是否等于汇集时间间隔,若满足,则将原始数据累计采集时间间隔归零,并转入步骤4);4)分车道交通流基础数据时间汇集,即得到各车道汇集时间间隔的有效交通流基础数据;5)分车道交通流基础数据单个车辆行驶方向断面空间汇集,若空间汇集结果为有效数据,即得到单个车辆行驶断面汇集时间间隔的有效交通流基础数据,若空间汇集结果为无效数据,则将其视为缺失数据,转入步骤6);6)单个车辆行驶方向断面交通流缺失数据估计,即得到单个车辆行驶断面汇集时间间隔的估计交通流基础数据:6‑1)判断连续缺失时间间隔,若时间间隔小于15分钟,则转入步骤6‑2),否则转入步骤6‑3);6‑2)采用随机漫步法估计缺失数据;6‑3)若连续缺失时间间隔大于等于15分钟,小于等于30分钟,则转入步骤6‑4),否则转入步骤6‑5);6‑4)采用历史平均结合实时调整法估计缺失数据;6‑5)采用历史平均法估计缺失数据;步骤2‑5)中,单车道交通流基础数据阈值法检验的方法如下:a)交通流量阈值检验,若超过阈值范围,则标记为无效数据,转入步骤2‑7);b)车辆行驶平均速度阈值检验,若超过阈值范围,则标记为无效数据,转入步骤2‑7);c)平均时间占有率阈值检验,若超过阈值范围,则标记为无效数据,转入步骤2‑7);d)相邻速度变化率阈值检验,若超过阈值范围,则标记为无效数据,转入步骤2‑7),其中相邻时间间隔(t‑1,t)速度变化率τ<sub>t‑1,t</sub>的计算公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>&tau;</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>t</mi></mrow></msub><mo>=</mo><mi>Min</mi><mo>{</mo><mfrac><msub><mi>X</mi><mi>t</mi></msub><msub><mi>X</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msub></mfrac><mo>,</mo><mfrac><msub><mi>X</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msub><msub><mi>X</mi><mi>t</mi></msub></mfrac><mo>}</mo></mrow>]]></math><img file="FDA0000509357880000021.GIF" wi="488" he="159" /></maths>式中,X<sub>t</sub>——表示车辆行驶平均速度序列,t=1,2,3…;相邻速度变化率阈值检验的对象为快速路交通流基础数据;上述步骤a)~d)中,各阈值范围需要基于历史交通流基础数据的统计来进行标定;步骤2‑6)中,单车道交通流基础数据交通流理论法检验的方法如下:a)判断是否满足车辆行驶平均速度值等于零而交通流量值不等于零,若满足,则标记为无效数据,转入步骤2‑7);b)判断是否满足交通流量值等于零而车辆行驶平均速度值不等于零,若满足,则标记为无效数据,转入步骤2‑7);c)判断是否满足交通流量值和车辆行驶平均速度值都等于零而平均时间占有率值不等于零,若满足,则标记为无效数据,转入步骤2‑7);d)判断是否满足平均时间占有率值为零而交通流量值大于最大可能交通量值,若满足,则标记为无效数据,转入步骤2‑7),其中最大可能交通量q<sub>max</sub>的计算公式如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>q</mi><mi>max</mi></msub><mo>=</mo><mfrac><mrow><mn>10</mn><mo>&times;</mo><mi>v</mi><mo>&times;</mo><msub><mi>&Delta;</mi><mi>o</mi></msub></mrow><mi>l</mi></mfrac></mrow>]]></math><img file="FDA0000509357880000022.GIF" wi="359" he="130" /></maths>式中,q<sub>max</sub>——表示原始数据采集时间间隔内平均时间占有率为零时的最大可能交通量,单位为辆/小时;v——表示车辆行驶平均速度,单位为千米/小时;Δ<sub>o</sub>——表示平均时间占有率精度,单位为%;l——表示行驶车辆平均有效车长,单位为米;e)判断车道交通流密度计算值是否超过最大交通流密度,若满足,则标记为无效数据,转入步骤2‑7),其中车道交通流密度k的计算公式如下:k=q/v式中,k——表示车道交通流密度,单位为辆/车道/千米;q——表示车道交通流量,单位为辆/小时;v——表示车辆行驶平均速度,单位为千米/小时;最大交通流密度需要基于历史交通流基础数据的统计来进行标定;f)若平均时间占有率不为零,判断平均有效车长计算值是否超过一定的阈值范围,若满足,则标记该数据记录为无效,转入步骤2‑7),其中平均有效车长l的计算公式如下:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>l</mi><mo>=</mo><mfrac><mrow><mn>10</mn><mo>&times;</mo><mi>o</mi><mo>&times;</mo><mi>v</mi></mrow><mi>q</mi></mfrac></mrow>]]></math><img file="FDA0000509357880000031.GIF" wi="264" he="140" /></maths>式中,l——表示平均有效车长,单位为米;o——表示平均时间占有率,单位为%;v——表示车辆行驶平均速度单位为千米/小时;q——表示车道交通流量,单位为辆/小时;平均有效车长阈值范围需要基于历史交通流基础数据的统计和交通流构成进行标定;所述步骤4)中,时间汇集指的是在有效性检验的基础上,将原始数据采集时间间隔的分车道交通流基础数据汇集成较长时间间隔的分车道交通流基础数据,具体方法为:依次对各车道的交通流基础数据进行时间汇集,若汇集时间间隔内不存在有效数据,则标记该车道时间汇集结果为无效数据,若存在有效数据,则单车道交通流基础数据时间汇集计算公式如下:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>q</mi><mi>T</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>q</mi><mi>i</mi></msub><mo>&times;</mo><mfrac><mi>N</mi><mi>n</mi></mfrac></mrow>]]></math><img file="FDA0000509357880000032.GIF" wi="305" he="136" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>v</mi><mi>T</mi></msub><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>q</mi><mi>i</mi></msub><mo>&times;</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>q</mi><mi>i</mi></msub></mrow></mfrac></mrow>]]></math><img file="FDA0000509357880000033.GIF" wi="331" he="266" /></maths><maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>o</mi><mi>T</mi></msub><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>o</mi><mi>i</mi></msub></mrow><mi>n</mi></mfrac></mrow>]]></math><img file="FDA0000509357880000041.GIF" wi="226" he="194" /></maths>式中,q<sub>T</sub>——表示较长时间间隔T内车道交通流量,单位为辆/小时;q<sub>i</sub>——表示较长时间间隔T内第i个原始数据采集时间间隔的有效交通流量,单位为辆/小时;n——表示较长时间间隔T内原始数据采集时间间隔的有效数据记录数,N——表示较长时间间隔T内期望的原始数据采集时间间隔数据记录数,v<sub>T</sub>——表示较长时间间隔T内车道车辆行驶平均速度,单位为千米/小时;v<sub>i</sub>——表示较长时间间隔T内第i个原始数据采集时间间隔的有效车辆行驶平均速度,单位为千米/小时;o<sub>T</sub>——表示较长时间间隔T内车道平均时间占有率,单位为%;o<sub>i</sub>——表示较长时间间隔T内第i个原始数据采集时间间隔的有效时间占有率,单位为%;所述步骤5)中,空间汇集指的是在时间汇集基础上,将分车道交通流基础数据汇集成单个车辆行驶方向断面的交通流基础数据,具体方法如下:a)若进行空间汇集的分车道交通流基础数据均为无效数据,则标记该单个车辆行驶方向断面空间汇集结果为无效数据,若存在有效数据,则转入b);b)基于有效数据的分车道交通流基础数据空间汇集计算公式如下:<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mover><mi>q</mi><mo>&OverBar;</mo></mover><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>q</mi><mi>j</mi></msub><mo>&times;</mo><mfrac><mi>M</mi><mi>m</mi></mfrac></mrow>]]></math><img file="FDA0000509357880000042.GIF" wi="303" he="142" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><mover><mi>v</mi><mo>&OverBar;</mo></mover><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mrow><mo>(</mo><msub><mi>q</mi><mi>j</mi></msub><mo>&times;</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>q</mi><mi>j</mi></msub></mrow></mfrac></mrow>]]></math><img file="FDA0000509357880000043.GIF" wi="324" he="277" /></maths><maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><mover><mi>o</mi><mo>&OverBar;</mo></mover><mo>=</mo><mfrac><mrow><mover><mi>q</mi><mo>&OverBar;</mo></mover><mo>&times;</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mrow><mo>(</mo><mfrac><mrow><msub><mi>o</mi><mi>j</mi></msub><mo>&times;</mo><msub><mi>v</mi><mi>j</mi></msub><mo>/</mo><msub><mi>q</mi><mi>j</mi></msub></mrow><mi>m</mi></mfrac><mo>)</mo></mrow></mrow><mover><mi>v</mi><mo>&OverBar;</mo></mover></mfrac></mrow>]]></math><img file="FDA0000509357880000044.GIF" wi="482" he="209" /></maths>式中,<img file="FDA0000509357880000045.GIF" wi="45" he="65" />——表示单个车辆行驶方向断面交通流量,单位为辆/小时;q<sub>j</sub>——表示第j个车道的有效交通流量,单位为辆/小时;m——表示车道有效数据记录数,M——表示单个车辆行驶方向断面总的车道数,<img file="FDA0000509357880000051.GIF" wi="46" he="54" />——表示单个车辆行驶方向断面车辆行驶平均速度,单位为千米/小时;v<sub>j</sub>——表示第j个车道的有效车辆行驶平均速度,单位为千米/小时;<img file="FDA0000509357880000052.GIF" wi="49" he="58" />——表示单个车辆行驶方向断面平均时间占有率,单位为%;o<sub>j</sub>——表示第j个车道的有效时间占有率,单位为%;所述步骤6‑2)中,随机漫步法估计缺失数据的表达式为:<maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><msub><mover><mi>X</mi><mo>^</mo></mover><mi>t</mi></msub><mo>=</mo><msub><mi>X</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow>]]></math><img file="FDA0000509357880000053.GIF" wi="203" he="92" /></maths>式中,<img file="FDA0000509357880000054.GIF" wi="67" he="84" />——表示t时刻交通流基础数据的估计值,X<sub>t‑1</sub>——表示t‑1时刻交通流基础数据的真实值;所述步骤6‑4)中,历史平均结合实时调整法估计缺失数据的表达式为:<maths num="0011" id="cmaths0011"><math><![CDATA[<mrow><msub><mover><mi>X</mi><mo>^</mo></mover><mrow><mi>t</mi><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub><mo>=</mo><msub><mi>X</mi><mrow><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub><mo>&times;</mo><mfrac><msub><mrow><mi>HIST</mi><mover><mi>X</mi><mo>^</mo></mover></mrow><mrow><mi>t</mi><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub><mrow><mi>HIST</mi><msub><mover><mi>X</mi><mo>^</mo></mover><mrow><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub></mrow></mfrac></mrow>]]></math><img file="FDA0000509357880000055.GIF" wi="593" he="173" /></maths><maths num="0012" id="cmaths0012"><math><![CDATA[<mrow><mi>HIST</mi><msub><mover><mi>X</mi><mo>^</mo></mover><mrow><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub><mo>=</mo><mo>[</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>X</mi><mrow><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msub><mi>d</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mi>j</mi><mo>)</mo></mrow></msub></mrow></msub><mo>]</mo><mo>/</mo><mi>K</mi></mrow>]]></math><img file="FDA0000509357880000056.GIF" wi="650" he="156" /></maths><maths num="0013" id="cmaths0013"><math><![CDATA[<mrow><mi>HIST</mi><msub><mover><mi>X</mi><mo>^</mo></mover><mrow><mi>t</mi><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub><mo>=</mo><mo>[</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mover><mi>X</mi><mo>^</mo></mover><mrow><mi>t</mi><mo>,</mo><msub><mi>d</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mi>j</mi><mo>)</mo></mrow></msub></mrow></msub><mo>]</mo><mo>/</mo><mi>K</mi></mrow>]]></math><img file="FDA0000509357880000057.GIF" wi="559" he="150" /></maths>式中,<img file="FDA0000509357880000058.GIF" wi="96" he="95" />——表示第d<sub>i</sub>天t时刻交通流基础数据的估计值,<img file="FDA00005093578800000516.GIF" wi="139" he="65" />——表示第d<sub>i</sub>天t‑1时刻交通流基础数据的真实值,<img file="FDA0000509357880000059.GIF" wi="252" he="94" />和<img file="FDA00005093578800000510.GIF" wi="202" he="110" />——分别表示为第d<sub>i</sub>天t‑1和t时刻交通流基础数据的历史平均值,<img file="FDA00005093578800000511.GIF" wi="191" he="82" />和<img file="FDA00005093578800000512.GIF" wi="134" he="86" />——分别表示第d<sub>(i‑j)</sub>天t‑1和t时刻交通流基础数据的真实值,K——表示固定时间窗口长度;所述步骤6‑5)中,历史平均法估计缺失数据的表达式为:<maths num="0014" id="cmaths0014"><math><![CDATA[<mrow><msub><mover><mi>X</mi><mo>^</mo></mover><mrow><mi>t</mi><mo>,</mo><msub><mi>d</mi><mi>i</mi></msub></mrow></msub><mo>=</mo><mo>[</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>X</mi><mrow><mi>t</mi><mo>,</mo><msub><mi>d</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mi>j</mi><mo>)</mo></mrow></msub></mrow></msub><mo>]</mo><mo>/</mo><mi>K</mi></mrow>]]></math><img file="FDA00005093578800000513.GIF" wi="462" he="150" /></maths>式中,<img file="FDA00005093578800000514.GIF" wi="103" he="93" />——表示第d<sub>i</sub>天t时刻交通流基础数据的估计值,<img file="FDA00005093578800000515.GIF" wi="156" he="85" />——表示第d<sub>(i‑j)</sub>天的t时刻交通流基础数据的真实值,K——表示固定时间窗口长度。
地址 211189 江苏省南京市江宁开发区东南大学路2号