发明名称 行人交通数据的数据预处理方法
摘要 本发明为一种行人交通数据的数据预处理方法,包括:步骤S1:采集行人交通数据;步骤S2:对行人交通数据进行时间尺度合成;步骤S3:对步骤S2后的行人交通数据进行丢失数据识别与修复;步骤S4:对步骤S3后的行人交通数据进行错误数据识别与修复;步骤S5:对步骤S4后的行人交通数据进行后续处理。通过本发明可以提高行人交通数据预测的精度。
申请公布号 CN102184638B 申请公布日期 2013.07.10
申请号 CN201110109326.4 申请日期 2011.04.28
申请人 北京市劳动保护科学研究所 发明人 倪慧荟;胡成;李伟;李明涛;姚晓晖;李凤;庞雷;刘晓琴;沈达;王尧
分类号 G08G1/01(2006.01)I 主分类号 G08G1/01(2006.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 梁挥
主权项 1.一种行人交通数据的数据预处理方法,其特征在于,包括:步骤S1:采集行人交通数据;步骤S2:对行人交通数据进行时间尺度合成;步骤S3:对步骤S2合成的行人交通数据进行丢失数据识别与修复;步骤S4:对步骤S3后的行人交通数据进行错误数据识别与修复;步骤S5:对步骤S4后的行人交通数据进行后续处理;其中,所述丢失数据识别与修复步骤包括下述步骤:S31、识别行人交通是否丢失数据;S32、若是,则判断是否在异常行人交通阶段发生数据丢失;S33、若是,则利用横向时间序列,采用移动平均模型进行丢失数据修复;S34、若否,而是在正常行人交通阶段发生数据丢失,则利用纵向时间序列,采用移动平均模型进行丢失数据修复;在步骤S33中,发生异常交通状态阶段数据丢失时,利用横向时间序列,采用移动平均模型进行丢失数据修复的公式为:<img file="FDA00002375964100011.GIF" wi="385" he="114" />其中z(t)为当前采样时间间隔的丢失行人交通数据修复值;z(t-i)为当前采样时间间隔之前第i个采样时间间隔的行人交通数据实测值;n为丢失数据修复所选关联时间间隔数量;在步骤S34中,发生正常交通状态阶段数据丢失时,利用纵向时间序列,采用移动平均模型进行丢失数据修复的公式为:<img file="FDA00002375964100012.GIF" wi="372" he="120" />其中z(t)为当前采样时间间隔的丢失行人交通数据修复值;z<sup>K</sup>(t)为行人交通数据长期发展模式所含当天前面第K个历史数据;N为行人交通数据长期发展模式所含历史数据数量;所述步骤S4的错误数据识别与修复方法为:S41、识别行人交通错误数据;S42、利用纵向时间序列,采用移动平均模型对步骤S41识别的错误数据进行修复;步骤S41的数据识别是采用正确数据的识别范围进行识别,正确数据则符合公式[max(0,μ-eσ),μ+eσ]计算的范围,式中μ为行人交通数据长期发展模式所含历史数据的均值;σ为行人交通数据长期发展模式所含历史数据的标准差;e为倍数;如果行人交通数据长期发展模式所含历史数据均相等,即标准差为0,则将σ赋值为σ<sub>0</sub>,σ<sub>0</sub>=f·μ,式中f为μ值的缩放系数;所述步骤S2中时间尺度合成的方法为:采用累加的方式对流量数据进行时间尺度合成,公式为<img file="FDA00002375964100021.GIF" wi="373" he="126" />式中q(t)为时间尺度合成之后当前采样时间间隔的流量数据实测值;q′(t-k)为时间尺度合成之前当前采样时间间隔前面第k个时间间隔的流量数据实测值;n<sub>q</sub>为流量数据合成大小时间尺度之比;同时采用平均的方式对区域人数数据进行时间尺度合成,公式为<img file="FDA00002375964100022.GIF" wi="435" he="125" />式中a(t)为时间尺度合成之后当前采样时间间隔的区域人数数据实测值;a′(t-k)为时间尺度合成之前当前采样时间间隔前面第k个时间间隔的区域人数数据实测值;n<sub>a</sub>为区域人数数据合成大小时间尺度之比。
地址 100054 北京市宣武区陶然亭路55号