行人交通数据的数据预处理方法,申请号CN201110109326.4-传众专利搜索

发明名称	行人交通数据的数据预处理方法
摘要	本发明为一种行人交通数据的数据预处理方法，包括：步骤S1：采集行人交通数据；步骤S2：对行人交通数据进行时间尺度合成；步骤S3：对步骤S2后的行人交通数据进行丢失数据识别与修复；步骤S4：对步骤S3后的行人交通数据进行错误数据识别与修复；步骤S5：对步骤S4后的行人交通数据进行后续处理。通过本发明可以提高行人交通数据预测的精度。
申请公布号	CN102184638B	申请公布日期	2013.07.10
申请号	CN201110109326.4	申请日期	2011.04.28
申请人	北京市劳动保护科学研究所	发明人	倪慧荟;胡成;李伟;李明涛;姚晓晖;李凤;庞雷;刘晓琴;沈达;王尧
分类号	G08G1/01(2006.01)I	主分类号	G08G1/01(2006.01)I
代理机构	北京律诚同业知识产权代理有限公司 11006	代理人	梁挥
主权项	1.一种行人交通数据的数据预处理方法，其特征在于，包括：步骤S1：采集行人交通数据；步骤S2：对行人交通数据进行时间尺度合成；步骤S3：对步骤S2合成的行人交通数据进行丢失数据识别与修复；步骤S4：对步骤S3后的行人交通数据进行错误数据识别与修复；步骤S5：对步骤S4后的行人交通数据进行后续处理；其中，所述丢失数据识别与修复步骤包括下述步骤：S31、识别行人交通是否丢失数据；S32、若是，则判断是否在异常行人交通阶段发生数据丢失；S33、若是，则利用横向时间序列，采用移动平均模型进行丢失数据修复；S34、若否，而是在正常行人交通阶段发生数据丢失，则利用纵向时间序列，采用移动平均模型进行丢失数据修复；在步骤S33中，发生异常交通状态阶段数据丢失时，利用横向时间序列，采用移动平均模型进行丢失数据修复的公式为：<img file="FDA00002375964100011.GIF" wi="385" he="114" />其中z(t)为当前采样时间间隔的丢失行人交通数据修复值；z(t-i)为当前采样时间间隔之前第i个采样时间间隔的行人交通数据实测值；n为丢失数据修复所选关联时间间隔数量；在步骤S34中，发生正常交通状态阶段数据丢失时，利用纵向时间序列，采用移动平均模型进行丢失数据修复的公式为：<img file="FDA00002375964100012.GIF" wi="372" he="120" />其中z(t)为当前采样时间间隔的丢失行人交通数据修复值；z<sup>K</sup>(t)为行人交通数据长期发展模式所含当天前面第K个历史数据；N为行人交通数据长期发展模式所含历史数据数量；所述步骤S4的错误数据识别与修复方法为：S41、识别行人交通错误数据；S42、利用纵向时间序列，采用移动平均模型对步骤S41识别的错误数据进行修复；步骤S41的数据识别是采用正确数据的识别范围进行识别，正确数据则符合公式[max(0,μ-eσ),μ+eσ]计算的范围，式中μ为行人交通数据长期发展模式所含历史数据的均值；σ为行人交通数据长期发展模式所含历史数据的标准差；e为倍数；如果行人交通数据长期发展模式所含历史数据均相等，即标准差为0，则将σ赋值为σ<sub>0</sub>，σ<sub>0</sub>=f·μ，式中f为μ值的缩放系数；所述步骤S2中时间尺度合成的方法为：采用累加的方式对流量数据进行时间尺度合成，公式为<img file="FDA00002375964100021.GIF" wi="373" he="126" />式中q(t)为时间尺度合成之后当前采样时间间隔的流量数据实测值；q′(t-k)为时间尺度合成之前当前采样时间间隔前面第k个时间间隔的流量数据实测值；n<sub>q</sub>为流量数据合成大小时间尺度之比；同时采用平均的方式对区域人数数据进行时间尺度合成，公式为<img file="FDA00002375964100022.GIF" wi="435" he="125" />式中a(t)为时间尺度合成之后当前采样时间间隔的区域人数数据实测值；a′(t-k)为时间尺度合成之前当前采样时间间隔前面第k个时间间隔的区域人数数据实测值；n<sub>a</sub>为区域人数数据合成大小时间尺度之比。
地址	100054 北京市宣武区陶然亭路55号