发明名称 一种基于浮动车数据预测多时段行程时间分布的方法
摘要 本发明公开了一种基于浮动车数据预测多时段行程时间分布的方法,本发明在传统KNN算法的基础上,利用贝叶斯模型的学能力,提高了行程时间预测的鲁棒性和准确性。通过历史数据和实时数据的有效融合,实现了连续多个时段的行程时间均值和方差预测,构建行程时间浮动的置信区间。本发明在各种复杂的城市网络中都能有效预测连续半小时的行程时间分布信息,相比于传统的KNN模型,结果更可靠准确。
申请公布号 CN103927872B 申请公布日期 2015.10.21
申请号 CN201410173814.5 申请日期 2014.04.28
申请人 武汉大学 发明人 陈碧宇;时朝阳;李清泉
分类号 G08G1/01(2006.01)I 主分类号 G08G1/01(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 张火春
主权项 一种基于浮动车数据预测多时段行程时间分布的方法,包括以下步骤:步骤1:以信号灯为标志对路段进行划分,以N分钟为时间间隔对浮动车数据进行划分,其中N≤5;步骤2:通过对GPS采样点进行插值,估计每个路段上每辆浮动车的行程时间;步骤3:利用KNN预测多时段路段行程时间的均值;步骤4:利用贝叶斯学习预测多时段路段行程时间的误差分布;步骤5:生成路段行程时间分布,并在此基础上,预测行程时间区间;其特征在于:步骤3中所述的预测多时段路段行程时间的均值是利用KNN模型预测多时段路段行程时间的均值;所述的利用KNN模型预测多时段路段行程时间的均值,KNN模型在进行单步预测时,已知t时段之前的实时数据R<sub>t</sub>和历史数据<img file="FDA0000770611080000011.GIF" wi="105" he="93" />预测时考虑t‑l时间段到t‑1时间段的数据,其实现方式包括以下子步骤:步骤3.1:判断是否是单步预测,若是,则计算当前状态向量即实时数据R<sub>t</sub>和历史数据<img file="FDA0000770611080000012.GIF" wi="84" he="84" />之间的欧式距离<img file="FDA0000770611080000013.GIF" wi="163" he="81" />然后继续步骤3.2;否则,跳到步骤3.4;步骤3.2:根据欧式距离<img file="FDA0000770611080000014.GIF" wi="129" he="77" />从历史数据<img file="FDA0000770611080000015.GIF" wi="80" he="84" />中选择k‑近邻,然后确定预测的t时间段行程时间的历史状态量;步骤3.3:以欧式距离的倒数作为权重,通过对k‑近邻加权预测t时段行程时间均值<img file="FDA0000770611080000016.GIF" wi="93" he="88" />步骤3.4:令t=t+1,用t时段的预测值<img file="FDA0000770611080000017.GIF" wi="70" he="85" />更新实时数据R<sub>t</sub>,从而对实时数据状态向量和历史数据进行更新,得到R<sub>t+1</sub>和<img file="FDA0000770611080000018.GIF" wi="121" he="83" />判断:如果t&lt;t+p,返回步骤3.1、步骤3.2、步骤3.3和步骤3.4,进行多时段行程时间均值预测,通过对k‑近邻加权预测t+1时间段行程时间均值<img file="FDA0000770611080000019.GIF" wi="126" he="94" />如果t=t+p,预测结束,p表示连续预测的时间段个数。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学