主权项 |
1、一种基于公交IC卡线路的匹配方法,包括:公交IC卡线路号的匹配、车辆行驶方向匹配、以及基于聚类分析的上车站点判断;其特征在于:所述的公交IC卡线路号的匹配,包括以下步骤:步骤1.1:按公交公司分类,并提取各公司的线路号,定义从公交IC卡中提取的该公司的线路总数为X1,实际现有的运营公交线路为X2;步骤1.2:将提取各公司的线路号与实际公司拥有的运营公交线路进行比较,然后进行初步匹配;若X1<X2则说明IC卡记录的线路数小于实际运营的线路,则导入的原始数据出现问题,返回步骤1,重新检查导入数据;若X1=X2,则将提取的线路号与公司现有的线路作比较,线路号相同则匹配成功,对未成功匹配的线路和剩余未匹配的实际公司线路数进行二次匹配;若X1>X2,则将提取的线路号与公司现有的线路作比较,线路号相同则匹配成功,初步剔除刷卡为少量记录的未匹配线路;步骤1.3:依据公交IC卡站点属性、车辆号、司机号的属性对未匹配线路进行二次匹配;按照IC卡中单双次刷卡等属性匹配公司剩余线路数;对于双次刷卡可通过上、下车站号的总站数匹配,对于单次刷卡线路则利用对其刷卡时间进行聚类分析得出站点总数,辅助线路号的匹配;IC卡每条记录都有车辆号、司机号的信息,配合公交线路行车计划表对线路进行匹配;所述的车辆行驶方向匹配,包括:正常的车辆的发车时间和起始站点、延误而不能按时到达终点站的调度运营信息、临时调整发车的班次、司售人员工号、时间、起始站点信息的数据库;具体包括以下步骤:2.1:匹配司机编号;2.2:匹配售票员编号;2.3:根据发车计划表、调度运营信息表确定起始站点;2.4:增加IC卡数据中车辆行驶方向的信息;所述的基于聚类分析的上车站点判断,包括:运用时间聚类方法将乘坐同一车次乘客的刷卡记录聚合成为一组;如果线路上每一个站点均有乘客刷卡,则产生的各组数据与公交线路沿途站点一一对应;根据公交一卡通数据的刷卡时间记录,线路编号、车辆编号与公交调度信息表发生多对一的关系;跟据不同站点间刷卡时间差对刷卡数据进行聚类分析,选取合适的时间差阈值;依据时间差阈值的选取,对上车站点进行识别。 |