发明名称 基于公交IC卡线路的匹配方法
摘要 本发明公开了一种基于公交IC卡线路的匹配方法,属于公交信息数据处理及集成领域。包括:公交IC卡线路号的匹配、车辆行驶方向匹配、以及基于聚类分析的上车站点判断;依据公交IC卡站点属性、车辆号、司机号的属性对未匹配线路进行多次匹配;根据公交一卡通数据的刷卡时间记录,线路编号、车辆编号与公交调度信息表发生多对一的关系;跟据不同站点间刷卡时间差对刷卡数据进行聚类分析,选取合适的时间差阈值;依据时间差阈值的选取,对上车站点进行识别。对IC卡数据进行筛选、集成、规约等预处理,之后进行深入挖掘,最终获得线路的站点客流。为公交规划者提供规划依据,为公交管理者提供公交运营决策的依据。
申请公布号 CN101540098A 申请公布日期 2009.09.23
申请号 CN200910083306.7 申请日期 2009.04.30
申请人 北京工业大学 发明人 陈艳艳;尹长勇;陈绍辉
分类号 G08G1/00(2006.01)I 主分类号 G08G1/00(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 代理人 张 慧
主权项 1、一种基于公交IC卡线路的匹配方法,包括:公交IC卡线路号的匹配、车辆行驶方向匹配、以及基于聚类分析的上车站点判断;其特征在于:所述的公交IC卡线路号的匹配,包括以下步骤:步骤1.1:按公交公司分类,并提取各公司的线路号,定义从公交IC卡中提取的该公司的线路总数为X1,实际现有的运营公交线路为X2;步骤1.2:将提取各公司的线路号与实际公司拥有的运营公交线路进行比较,然后进行初步匹配;若X1<X2则说明IC卡记录的线路数小于实际运营的线路,则导入的原始数据出现问题,返回步骤1,重新检查导入数据;若X1=X2,则将提取的线路号与公司现有的线路作比较,线路号相同则匹配成功,对未成功匹配的线路和剩余未匹配的实际公司线路数进行二次匹配;若X1>X2,则将提取的线路号与公司现有的线路作比较,线路号相同则匹配成功,初步剔除刷卡为少量记录的未匹配线路;步骤1.3:依据公交IC卡站点属性、车辆号、司机号的属性对未匹配线路进行二次匹配;按照IC卡中单双次刷卡等属性匹配公司剩余线路数;对于双次刷卡可通过上、下车站号的总站数匹配,对于单次刷卡线路则利用对其刷卡时间进行聚类分析得出站点总数,辅助线路号的匹配;IC卡每条记录都有车辆号、司机号的信息,配合公交线路行车计划表对线路进行匹配;所述的车辆行驶方向匹配,包括:正常的车辆的发车时间和起始站点、延误而不能按时到达终点站的调度运营信息、临时调整发车的班次、司售人员工号、时间、起始站点信息的数据库;具体包括以下步骤:2.1:匹配司机编号;2.2:匹配售票员编号;2.3:根据发车计划表、调度运营信息表确定起始站点;2.4:增加IC卡数据中车辆行驶方向的信息;所述的基于聚类分析的上车站点判断,包括:运用时间聚类方法将乘坐同一车次乘客的刷卡记录聚合成为一组;如果线路上每一个站点均有乘客刷卡,则产生的各组数据与公交线路沿途站点一一对应;根据公交一卡通数据的刷卡时间记录,线路编号、车辆编号与公交调度信息表发生多对一的关系;跟据不同站点间刷卡时间差对刷卡数据进行聚类分析,选取合适的时间差阈值;依据时间差阈值的选取,对上车站点进行识别。
地址 100124北京市平乐园100号