发明名称 一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法
摘要 本发明提供了一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于:融合刷卡系统和GPS行车记录系统的数据资源,基于自适应随机搜索算法获取最佳时间推移量,以消除刷卡系统与GPS行车记录系统之间的时间差,从而实现IC卡刷卡站点匹配。该IC卡刷卡站点匹配方法既不需要调整和更改设备也不需要添加设备,运算量少,运算速度快,可有效实现IC卡号与刷卡发生站点相互匹配,有利于客流量统计和数据挖掘。
申请公布号 CN105574137A 申请公布日期 2016.05.11
申请号 CN201510937332.7 申请日期 2015.12.15
申请人 华南理工大学 发明人 翁小雄;刘永鑫;呙娟;张腾月
分类号 G06F17/30(2006.01)I;G07C5/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 霍健兰;李卫东
主权项 一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,包括以下步骤:第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tj<sub>a</sub>和出站时间戳tc<sub>a</sub>;分别获取各个站点标识码的停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>];其中,t<sub>margin</sub>为刷卡站点匹配算法允许的时间误差量;第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量t<sub>1</sub>,t<sub>2</sub>,...,t<sub>k</sub>;第三步,分别按时间推移量t<sub>1</sub>,t<sub>2</sub>,...,t<sub>k</sub>对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率r<sub>1</sub>,r<sub>2</sub>,...,r<sub>k</sub>;比较k个匹配成功率r<sub>1</sub>,r<sub>2</sub>,...,r<sub>k</sub>的大小,获得最大值并记录为最大匹配成功率r<sub>m</sub>;其中,m≤k;并将r<sub>m</sub>对应的时间推移量记录为t<sub>m</sub>;第四步,计算r<sub>m</sub>对应的时间推移测试量t<sub>t</sub>:t<sub>t</sub>=t<sub>m</sub>±Δ;其中,Δ为偏移测试值;将刷卡时间样本集合按时间推移测试量t<sub>t</sub>进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率r<sub>t</sub>;第五步,判断匹配测试成功率r<sub>t</sub>与最大匹配成功率r<sub>m</sub>的大小:若r<sub>t</sub>=r<sub>m</sub>,则判定t<sub>m</sub>为最优时间推移量,跳至第六步;否则将r<sub>m</sub>进行衰减;在时间推移量解空间中生成下一批k个时间推移量,t<sub>1</sub>,t<sub>2</sub>,...,t<sub>k</sub>,跳至第三步;第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>]进行匹配,以实现IC卡号与站点标识码a之间的匹配。
地址 510640 广东省广州市天河区五山路381号