主权项 |
一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,包括以下步骤:第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tj<sub>a</sub>和出站时间戳tc<sub>a</sub>;分别获取各个站点标识码的停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>];其中,t<sub>margin</sub>为刷卡站点匹配算法允许的时间误差量;第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量t<sub>1</sub>,t<sub>2</sub>,...,t<sub>k</sub>;第三步,分别按时间推移量t<sub>1</sub>,t<sub>2</sub>,...,t<sub>k</sub>对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率r<sub>1</sub>,r<sub>2</sub>,...,r<sub>k</sub>;比较k个匹配成功率r<sub>1</sub>,r<sub>2</sub>,...,r<sub>k</sub>的大小,获得最大值并记录为最大匹配成功率r<sub>m</sub>;其中,m≤k;并将r<sub>m</sub>对应的时间推移量记录为t<sub>m</sub>;第四步,计算r<sub>m</sub>对应的时间推移测试量t<sub>t</sub>:t<sub>t</sub>=t<sub>m</sub>±Δ;其中,Δ为偏移测试值;将刷卡时间样本集合按时间推移测试量t<sub>t</sub>进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率r<sub>t</sub>;第五步,判断匹配测试成功率r<sub>t</sub>与最大匹配成功率r<sub>m</sub>的大小:若r<sub>t</sub>=r<sub>m</sub>,则判定t<sub>m</sub>为最优时间推移量,跳至第六步;否则将r<sub>m</sub>进行衰减;在时间推移量解空间中生成下一批k个时间推移量,t<sub>1</sub>,t<sub>2</sub>,...,t<sub>k</sub>,跳至第三步;第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tj<sub>a</sub>‑t<sub>margin</sub>,tc<sub>a</sub>+t<sub>margin</sub>]进行匹配,以实现IC卡号与站点标识码a之间的匹配。 |