发明名称 基于多模式公交数据匹配的公共交通出行特征提取方法
摘要 本发明涉及一种基于多模式公交数据匹配的公共交通出行特征提取方法,引入了公共交通通勤出行链的概念,利用地面公交、轨道交通和公共自行车刷卡数据,公交GPS数据,公共交通站点、线路基础数据等多源数据,通过数据预处理与匹配、公共交通出行链结构提取、通勤出行行为判别、出行阶段起讫点确定和出行特征信息匹配五个步骤,来获取居民通勤出行特征信息,如通勤出行时间、通勤出行距离和换乘特性等。本发明有助于公共交通运营企业和主管部门准确掌握居民通勤出行状况,为城市公共交通线网优化、公共交通政策的制定等提供支持,对提高居民通勤出行效率有重要意义。
申请公布号 CN104766473A 申请公布日期 2015.07.08
申请号 CN201510068077.7 申请日期 2015.02.09
申请人 北京工业大学;北京市交通运行监测调度中心 发明人 翁剑成;张乐典;陈智宏;王月玥;王昌;荣建
分类号 G08G1/01(2006.01)I 主分类号 G08G1/01(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 沈波
主权项 基于多模式公交数据匹配的公共交通出行特征提取方法,其特征在于:所述方法包括以下步骤:步骤1:公共交通多源数据预处理与匹配;步骤2:公共交通出行链结构提取;步骤3:通勤出行行为判别;步骤4:出行阶段起讫点确定;步骤5:出行特征信息匹配;所述步骤1公共交通多源数据预处理与匹配的方法如下,筛选海量数据中的有效数据,改善数据质量,并利用相关字段进行数据整合与关联匹配;(1)公共交通刷卡数据预处理;地面公交、轨道交通和公共自行车三类方式的刷卡数据字段互不相同,而地面公交又分为一票制公交和分段计价公交两类;需根据各类刷卡数据字段的含义,从中提取居民出行相关的用户卡号、交易时间、乘车线路、站点编号等字段,并整合到同一个数据表中;为区分不同刷卡类型,给每类刷卡数据添加唯一的标记:一票制地面公交标记为“B1”,分段计价地面公交标记为“B2”,轨道交通标记为“R”,公共自行车标记为“Z”;整合之后的刷卡数据表的字段如表1所示,信息不全的字段,暂置为空;表1 公共交通刷卡数据整合表字段<img file="FDA0000669753820000011.GIF" wi="1827" he="217" />(2)基于公交GPS数据的公交到站时间确定;基于公交GPS定位数据和公交线路基础数据,通过地图匹配、弧段弥补、站点匹配、行驶方向判别等步骤,获取公交车辆的到达站点的时间;(3)多模式公共交通站点空间关系匹配;由于轨道交通和公共自行车刷卡数据记录了出行起讫点的信息,而地面公交刷卡数据中记录的出行起讫点信息不全,部分上下车站点信息需通过换乘过程去推断;因此,利用地面公交、轨道交通和公共自行车的站点坐标数据,建立了三类公共交通站点的空间关系表,以此来确定居民的换乘过程信息;根据不同类型站点的辐射能力不同,确定的地面公交站点吸引范围为360m,轨道交通站点的吸引范围为770m,公共自行车站点的吸引范围为300m;在各类站点相应的吸引范围阈值内,加之出行的乘车线路等信息,根据换乘距离最短原则,确定换乘过程的上下车站点;公共交通站点空间关系表字段如下所示:表2 公共交通站点空间关系表<img file="FDA0000669753820000021.GIF" wi="1968" he="273" />(4)轨道交通任意站点间行程距离确定;居民在轨道交通内部换乘不需刷卡,这对获取乘客出行路径造成了困难;基于居民出行会选择时间最短方案的假设,通过最短路径搜索,确定已知轨道交通站点OD对之间的最优路径,再根据轨道交通基础数据中任意相邻站点间距离数据,计算得到轨道交通站点任意OD对之间的行程距离;所述步骤2公共交通出行链结构提取的方法如下,公共交通出行链是指从出行起始站点到目的站点,由一个或多个公共交通出行阶段按发生顺序组成的一次完整出行过程;公共交通出行链属于不闭合的单链,可再现出行者每一次公共交通出行的微观过程;出行者一天可出现一条或多条公共交通出行链,一条公共交通出行链可包含一个或多个出行阶段;根据同一用户相邻两条刷卡记录的交易时间差,判断此相邻的两个出行阶段是属于换乘关系还是分属两条不同的出行链,据此对出行者的各出行阶段进行连接或划分,确定出行链的基本结构;由于地面公交、轨道交通和公共自行车三类刷卡数据中所记录的交易时间含义不同:一票制公交(B1)记录了上车时间、分段计价公交(B2)记录了下车时间、轨道交通(R)记录了进站和出站时间、公共自行车(Z)记录了借车和还车时间,因此三类出行方式之间存在14种换乘类型,而每种换乘类型的交易时间差中包含了不同的时间组成部分,如不同交通方式的在途时间、不同换乘过程的换乘时间等,因此每种换乘类型的交易时间差阈值各不相同;14种换乘类型的交易时间差组成及阈值如表3所示:表3 相邻出行阶段换乘时间阈值<img file="FDA0000669753820000022.GIF" wi="2082" he="592" /><img file="FDA0000669753820000031.GIF" wi="2082" he="943" />根据上表中的交易时间差阈值,若相邻两个出行阶段的交易时间在阈值以内,则认为此两个出行阶段之间存在换乘行为,两者属于同一出行链;反之,则认为两者分属于不同的出行链;所述步骤3通勤出行行为判别的方法如下:由于刷卡数据中包含了各种不同出行目的的刷卡记录,因此,需要制定规则筛选出以通勤为目的的出行行为;所述步骤4出行阶段起讫点确定的方法如下,使用轨道交通或公共自行车方式的出行阶段,可根据其刷卡数据中记录的站点编号,加之轨道交通和公共自行车站点的基础信息,两者匹配可获得其完整的进站站点名称和出站站点名称;而地面公交刷卡数据记录的上下车站点信息不完整,要获取地面公交方式的出行阶段的起讫点,需经过以下三个步骤的匹配:(1)基于公交到站时间的公交上车或下车站点匹配;一票制公交的刷卡数据记录了乘客上车时间,分段计价公交的刷卡数据记录了乘客的下车时间,两者与乘客所在公交车辆的到站时间表匹配,可得到一票制公交乘客的上车站点名称以及分段计价公交乘客的下车站点名称;但是,刷卡数据记录的是IC卡系统的时间,而公交车辆到站时间记录的是公交GPS系统的时间,两者存在一定的偏差;并且考虑到乘客下车会提前刷卡、大量乘客排队上车时刷卡过程持续时间长等因素的影响,需要在站点匹配时设置合理的阈值,以保证匹配的成功率与准确率;在分别考虑一票制公交和分段计价公交的平均站距等条件的基础上,确定了如下的阈值:一票制公交2.8min,分段计价公交3.2min;即当一票制公交乘客的上车时间与公交车辆到站时间的差值小于2.8min时,则将公交车辆所到的站点匹配为乘客的上车站点;当分段计价公交乘客的下车时间与公交车辆到站时间的差值小于3.2min时,则将公交车辆所到的站点匹配为乘客的下车站点;(2)基于公共交通站点空间关系的公交上车或下车站点匹配;对于一票制公交的下车站点和分段计价公交的上车站点,一部分可以在公共交通站点空间关系表的基础上通过出行的换乘过程去推断;具体的推断过程如下:1)确定一票制公交的下车站点对于同一出行链的两个相邻出行阶段,若其换乘类型属于:一票制公交换乘一票制公交(B1—B1)、一票制公交换乘轨道交通(B1—R)或者一票制公交换乘公共自行车(B1—Z),这三种情况均已知了乘客换乘行为之后的上车(进站或借车)站点,而换乘行为之前乘坐的一票制公交的下车站点未知;在此,利用已建立的公共交通站点空间关系表,以换乘行为之后的上车站点为中心站点,搜索中心站点吸引范围以内的其他地面公交站点;再从这些候选公交站点中,根据其所属线路的编号,筛选与乘客换乘行为之前乘坐的公交线路编号相同的站点,此站点即为乘客乘坐一票制公交相应的下车站点;2)确定分段计价公交的上车站点对于同一出行链的两个相邻出行阶段,若其换乘类型属于:分段计价公交换乘分段计价公交(B2—B2)、轨道交通换乘分段计价公交(R—B2)或者公共自行车换乘分段计价公交(Z—B2),这三种情况均已知了乘客换乘行为之前的下车站点,而换乘行为之后乘坐的分段计价公交的上车站点未知;同样,利用已建立的公共交通站点空间关系表,以换乘行为之前的下车站点为中心站点,搜索中心站点吸引范围以内的其他地面公交站点;再从这些候选公交站点中,根据其所属线路的编号,筛选与乘客换乘行为之后乘坐的公交线路编号相同的站点,此站点即为乘客乘坐分段计价公交相应的上车站点;(3)基于通勤行为规律的公交上车或下车站点匹配;根据通勤出行行为的对称性,出行者一天内第一次通勤出行的起点应与一天内最后一次通勤出行的终点相同,而第一次通勤出行的终点应与最后一次通勤出行的起点相同;据此,提出了部分类型的一票制公交下车站点和分段计价上车站点的判断方法,具体如下:1)确定一票制公交的下车站点若出行者一天内第一次通勤出行链的最后一个出行阶段乘坐的是一票制公交(B1),则将该出行者当天最后一次通勤出行链的起始站点作为中心站点,搜索中心站点吸引范围内的地面公交站点,筛选出其中属于出行者所乘公交线路上的站点,将其作为出行者第一次通勤出行链的下车站点;利用同样的方法,出行者一天内最后一次通勤出行链的最后出行阶段所乘坐的一票制公交的下车站点也能够确定;2)确定分段计价公交的上车站点若出行者一天内第一次通勤出行链的第一个出行阶段乘坐的是分段计价公交(B2),则将该出行者当天最后一次通勤出行链的结束站点作为中心站点,搜索中心站点吸引范围内的地面公交站点,筛选出其中属于出行者所乘公交线路上的站点,将其作为出行者第一次通勤出行链的上车站点;利用同样的方法,出行者一天内最后一次通勤出行链的第一个出行阶段所乘坐的分段计价公交的上车站点也可以确定;所述步骤5出行特征信息匹配的方法如下:在以上步骤获取的出行阶段起讫点信息的基础上,结合地面公交到站时间表和轨道交通任意站点间行程距离等数据,完成各出行阶段的行程时间、行程距离的计算,进而获取居民的公共交通通勤出行特征;(1)地面公交出行上下车时间修正上面步骤中,一票制公交(B1)的上车时间和分段计价公交(B2)的下车时间,使用的是IC卡系统的时间,而地面公交其他的时间用的是地面公交到站时间表中的GPS系统时间;由于GPS系统的时间经过校正,准确性更高,同时为了计算行程时间的标准统一,用地面公交到站时间表(GPS系统时间)中的时间对一票制公交(B1)的上车时间和分段计价公交(B2)的下车时间(IC卡系统时间)进行修正;(2)行程时间和行程距离匹配各出行阶段的行程时间,是乘客下车(出站或还车)时间与上车(进站或借车)时间的时间差;而地面公交、轨道交通和公共自行车三种方式出行阶段的行程距离,分别通过与地面公交线路基础数据表、轨道交通任意站点间行程距离表和公共自行车站点基础数据表匹配得到。
地址 100124 北京市朝阳区平乐园100号