发明名称 一种基于GPS数据网格统计的出租车巡航行为分析方法
摘要 本发明公开了一种交通行为研究领域的基于GPS数据网格统计的出租车巡航行为分析方法。基于出租车行驶轨迹GPS数据识别巡航点,分析巡航点的空间分布特征,生成前一日的载客点以及代表用地、人口、路网等因素的背景信息点,采用网格分析技术,化空间点数据为基于网格的点频率数据,构建零膨胀负二项模型(Zero-inflated Negative binomial,ZINB),分析历史载客点信息、背景信息、巡航点的空间自相关性对出租车巡航点选择行为的影响,总结出租车的巡航策略。方便进一步的出租车交通行为仿真,为优化出租车的巡航行为、解决巡航导致的道路资源浪费、燃油消耗和环境污染提供有效途径。
申请公布号 CN103218672B 申请公布日期 2016.03.02
申请号 CN201310094868.8 申请日期 2013.03.24
申请人 吉林大学 发明人 宗芳;王占中;许洪国;金凤阁;贾正锐;潘嵩岩;高跃峰;栾琨
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 长春吉大专利代理有限责任公司 22201 代理人 王寿珍;朱世林
主权项 一种基于GPS数据网格统计的出租车巡航行为分析方法,其特征在于,包括以下步骤:第一步、获取GPS数据获取出租车行驶轨迹GPS数据,选择任意两个连续工作日的数据作为待研究基础数据;第二步、转换数据格式将基于GPS的地理坐标数据转换为大地坐标数据;第三步、筛选数据设定数据筛选原则,进行数据筛选和清理;第四步、划分网格将研究区域划分为若干正方形网格,网格边长用以下公式计算:<img file="FDA0000808918280000011.GIF" wi="262" he="85" />其中a为网格边长,A为研究区域面积,Q为平均每台车每日的GPS行驶轨迹点个数;第五步、筛选网格核查研究区域的整体用地属性,识别湖泊、公园出租车无法驶入区域所在的网格,从网格图中去除这些网格,仅保留有效网格;第六步、生成巡航点数据和载客点数据筛选出GPS数据中载客状态为0,即空载的数据,生成巡航点数据,筛选出GPS数据中载客状态由0变为1的数据,生成载客点数据;第七步、生成背景点数据搜集有关城市用地密度、路网布局、人口分布背景信息,生成背景点数据;第八步、生成网格数据将巡航点数据、载客点数据和背景点数据投射到网格中,计算研究区域内每一网格的如下数据项:后一日全部车辆的巡航点数之和、前一日全部车辆的载客点数之和、背景点数,生成在列方向包括这三项数据、在行方向的记录条数为区域有效网格总数的网格数据库;第九步、计算巡航点的空间自相关影响值对于任意网格,记为网格i,计算除网格i外其他所有网格,记为<img file="FDA0000808918280000012.GIF" wi="38" he="63" />的巡航点数对网格i巡航点的空间影响值,即巡航点的空间自相关影响值,计算方法为:W<sub>i</sub>=D<sub>i</sub>·T<sup>T</sup>其中,W<sub>i</sub>为其他网格中巡航点对网格i中巡航点的空间自相关影响值,i=1…n,n为网格总数,T为由所有网格的巡航点数组成的向量,D<sub>i</sub>为其他所有网格对网格i影响的空间权重矩阵,由网格i与任意网格j,<img file="FDA0000808918280000021.GIF" wi="108" he="71" />之间的空间相关权重D<sub>ij</sub>组成,D<sub>ij</sub>由下式计算:<img file="FDA0000808918280000022.GIF" wi="196" he="142" />其中d<sub>ij</sub>为网格i与j之间的空间距离,i,j=1…n,网格i自身的空间自相关影响值D<sub>ii</sub>为0;第十步、建立和标定ZINB模型以任意网格i的巡航点数为因变量,以网格i的背景点数、前一日的载客点数和巡航点的空间自相关影响值为自变量,应用网格数据库,建立零膨胀负二项模型,Zero‑inflated Negative binomial,ZINB,标定模型中的参数,进行模型检验;所述的零膨胀负二项模型由点数为零模型和计数模型两部分组成,点数为零模型的基本结构为:<img file="FDA0000808918280000023.GIF" wi="1013" he="126" />其中p<sub>i</sub>和1‑p<sub>i</sub>分别为网格i的巡航点数为0或非0的概率,0≤p<sub>i</sub>≤1,L<sub>i</sub>和Y<sub>i</sub>分别为网格i的背景点数和前一日的载客点数,W<sub>i</sub>为其他网格中巡航点对网格i中空间自相关影响值,γ为常变量,γ<sub>L</sub>、γ<sub>Y</sub>和γ<sub>W</sub>分别为背景点数、前一日的载客点数和巡航点的空间自相关性三个变量对点数为0的影响参数,ε<sub>p</sub>为随机误差;计数模型的期望计数μ<sub>i</sub>按如下函数计算:log(μ<sub>i</sub>)=β+β<sub>L</sub>L<sub>i</sub>+β<sub>Y</sub>Y<sub>i</sub>+β<sub>W</sub>W<sub>i</sub>+ε<sub>μ</sub>其中β为常变量,β<sub>L</sub>、β<sub>Y</sub>和β<sub>W</sub>分别为背景点数、前一日的载客点数和巡航点的空间自相关性三个变量对网格计数的影响参数,ε<sub>μ</sub>为随机误差第十一步、分析巡航策略分析零膨胀负二项模型中的背景点数、前一日的载客点数和巡航点的空间自相关影响值三个自变量对网格计数的影响参数,分析三个因素对巡航点数的影响:影响参数值为正表明该因素对巡航点数有积极影响,即网格的该因素值越大则巡航点越多,反之表明网格的该因素值越大则巡航点越少;而某因素的参数值的绝对值大于另一因素表明某因素对巡航点数的影响程度大于另一因素;总结出租车的巡航策略。
地址 130012 吉林省长春市前进大街2699号