发明名称 一种基于张量的用户轨迹挖掘方法
摘要 本发明公开了一种基于张量的用户轨迹数据挖掘方法,包括:(1)获取用户的历史轨迹数据;(2)将历史轨迹数据中时间差超过设定时间阈值的数据分割,形成多段连续的轨迹数据;(3)针对每段连续的轨迹数据,提取用户在每段轨迹上的停留点;(4)将停留点划分为起始点和目的点,通过地图匹配方法获取对应的路段序列;(5)将停留点数据与路段序列组建成一个三维张量;(6)对于一个用户查询请求(S,D)找到起始点和目的点之间的关联热点路段;(7)根据路段权值集合计算出推荐的路径。本发明的结果为对于用户查询请求起始点与目的点之间的热点推荐路线,检索只需提供起始点和目的点的经纬度,用户不需理解后台隐含的数据结构。
申请公布号 CN104850604A 申请公布日期 2015.08.19
申请号 CN201510222590.7 申请日期 2015.05.04
申请人 华中科技大学 发明人 余辰;金海;洪钦敏;姚德中
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 曹葆青
主权项 一种基于张量的用户轨迹数据挖掘方法,其特征在于,所述方法包括如下步骤:(1)获取用户的历史轨迹数据;(2)将历史轨迹数据中时间差超过设定时间阈值的数据分割,形成多段连续的轨迹数据;(3)针对每段连续的轨迹数据,提取用户在每段轨迹上的停留点;(4)针对步骤(3)获得的一对对停留点,将有先后时间关联关系的停留点划分为起始点和目的点,起始点和停留点之间是一串连续的GPS点,运用地图匹配方法,将GPS点对应到真实的道路交通网络上从而匹配到对应的道路路段上,获得对应的起始点和目的点之间的关联路段序列;(5)将用户的出发点作为第一维度的数据,将用户的目的点作为第二维度的数据,将用户轨迹过程对应的路段作为第三维度的数据,构建一个三维的张量来表示用户的历史轨迹数据;(6)对于一个用户查询请求(QueryS,QueryD),对QueryS附近的起始点进行聚类,按照与QueryS的距离不同赋予不同的权重向量,获得关于起始点的权重向量V<sub>S</sub>;对QueryD附近的起始点进行聚类,按照与D的距离不同赋予不同的权重向量,获得关于起始点的权重向量V<sub>D</sub>;运用获得的关于QueryS和QueryD D的两个权重向量对张量进行降维处理获得热点路段权值集合;其中,QueryS表示用户查询的起始点,QueryD表示用户查询的目的点;(7)运用路线搜索方法检索QueryS到QueryD之间的路段集合,选择综合热点权值最高的路段集合作为推荐路径。
地址 430074 湖北省武汉市洪山区珞喻路1037号