发明名称 |
一种基于GPS地理位置数据挖掘的用户分类方法 |
摘要 |
本发明请求保护一种基于GPS地理位置数据挖掘的用户分类方法,包括如下步骤:预处理原始数据集,提取算法所需数据属性并以用户为单位归纳整理;通过FindStayArea算法挖掘用户的停留区域,找出用户大范围的活动区域(如工作地点区域、居住小区等);接着通过FindStayPoint算法挖掘用户的停留位置也是就用户的活动位置(如工作地点区域中的某栋建筑,居住小区中的体育场等);最后将用户的停留位置结合UserClassify算法对用户分类。本发明将用户的原始GPS地理位置数据分层处理,不仅能挖掘出用户经常活动的停留位置,同时还能够利用挖掘的结果将用户分类,找出相似性最高的用户群体,充分挖掘GPS地理位置数据的价值。 |
申请公布号 |
CN104965913A |
申请公布日期 |
2015.10.07 |
申请号 |
CN201510390801.8 |
申请日期 |
2015.07.03 |
申请人 |
重庆邮电大学 |
发明人 |
徐光侠;高诗意;常光辉;刘宴兵;梁绍飞;林福弈;胡杰;李来军;吴群 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
重庆市恒信知识产权代理有限公司 50102 |
代理人 |
刘小红 |
主权项 |
一种基于GPS地理位置数据挖掘的用户分类方法,其特征在于,包括以下步骤:101、采集用户的原始GPS地理位置数据,并预处理原始GPS地理位置数据,具体为:将用户原始GPS地理位置数据按文件夹分类,分别遍历所有文件夹中存储用户原始GPS地理位置数据的文件,提取其中的纬度、经度、记录时间三个属性,并按用户ID作为输出文件的文件名;102、挖掘用户停留区域的步骤:将步骤101整理好的用户数据作为FindStayArea算法挖掘停留区域的数据输入,输出结果为用户停留区域,停留区域包括停留区域中心点以及其附属的邻居节点;103、挖掘用户停留位置的步骤:将步骤102中输出结果的用户停留区域作为FindStayPoint算法挖掘停留位置的数据输入,输出结果为用户停留位置,停留位置是由中心点所表示;104、对用户分类,将用户停留位置作为用户分类UserClassify算法的数据输入,输出用户分类结果,将类别一致的用户作为一组用户输出。 |
地址 |
400065 重庆市南岸区黄桷垭崇文路2号 |