发明名称 一种地理社交网络下的用户相似性计算方法
摘要 本发明属于舆情监控领域,涉及社交网络用户推荐及信息服务推荐技术分析,尤其涉及一种地理社交网络下的用户相似性计算方法。主要包括以下步骤:包括时空语义抽取、建立用户时空访问模型及用户相似性计算。本发明的有益效果是(1)时空语义划分更周全,同时降低了数据稀疏性带来的问题;(2)统一考虑了位置功能语义和地理因素对用户相似性的影响,对用户画像的建模更加全面;(3)结合轨迹的物理时空邻近性与语义时空相似性,进行社交网络用户相似性计算,准确率更高,进而实现对社交网络用户群体的划分,用户分类及其兴趣类型判断效果更优。
申请公布号 CN105389332A 申请公布日期 2016.03.09
申请号 CN201510669496.6 申请日期 2015.10.13
申请人 广西师范学院 发明人 段炼
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 成都九鼎天元知识产权代理有限公司 51214 代理人 陈科恒
主权项 一种地理社交网络下的用户相似性计算方法,其特征在于,包括以下步骤:(1)时空语义抽取:包括基于各用户对位置的访问热度,对位置进行的空间层次聚类;还包括依据用户连续签到位置间的距离、时间差异进行的时间层次聚类;(2)建立用户时空访问模型:为基于不同时空语义条件下,构建的位置访问序列,所述位置访问序列的表达式为:LVS<sub>u,o,k</sub>={Muti(l<sub>u,1,1</sub>, l<sub>u,1,2</sub>,…, l<sub>u,T1,|Sk|</sub>),Muti(l<sub>u,2,1</sub>, l<sub>u,2,2</sub>,…, l<sub>u,2,|Sk|</sub>),…,Muti(l<sub>u,|To|,1</sub>, l<sub>u,|To|,2</sub>,…, l<sub>u,|To|,|Sk|</sub>)}其中,每个节点Muti(l<sub>u,|To|,1</sub>, l<sub>u,|To|,2</sub>,…, l<sub>u,|To|,|Sk|</sub>)为用户u在第|To|个语义时间内位于位置1——|Sk|个语义位置的访问热度分布,l<sub>u,|To|,|SK|</sub>表示用户u在第|To|个语义时间内对位置Sk的访问热度;(3)用户相似性计算:所述用户相似性的计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>D</mi><mi>I</mi><mi>S</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>&Sigma;</mi><mrow><mi>o</mi><mo>&Element;</mo><mi>Q</mi></mrow></msub><mo>&lsqb;</mo><msub><mi>&beta;</mi><mi>o</mi></msub><mo>&times;</mo><msub><mi>DIS</mi><mi>o</mi></msub><mrow><mo>(</mo><msub><mi>LVS</mi><mi>u</mi></msub><mo>,</mo><msub><mi>LVS</mi><mi>v</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo></mrow>]]></math><img file="FDA0000824070230000013.GIF" wi="1008" he="95" /></maths>其中,β<sub>0</sub>为第o层时间尺度下的位置访问差异权重值;LVS<sub>u</sub>、LVS<sub>v</sub>分别为第o层时间尺度时用户u或v在所有空间尺度上的位置分布访问序列;DIS<sub>o</sub>(LVS<sub>u</sub>,LVS<sub>v</sub>)表示两用户在第o层时间尺度时所有空间尺度上的差异值累积量。
地址 530001 广西壮族自治区南宁市西乡塘区明秀东路175号