发明名称 基于不确定语义的社交网用户行为关系推演系统及方法
摘要 本发明一种基于不确定语义的社交网用户行为关系推演系统及方法,属于数据挖掘和服务信息推荐领域,本发明基于用户地理位置相似性与用户活动相似性推演出用户是否具有行为关系;通过地理位置与活动相似性推断出与用户具有行为关系的用户,从而可以对未知用户行为做出准确预测,可以极大地提升信息推荐服务的质量;实验证明,本发明在未知本发明在未知用户行为预测的准确性上优于现在已有的行为预测方法,具有很高的实际应用价值,所以如果能够得到推广,将能极大地提高用户行为预测的准确性,对企事业明确目标客户人群,做出正确决策具有显著的意义。
申请公布号 CN104462592A 申请公布日期 2015.03.25
申请号 CN201410848410.1 申请日期 2014.12.29
申请人 东北大学 发明人 刘欣;于亚新;于双羽;李玉龙
分类号 G06F17/30(2006.01)I;G06Q50/00(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 沈阳东大知识产权代理有限公司 21109 代理人 梁焱
主权项 一种基于不确定语义的社交网用户行为关系推演系统,其特征在于,包括不确定词条活动库构建模块、未知地理位置推演模块、推特文本词条提取模块、推特文本词条表达活动概率值推演模块、用户对活动相似性概率矩阵计算模块、用户对物理位置相似度矩阵计算模块、用户对语义行为关系矩阵推演模块和用户对语义行为关系聚类推演模块;其中,不确定词条活动库构建模块:用于获取第三方应用中的活动类别及各活动类别中所包含的不确定词条,根据每个不确定词条在不同活动类别中的词频和每个不确定词条的逆向文本频率,获得每个不确定词条在不同活动类别中的重要性权重值,并根据设定的两个重要性权重阈值和每个不确定词条在不同活动类别中的重要性权重值,对每个不确定词条进行分类,再根据分类情况计算词条属于各活动类别的概率值,最终根据获得的活动类别、各活动类别中所包含的不确定词条、各不确定词条的类型和各不确定词条所属活动类别的概率值,构建不确定词条活动库;未知地理位置推演模块:用于获取社交网中提及目标用户的其他用户的已知物理位置经度和纬度,计算其他用户的已知物理位置方差,并根据上述方差,采用最大似然估计法获得目标用户的未知物理位置,发送至用户对物理位置相似度矩阵计算模块中;推特文本词条提取模块:用于通过分词工具将社交网中提及目标用户的其他用户所发文本进行词条提取,并发送至推特文本词条表达活动概率值推演模块中;推特文本词条表达活动概率值推演模块:用于在不确定词条活动库中对所提取的词条进行匹配,并确定词条在不同活动类别中的词条类型和概率值,并获得所提取的词条所属活动类别的所有组合情况,并计算各活动类别中每种词条组合情况的概率值;用户对活动相似性概率矩阵计算模块:用于采用杰卡德相似系数计算获得任意用户对所产生的各类活动的相似度和相似概率,并将大于设定阈值的相似度所对应的活动相似概率进行求和,获得该用户对活动相似概率,进而获得所有目标用户对活动相似概率,并构建用户对相似行为活动概率下三角矩阵;用户对物理位置相似度矩阵计算模块:用于将目标用户的地理经度和纬度转换成平面距离,根据平面距离计算任意用户对间物理位置的相似度,并获取用户对间物理位置的相似度大于设定阈值的相似度值,并将上述相似度值保存至用户对物理位置相似度下三角矩阵中,完成用户对物理位置相似度下三角矩阵的构建;用户对语义行为关系矩阵推演模块:用于根据构建完成的用户对相似行为活动概率下三角矩阵和用户对物理位置相似度下三角矩阵,获取目标用户对在用户对相似行为活动概率下三角矩阵和用户对物理位置相似度下三角矩阵中对应位置的两数值,并将两数值相乘,获得目标用户对用户对语义行为关系值,并构建用户对用户对语义行为关系矩阵;用户对语义行为关系聚类推演模块;用于根据用户对用户对语义行为关系矩阵构建连通图,即将用户作为连通图的节点,用户对间的用户对语义行为关系值作为连通图节点之间的连通边,删除用户对语义行为关系值小于设定阈值的连通边,将剩余连通边构成的每个连通子图作为一组用户对语义行为关系,完成社交网用户语义行为关系的推演。
地址 110819 辽宁省沈阳市和平区文化路3号巷11号