发明名称 一种社交网络中行为特征的保护方法
摘要 本发明公开了一种社交网络中行为特征的保护方法,其特征是按如下步骤进行:1、对信息参与者总行为集合获得目标参与者的行为特征集合与特征类别集合;2、获得参与者的总特征词语集合以及每一个参与者行为集合所属的特征类别;3、获得目标参与者的相似者集合;4、选取在相似者集合中与目标参与者不在同一特征类别的相似者所对应的行为集合,提取g个相似特征词语所对应的行为作为相似特征行为;5、将相似特征行为推荐给目标参与者。本发明能有效的保护社交网络中信息参与者的行为特征,从而保护各种隐私数据,提高数据安全性。
申请公布号 CN104580234A 申请公布日期 2015.04.29
申请号 CN201510025484.X 申请日期 2015.01.19
申请人 合肥工业大学 发明人 李磊;马迪;吴共庆;汪萌;吴信东
分类号 H04L29/06(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 安徽省合肥新安专利代理有限责任公司 34101 代理人 陆丽莉;何梅生
主权项 一种社交网络中行为特征的保护方法,所述社交网络是由n个参与者U={u<sub>1</sub>,u<sub>2</sub>,...,u<sub>i</sub>,...,u<sub>n</sub>}和所述n个参与者U之间的连接关系组成的网络;u<sub>i</sub>表示第i个参与者,1≤i≤n;定义<img file="FDA0000658073980000019.GIF" wi="38" he="54" />表示目标参与者,<img file="FDA0000658073980000017.GIF" wi="165" he="62" />定义所述n个参与者U在所述社交网络中的总行为集合为I={I<sub>1</sub>,I<sub>2</sub>,...,I<sub>i</sub>,...,I<sub>n</sub>},I<sub>i</sub>表示第i个参与者u<sub>i</sub>的行为集合;<img file="FDA00006580739800000110.GIF" wi="51" he="72" />表示目标参与者<img file="FDA00006580739800000111.GIF" wi="43" he="59" />的行为集合,<img file="FDA00006580739800000112.GIF" wi="156" he="78" />其特征是:所述保护方法按如下步骤进行:步骤一、对所述总行为集合I利用基于K‑means和TF‑IDF的方法进行聚类分析,获得所述目标参与者<img file="FDA0000658073980000018.GIF" wi="48" he="53" />的行为特征集合<img file="FDA0000658073980000011.GIF" wi="584" he="104" />与所述n个参与者U的总特征类别集合P={p<sub>1</sub>,p<sub>2</sub>,...,p<sub>j</sub>,...,p<sub>d</sub>};<img file="FDA0000658073980000012.GIF" wi="58" he="73" />表示所述行为特征集合<img file="FDA00006580739800000113.GIF" wi="68" he="73" />中目标特征词语的总数;<img file="FDA00006580739800000114.GIF" wi="80" he="68" />表示所述目标参与者<img file="FDA00006580739800000115.GIF" wi="44" he="54" />的行为特征集合<img file="FDA00006580739800000116.GIF" wi="69" he="72" />中的第<img file="FDA00006580739800000117.GIF" wi="54" he="66" />个特征词语,<img file="FDA0000658073980000013.GIF" wi="245" he="75" />p<sub>j</sub>表示第j个特征类别,d表示特征类别的总数;1≤j≤d;步骤二、利用多个总体的马氏距离判别方法获得所述n个参与者U总行为集合I的总特征词语集合W={W<sub>1</sub>,W<sub>2</sub>,...,W<sub>i</sub>,...,W<sub>n</sub>}中第i个特征词语集合W<sub>i</sub>与所述n个参与者U的总特征类别集合P中所有特征类别的平方马氏距离,如果所述第i个特征词语集合W<sub>i</sub>与特征类别p<sub>j</sub>的平方马氏距离最小,则所述第i个特征词语集合W<sub>i</sub>属于第j个特征类别p<sub>j</sub>,所述第i个参与者u<sub>i</sub>的行为集合I<sub>i</sub>属于第j个特征类别p<sub>j</sub>,进而获得所述总行为集合I中每个行为集合所属的特征类别;步骤三、利用余弦相似性计算公式分别计算出所述目标参与者<img file="FDA00006580739800000118.GIF" wi="39" he="59" />的行为集合<img file="FDA00006580739800000119.GIF" wi="56" he="72" />与其他参与者的行为集合的余弦值集合;以所述余弦值集合作为相似度集合并进行降序排列后,选取前k个相似度所对应的参与者构成相似者集合U'={u'<sub>1</sub>,u'<sub>2</sub>,...,u'<sub>e</sub>,...,u'<sub>k</sub>};并以I'={I'<sub>1</sub>,I'<sub>2</sub>,...,I'<sub>e</sub>,...,I'<sub>k</sub>}中的每个元素表示所述相似者集合U'中每个相似者所对应的行为集合;I'<sub>e</sub>表示所述相似者集合U'中第e个相似者u'<sub>e</sub>的行为集合;1≤e≤n‑1;步骤四、选取在所述相似者集合U'={u'<sub>1</sub>,u'<sub>2</sub>,...,u'<sub>e</sub>,...,u'<sub>k</sub>}中与所述目标参与者<img file="FDA00006580739800000120.GIF" wi="44" he="54" />不在同一特征类别的t<sub>c</sub>个相似者所对应的行为集合<img file="FDA0000658073980000014.GIF" wi="436" he="105" />t<sub>f</sub>≤k;<img file="FDA0000658073980000015.GIF" wi="60" he="91" />表示与所述目标参与者<img file="FDA0000658073980000016.GIF" wi="42" he="57" />不在同一特征类别的第t<sub>f</sub>个相似者的行为集合;利用分词工具对所述t<sub>c</sub>个行为集合<img file="FDA0000658073980000021.GIF" wi="408" he="105" />中的每个行为集合进行标注获得相似特征词语集合;在所述相似特征词语集合中选取g个相似特征词语,提取所述g个相似特征词语所对应的行为作为相似特征行为;步骤五、将所述相似特征行为推荐给所述目标参与者<img file="FDA0000658073980000022.GIF" wi="72" he="57" />使得所述目标参与者<img file="FDA00006580739800000210.GIF" wi="42" he="59" />能将所述相似特征行为加入到所述行为集合<img file="FDA0000658073980000023.GIF" wi="56" he="69" />中;从而形成对所述目标参与者<img file="FDA0000658073980000024.GIF" wi="42" he="56" />的特征词语所表示的行为特征的保护。
地址 230009 安徽省合肥市包河区屯溪路193号