发明名称 基于LDA模型及中心度算法的邮件网络取证分析方法
摘要 本发明涉及一种基于LDA模型及中心度算法的邮件网络取证分析方法,包括以下步骤:读取邮件数据,对邮件数据进行基于一犯罪主题的查询,得到查询结果;根据查询结果,构造以邮件用户为节点,以用户通信关系为边的邮件网络图;对查询结果中的每一封邮件,基于LDA模型计算其主题分布;计算查询结果中的每一封邮件基于犯罪主题的关联值;计算每条边基于犯罪主题的关联值;根据邮件网络图中每条边的关联值,计算每个节点的中心值;根据上一步得到的所有节点的中心值求节点的影响因子,影响因子大于设定阈值的即为基于所述犯罪主题的可疑对象。本发明协助调查取证人员查找可疑人群及分析核心成员角色,为计算机犯罪案件取证提供辅助和支持。
申请公布号 CN105096101A 申请公布日期 2015.11.25
申请号 CN201510390803.7 申请日期 2015.07.06
申请人 福州大学 发明人 刘延华;郭文忠;陈国龙;谢莉莉
分类号 G06Q10/10(2012.01)I;G06F17/30(2006.01)I;H04L12/58(2006.01)I 主分类号 G06Q10/10(2012.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种基于LDA模型及中心度算法的邮件网络取证分析方法,其特征在于包括以下步骤:步骤S1:读取邮件数据,利用Lucene全文检索技术,通过一查询语句Q对所述邮件数据进行基于一犯罪主题的查询,得到查询结果;步骤S2:根据所述查询结果,构造以邮件用户为节点,以用户通信关系为边的邮件网络图;步骤S3:对所述查询结果中的每一封邮件,基于LDA模型计算其主题分布;步骤S4:根据所述查询结果,计算所述查询结果中的每一封邮件基于所述犯罪主题的关联值;步骤S5:根据所述邮件网络图,计算每条边基于所述犯罪主题的关联值;步骤S6:根据所述邮件网络图中每条边的关联值,计算每个节点的中心值;步骤S7:根据步骤S6得到的所有节点的中心值求节点的影响因子,所述影响因子大于一阈值a的即为基于所述犯罪主题的可疑对象。
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区