发明名称 一种基于关系图的海量电子邮件分析方法及系统
摘要 本发明涉及一种基于关系图的海量电子邮件分析方法及系统,所述方法包括:并行解析电子邮件源数据,提取出电子邮件头部信息、正文信息保存到电子邮件表中;将并行解析得到的附件摘要信息以设定结构存储至电子邮件附件表,并进行检测;根据解析的电子邮件数据,构建电子邮件关系表,并根据用户需求和电子邮件关系表生成单点关系图或多点关系图;引入IP地址地理信息数据库与电子邮件用户身份信息数据库,对电子邮件表进行关联分析,并在生成的关系图中展示关联信息。所述系统对应包括并行解析模块、附件存储检测模块、关系图生成模块和关联分析模块。本发明有效解决了大数据量电子邮件的分析处理与电子邮件网络中垃圾邮件追踪定位的问题。
申请公布号 CN103106573A 申请公布日期 2013.05.15
申请号 CN201310054990.2 申请日期 2013.02.20
申请人 中国科学院信息工程研究所 发明人 李书豪;云晓春;张永峥;郝志宇;霍永亮
分类号 G06Q10/10(2012.01)I;G06F17/30(2006.01)I 主分类号 G06Q10/10(2012.01)I
代理机构 北京轻创知识产权代理有限公司 11212 代理人 杨立
主权项 一种基于关系图的海量电子邮件分析方法,其特征在于,包括:并行解析步骤:采用并行处理方式解析电子邮件源数据,并提取出电子邮件头部信息、正文信息和附件信息,将电子邮件头部信息和正文信息保存到海量电子邮件数据库的电子邮件表中;附件存储检测步骤:将并行解析步骤中得到的附件信息的摘要信息以设定的文件存储结构存储至海量电子邮件数据库的电子邮件附件表中,并进行检测;关系图生成步骤:基于并行解析步骤与附件存储检测步骤得到的电子邮件相关数据,构建实时更新的电子邮件关系表,并根据用户需求和电子邮件关系表生成单点关系图或多点关系图;关联分析步骤:引入IP地址地理信息数据库与电子邮件用户身份信息数据库,并将这两个数据库与电子邮件表进行关联,并基于生成的关系图进行关联分析,再把关联分析过程与结果在关系图中展示。
地址 100093 北京市海淀区闵庄路甲89号