发明名称 |
欺诈邮件分析与提取方法和装置 |
摘要 |
本发明实施例提供一种欺诈邮件分析与提取方法及装置,该方法包括:根据一个周期内的发件行为建立邮件IP特征向量集,并对所述IP特征向量集进行聚类处理得到可疑IP集;对所述可疑IP集进行对话行为过滤及链接过滤处理,得到可疑邮件集;从所述可疑邮件集中提取邮件内容特征,生成内容特征向量;对所述内容特征向量基于LDA主题模型分析出所述可疑邮件集的主题概率分布;根据所述可疑邮件集的主题概率分布提取出欺诈邮件。该方法能够提高欺诈邮件提取精度和效率。 |
申请公布号 |
CN105843851A |
申请公布日期 |
2016.08.10 |
申请号 |
CN201610149631.9 |
申请日期 |
2016.03.16 |
申请人 |
新浪网技术(中国)有限公司 |
发明人 |
陈玉焓 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京和信华成知识产权代理事务所(普通合伙) 11390 |
代理人 |
胡剑辉 |
主权项 |
一种欺诈邮件分析与提取方法,其特征在于,包括:根据一个周期内的发件行为建立邮件IP特征向量集,并对所述IP特征向量集进行聚类处理得到可疑IP集;对所述可疑IP集进行对话行为过滤及链接过滤处理,得到可疑邮件集;从所述可疑邮件集中提取邮件内容特征,生成内容特征向量;对所述内容特征向量基于LDA主题模型分析出所述可疑邮件集的主题概率分布;根据所述可疑邮件集的主题概率分布提取出欺诈邮件。 |
地址 |
100080 北京市海淀区北四环西路58号理想国际大厦20层 |