发明名称 欺诈邮件分析与提取方法和装置
摘要 本发明实施例提供一种欺诈邮件分析与提取方法及装置,该方法包括:根据一个周期内的发件行为建立邮件IP特征向量集,并对所述IP特征向量集进行聚类处理得到可疑IP集;对所述可疑IP集进行对话行为过滤及链接过滤处理,得到可疑邮件集;从所述可疑邮件集中提取邮件内容特征,生成内容特征向量;对所述内容特征向量基于LDA主题模型分析出所述可疑邮件集的主题概率分布;根据所述可疑邮件集的主题概率分布提取出欺诈邮件。该方法能够提高欺诈邮件提取精度和效率。
申请公布号 CN105843851A 申请公布日期 2016.08.10
申请号 CN201610149631.9 申请日期 2016.03.16
申请人 新浪网技术(中国)有限公司 发明人 陈玉焓
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京和信华成知识产权代理事务所(普通合伙) 11390 代理人 胡剑辉
主权项 一种欺诈邮件分析与提取方法,其特征在于,包括:根据一个周期内的发件行为建立邮件IP特征向量集,并对所述IP特征向量集进行聚类处理得到可疑IP集;对所述可疑IP集进行对话行为过滤及链接过滤处理,得到可疑邮件集;从所述可疑邮件集中提取邮件内容特征,生成内容特征向量;对所述内容特征向量基于LDA主题模型分析出所述可疑邮件集的主题概率分布;根据所述可疑邮件集的主题概率分布提取出欺诈邮件。
地址 100080 北京市海淀区北四环西路58号理想国际大厦20层
您可能感兴趣的专利