发明名称 基于社会网络行为特征的邮件分类方法
摘要 本发明公开了一种基于社会网络行为特征的邮件分类方法,首先是利用实体和关系抽取技术构建邮件收发社会关系网络和“发件人电子邮件地址-发送邮件时使用的设备的IP地址”关系网络,再根据不同类型的发件人的特点,计算反映各自行为特点的特征,最后,利用样本训练分类器,得到邮件分类的决策信息。本发明具有较好扩展性和伸缩性,并且该方法能够进一步应用于在线社交网络中信息的分类。
申请公布号 CN103198396A 申请公布日期 2013.07.10
申请号 CN201310105350.X 申请日期 2013.03.28
申请人 南通大学 发明人 施佺;邵叶秦;丁卫泽;施振佺;陈益均;陈巧;李晓丽;张静
分类号 G06Q10/10(2012.01)I 主分类号 G06Q10/10(2012.01)I
代理机构 南通市永通专利事务所 32100 代理人 葛雷
主权项 一种基于社会网络行为特征的邮件分类方法,其特征是:包括下列步骤:(1)预处理邮件收发日志,抽取邮件收发关系网络,使用发件人电子邮件地址‑收件人电子邮件地址的元组将邮件收发关系网络以文件的形式进行存储;      (2)预处理邮件收发日志,抽取发件人邮件地址‑IP地址关系网络,使用发件人电子邮件地址‑发送邮件时使用的设备的IP地址的元组将发件人邮件地址‑IP地址关系网络以文件的形式进行存储;(3)以步骤(1)、(2)产生的两个元组文件作为输入,并行计算每个电子邮件地址发送的电子邮件数量,接受的电子邮件数量,邮件的回复比例,电子邮件所用的IP地址最大出度,并分别以电子邮件地址‑出度‑入度‑邮件回复比例‑IP地址最大出度元组形式储存为中间结果文件;(4)以步骤(3)得到的中间结果元组作为特征,学习分类器最佳的分类面,作为决策信息,分类正常电子邮件用户和垃圾邮件制造者,并由此分类邮件。
地址 226019 江苏省南通市啬园路9号