发明名称 一种垃圾电子邮件意图识别系统
摘要 本发明公开了一种垃圾电子邮件意图识别系统,包括意图抽取单元、意图判断及意图库维护单元,和意图库。本发明的一种垃圾电子邮件意图识别系统通过抽取电子邮件的显式URL地址、隐式URL地址、显示邮箱地址、隐式邮箱地址、QQ号码、银行账号、信用卡号、电话号码和公司名称等多种类型的意图,并在预先创建的意图库中对每个意图进行查询,之后将当前电子邮件的所有意图查询结果整合在一起进行综合分析判断,从而能够判断出当前电子邮件是否为垃圾邮件。本发明无需一一进入邮件正文中的超链接,并分析所链接的文本的意图,只需利用所述意图库即可高效地完成对电子邮件的意图分析和邮件属性判断,且所抽取的意图种类更多,意图分析结果更准确。
申请公布号 CN103944810A 申请公布日期 2014.07.23
申请号 CN201410187923.2 申请日期 2014.05.06
申请人 厦门大学 发明人 李绍滋;郭锋;曹冬林
分类号 H04L12/58(2006.01)I;H04L29/06(2006.01)I 主分类号 H04L12/58(2006.01)I
代理机构 厦门市首创君合专利事务所有限公司 35204 代理人 张松亭
主权项 一种垃圾电子邮件意图识别系统,其特征在于,包括意图抽取单元、意图判断及意图库维护单元,和由所述意图判断及意图库维护单元创建的意图库;所述意图抽取单元接收来自上级单元的电子邮件全文和包括意图分析命令或反馈学习命令的操作指令;若所述操作指令为意图分析命令,则所述意图抽取单元抽取该电子邮件中指定类型的意图、形成意图串,并将该意图串连同该操作指令一起传送给所述意图判断及意图库维护单元,之后接收来自意图判断及意图库维护单元的邮件属性判断结果,并将该判断结果反馈给上级单元;若所述操作指令为反馈学习命令,则所述意图抽取单元抽取该电子邮件中指定类型的意图、形成意图串,并抽取该电子邮件中预先标记的邮件属性,之后将该意图串、该邮件属性连同该操作指令一起传送给所述意图判断及意图库维护单元;所述意图判断及意图库维护单元接收来自意图抽取单元的意图串和意图分析命令,或意图串、邮件属性和反馈学习命令;若所述意图判断及意图库维护单元接收到意图分析命令,则通过对接收到的意图串中的所有意图在所述意图库中进行查询而分析判断出邮件属性,并向所述意图抽取单元反馈邮件属性判断结果;若所述意图判断及意图库维护单元接收到反馈学习命令,则基于接收到的意图串和邮件属性进行反馈学习并更新意图库;所述意图判断及意图库维护单元还包括在预置的时间间隔内自动维护意图库;所述指定类型的意图包括显式URL地址、隐式URL地址、显示邮箱地址、隐式邮箱地址、QQ号码、银行账号、信用卡号、电话号码和公司名称;所述邮件属性包括垃圾邮件、正常邮件和未知邮件三种属性。
地址 361000 福建省厦门市思明南路422号