发明名称 使用网址过滤模组来过滤滥发讯息之系统与方法
摘要
申请公布号 TWI348290 申请公布日期 2011.09.01
申请号 TW093117715 申请日期 2004.06.18
申请人 新门科技公司 发明人 大卫 科温斯;大卫 候格史揣特;珊蒂 詹森;亚特 梅德拉;肯 史齐奈德
分类号 H04L12/00 主分类号 H04L12/00
代理机构 代理人 陈长文 台北市松山区敦化北路201号7楼
主权项 一种用于过滤滥发讯息之方法,包含:侦测一进入讯息中的一个网址(URL),其中该URL包含一主机部份及一路径部份;根据该URL之该主机部份而非该路径部份来产生一第一散列值;根据该URL之该主机部份及该路径部份,而产生一第二散列值;比较该第一散列值与产生自具有滥发特征之复数个URL的主机部份之散列值;比较该第二散列值与产生自复数个URL的主机部份及路径部份之散列值;以及根据该第一与第二散列值的比较而决定该进入讯息是否为滥发。如请求项1之方法,进一步包含于产生该第一与第二散列值前,减少该URL中之杂讯。如请求项1之方法,进一步包含:侦测该URL是否包括一或多个子网域;以及比较该URL的一子网域等级与该复数个URL;以及其中该决定系进一步根据该子网域等级之该比较。如请求项1之方法,进一步包含:侦测该URL是否包括指到一目标URL的一重新定向;以及比较该目标URL与该复数个URL;其中该决定系进一步根据该目标URL之该比较。如请求项2之方法,其中减少杂讯包含:将来自该URL中的一数字字元参考或一字元实体参考转换成一对应之ASCII字元。如请求项1之方法,其中决定电子邮件讯息是否为滥发包含:决定该URL与来自该复数个URL中之一URL间的一相似度是否超过一门限。如请求项1之方法,其中决定该进入讯息是否为滥发包含:决定该URL是否与该等复数个URL中的至少一者匹配;决定与该至少一URL关联的一权重是否超过一门限;以及如果与该至少一URL关联的该权重超过一门限,则决定该进入讯息为滥发。一种用于过滤滥发讯息之方法,包含:接收一被辨识为一滥发讯息之讯息;从该接收的讯息中萃取一网址(URL),其中该URL包括一主机部份及一路径部份;根据该URL之该主机部份而非该路径部份来产生一第一散列值;根据该URL之该主机部份及该路径部份来产生一第二散列值;使用该产生的第一散列值来建立一第一滥发过滤器,其中该第一滥发过滤器可用以决定一随后接收的讯息是否包括该URL之该主机部份;以及使用该产生的第二散列值来建立一第二滥发过滤器,其中该第二滥发过滤器可用以决定一随后接收的讯息是否包括该URL之该主机部份及该路径部份。如请求项8之方法,进一步包含:将该第一及第二滥发过滤器传输至一客户。如请求项8之方法,进一步包含:于产生该第一及第二散列值之前,修正该URL以减少杂讯。如请求项8之方法,进一步包含:根据该滥发过滤器于辨识滥发的效力指派一各别权重给每一该第一或第二滥发过滤器。如请求项8之方法,进一步包含:根据与该URL关联的一网站之内容而分类该URL。一种用于过滤滥发讯息之系统,包含:一进入讯息之剖析器,其可执行以在一进入讯息中侦测一网址(URL),其中该URL包括一主机部份及一路径部份;一URL资料产生器可执行以根据该URL之该主机部份而非该路径部份来产生一第一散列值,并且可根据该URL之该主机部份及该路径部份来产生一第二散列值;以及一相似识别符,其可执行以比较该第一散列值与产生自具有滥发特征之复数个URL的主机部份之散列值,及比较该第二散列值与产生自该复数个URL的主机部份与路径部份之散列值,而且根据该第一与第二散列值的比较而决定该进入讯息是否为滥发。如请求项13之系统,进一步包含一URL正规器,其可执行以于产生该第一及该第二散列值之前减少在该URL中的杂讯。如请求项13之系统,进一步包含:一滥发URL接收器,其可执行以接收该复数个URL;以及一滥发URL资料库,其可执行以储存该复数个URL。一种用于过滤滥发讯息之系统,包含:一滥发接收器,其可执行以接收一被辨识为一滥发讯息之讯息,而且从该接收的讯息中萃取一网址(URL),其中该URL包括一主机部份及一路径部份;一滥发URL资料产生器可执行以:根据该URL之该主机部份而非该路径部份来产生一第一散列值;根据该URL之该主机部份及该路径部份来产生一第二散列值;使用该产生的第一散列值来建立一第一滥发过滤器,其中该第一滥发过滤器可用以决定一随后接收的讯息是否包括该URL之该主机部份;以及使用该产生的第二散列值来建立一第二滥发过滤器,其中该第二滥发过滤器可用以决定一随后接收的讯息是否包括该URL之该主机部份及该路径部份。如请求项16之系统,进一步包含一滥发URL传输器,其可执行以将该第一及第二滥发过滤器传输至一客户。如请求项16之系统,进一步包含一杂讯减少演算法,其可执行以修改该URL以于产生该第一及第二散列值之前减少杂讯。一种用于过滤滥发讯息之装置,包含:用以侦测一进入讯息中的一个网址(URL)的构件,其中该URL包括一主机部份及一路径部份;用于产生根据该URL之该主机部份而非该路径部份之一第一散列值,以及产生根据该URL之该主机部份及该路径部份之一第二散列值之构件;用于比较该第一散列值与产生自复数个具有滥发特征之URL的主机部份之散列值及用于比较该第二散列值与产生自该复数个URL之该主机部份与路径部份之构件,以及根据该第一与第二散列值的比较来决定该进入讯息是否为滥发之构件。一种用于过滤滥发讯息之装置,包含:用以接收一被辨识为一滥发讯息的讯息之构件;从该接收的讯息中萃取一网址(URL)的构件,其中该URL包括一主机部份及一路径部份;根据该URL之该主机部份而非该路径部份来产生一第一散列值及根据该URL之该主机部份及该路径部份来产生一第二散列值之构件;以及用于使用该产生的第一散列值来建立一第一滥发过滤器及使用该产生的第二散列值来建立一第二滥发过滤器之构件,其中该第一滥发过滤器可用以决定一随后接收的讯息是否包括该URL的该主机部份,且其中该第二滥发过滤器可操作以决定该随后接收的讯息是否包括该URL的该主机部份及该路径部份。一种包含可执行指令之电脑可读取媒体,当在一处理系统上执行该等可执行指令时,将造成该处理系统执行一方法,该方法包含:侦测一进入讯息中的一个网址(URL),其中该URL包括一主机部份及一路径部份;根据该URL之该主机部份而非该路径部份来产生一第一散列值;根据该URL之该主机部份及该路径部份来产生一第二散列值;比较该第一散列值与产生自具有滥发特征之复数个URL之主机部份之散列值;比较该第二散列值与产生自该复数个URL之该主机部份及该路径部份之散列值;以及根据来自该进入讯息之该URL与具有滥发特征之该等复数个URL的比较而决定该进入讯息是否为滥发。一种包含可执行指令之电脑可读取媒体,当在一处理系统上执行该等可执行指令时,将造成该处理系统执行一方法,该方法包含:接收一被辨识为一滥发讯息之讯息;从该接收的讯息中萃取代表一网址(URL)其中该URL包括一主机部份及一路径部份;根据该URL之该主机部份而非该路径部份来产生一第一散列值;根据该URL之该主机部份及该路径部份来产生一第二散列值;使用该产生的第一散列值来建立一第一滥发过滤器,其中该第一滥发过滤器可用以决定一随后收到的讯息是否包括该URL之该主机部份;以及使用该产生的第二散列值来建立一第二滥发过滤器,其中该第二滥发过滤器可用已决定该随后接收的讯息是否包括该URL之该主机部份及该路径部份。
地址 美国