发明名称 基于关联分析的网站信用黑名单生成方法及系统
摘要 一种互联网信息安全技术领域的基于关联分析的网站信用黑名单生成方法及系统,首先对网站之间的关联关系进行分析并生成网站关联数据集,然后根据网站关联数据集生成网络信用黑名单,针对网络信用黑名单进行动态调整。本发明在对网站信用黑名单生成时,并未孤立地仅从单个网站信用值加以处理,而是考虑了站点之间的关联关系对其网络信用的影响,设计了一种基于关联分析的网站信用黑名单的生成方法;并且考虑了网站失信事件发生后,对网站信用及其关联站点的动态影响,设计了对应的网站信用黑名单动态调整方法。本发明可以系统性生成网络信用黑名单,并可针对网站失信事件做出对网站信用黑名单进行动态调整。
申请公布号 CN103475669B 申请公布日期 2016.04.27
申请号 CN201310443543.6 申请日期 2013.09.25
申请人 上海交通大学 发明人 张保稳;孔国栋;林祥;李建华
分类号 H04L29/06(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 上海交达专利事务所 31201 代理人 王毓理;王锡麟
主权项 一种基于关联分析的网站信用黑名单生成方法,其特征在于,首先对网站之间的关联关系进行分析并生成网站关联数据集,然后根据网站关联数据集生成网络信用黑名单,针对网络信用黑名单进行动态调整;所述的方法包括以下步骤:步骤一、网站关联分析:根据待处理的网站数据集W中的站点个数为N,通过进行网站关联分析得到站点关联矩阵M;步骤二、网站信用黑名单生成:根据待处理的网站集W及其对应的网站信用集合Cred以及步骤一得到的站点关联矩阵M为输入,生成网站信用黑名单列表B和更新后的网站信用集合Cred;步骤三、网站失信事件信用动态调整:根据网站失信时间告警和步骤二得到的Cred进行网站失信事件后的信用调整,并得到动态调整后的网站信用集合Cred;所述的步骤一具体步骤包括:1.1)初始化站点关联矩阵M为N*N矩阵,矩阵中的每个元素皆为0,并设置i=1;1.2)关联站点全集R<sub>i</sub>初始化为空集,通过手工方式或者友情链接查询工具,对网站数据集W中的网站wi,将该网站对应的全部友情链接站点加入R<sub>i</sub>,生成其关联站点全集R<sub>i</sub>;1.3)对于任意W中的网站w<sub>k</sub>,若w<sub>k</sub>是R<sub>i</sub>的元素,则将站点关联矩阵M中第i行第k列位置所在的元素m<sub>i,k</sub>赋值为1;1.4)i值增加1,重复步骤1.2)‑1.4),直到i&gt;N为止,由此得到用于输出的站点关联矩阵M;步骤二具体步骤包括:2.1)设G为W与B的差集,逐一检查网站集合G中的每一个站点的网络信用,将所有网络信用值低于δ的站点加入信用黑名单列表B中,其中:δ为网络信用黑名单的阈值,即将网络信用值低于δ的站点列入信用黑名单列表B中,网站信用黑名单列表B初始化时为空集,即设置changecred_flag=0;2.2)对于G中的每一个站点w<sub>i</sub>,其关联站点全集R<sub>i</sub>初始化为空集;若其所对应的站点关联矩阵M所在x行中存在m<sub>x,t</sub>=1,则将对应的w<sub>t</sub>加入R<sub>i</sub>;2.3)对于G中的每一个站点w<sub>i</sub>,若R<sub>i</sub>与B的交集非空,则将该站点放入集合T中,并初始化j=1;2.4)对于T中的每一个站点w<sub>j</sub>,其网络信用为Cred<sub>j</sub>,其关联站点全集为R<sub>j</sub>,R<sub>j</sub>中的站点数量为N<sub>j</sub>,计数器Count<sub>j</sub>的值初始化为0;2.5)对于站点w<sub>j</sub>中的关联站点全集R<sub>j</sub>的每一个站点,逐次检查其是否在信用黑名单列表B中,若其在B中,计数器Count<sub>j</sub>的值加1,否则无操作;2.6)计算Credtemp的值为Cred<sub>j</sub>*(1‑Count<sub>j</sub>/(N<sub>j</sub>+3)),若所得Credtemp小于δ,则将其放入黑名单列表集合B中并更新Cred<sub>j</sub>的值为δ‑1;若changecred_flag=1,更新Cred<sub>j</sub>的值为Credtemp;2.7)更新j=j+1,重复步骤2.4)‑2.6),直到j&gt;|T|‑1;2.8)重复步骤2.1)‑2.7),直到黑名单列表B无新的站点加入为止;2.9)设置changecred_flag=1,重复执行步骤2.1)‑2.7)一次;输出黑名单列表B和更新后的网站信用集合Cred;所述的步骤三具体包括:3.1)发生网站失信事件后,相关的网络站点集合为L,集合D为L与(W‑B)的交集,则对于D其中的每一个网络站点w<sub>i</sub>,设定其失信事件信用影响因子β<sub>i</sub>,0&lt;β<sub>i</sub>&lt;1,由此形成集合{β<sub>i</sub>};3.2)对于L中的每一个站点w<sub>i</sub>,按照公式Cred<sub>i</sub>=Cred<sub>i</sub>*(1‑β<sub>i</sub>),调整其网络信用值,并输出网站信用集合Cred;3.3)根据步骤3.2)得到的更新后的信用集合Cred按照步骤二方式重新生成更新后的网站信用黑名单。
地址 200240 上海市闵行区东川路800号