发明名称 |
无效链接的识别方法和装置 |
摘要 |
本发明提供一种无效链接的识别方法和装置,通过获取待识别链接对应的URL,根据待识别链接对应的URL构造多个无效链接,进而获取多个无效链接对应的响应页面和待识别链接对应的响应页面,确定待识别链接对应的响应页面和多个无效链接对应的响应页面的相似度,若待识别链接对应的响应页面和多个无效链接中的任意一个无效链接对应的响应页面的相似度大于设定的相似度阈值,则确定待识别链接为无效链接。所述方法中,通过主动构造无效链接的样本,根据待识别链接和无效链接对应的响应页面的相似度确定无效链接,提高了无效链接识别的准确性。 |
申请公布号 |
CN105022824A |
申请公布日期 |
2015.11.04 |
申请号 |
CN201510430940.9 |
申请日期 |
2015.07.21 |
申请人 |
北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司 |
发明人 |
李菲;张龙;毛冲 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
刘丹;黄健 |
主权项 |
一种无效链接的识别方法,其特征在于,包括:获取待识别链接对应的统一资源符URL,所述待识别链接对应的URL包括第一目录、第一文件名和第一扩展名;根据所述待识别链接对应的URL构造多个无效链接,所述多个无效链接中的每个无效链接对应的URL包括目录、文件名和扩展名,所述多个无效链接对应的URL包括的目录、文件名和扩展名,与所述第一目录、第一文件名和第一扩展名中的至少一个不同;获取所述多个无效链接对应的响应页面和所述待识别链接对应的响应页面;确定所述待识别链接对应的响应页面和所述多个无效链接对应的响应页面的相似度;若所述待识别链接对应的响应页面和所述多个无效链接中的任意一个无效链接对应的响应页面的相似度大于设定的相似度阈值,则确定所述待识别链接为无效链接。 |
地址 |
100089 北京市海淀区北洼路4号益泰大厦3层 |