发明名称 | 一种识别非法统一资源标识符URL的方法与装置 | ||
摘要 | 本申请公开了一种识别非法统一资源标识符URL的方法与装置。该方法包括:确定待识别的第一URL;当所述第一URL不在预设的黑名单中时,提取所述第一URL对应的网页中的内容,其中,所述内容包括所述第一URL对应的网页中的各第二URL、文本信息、图像信息、视频信息中的至少一种;确定所述第一URL与已知的非法URL的第一相似度,以及所述内容与已知的非法内容的第二相似度;根据所述第一相似度和第二相似度,识别所述第一URL是否为非法URL。该方法用以降低漏识别率。 | ||
申请公布号 | CN106055574A | 申请公布日期 | 2016.10.26 |
申请号 | CN201610340764.4 | 申请日期 | 2016.05.19 |
申请人 | 微梦创科网络科技(中国)有限公司 | 发明人 | 丁玲;罗诗尧 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京国昊天诚知识产权代理有限公司 11315 | 代理人 | 黄熊 |
主权项 | 一种识别非法统一资源标识符URL的方法,其特征在于,所述方法包括:确定待识别的第一URL;当所述第一URL不在预设的黑名单中时,提取所述第一URL对应的网页中的内容,其中,所述内容包括所述第一URL对应的网页中的各第二URL、文本信息、图像信息、视频信息中的至少一种;确定所述第一URL与已知的非法URL的第一相似度,以及所述内容与已知的非法内容的第二相似度;根据所述第一相似度和第二相似度,识别所述第一URL是否为非法URL。 | ||
地址 | 100080 北京市海淀区彩和坊路6号7-10层 |