发明名称 一种识别非法统一资源标识符URL的方法与装置
摘要 本申请公开了一种识别非法统一资源标识符URL的方法与装置。该方法包括:确定待识别的第一URL;当所述第一URL不在预设的黑名单中时,提取所述第一URL对应的网页中的内容,其中,所述内容包括所述第一URL对应的网页中的各第二URL、文本信息、图像信息、视频信息中的至少一种;确定所述第一URL与已知的非法URL的第一相似度,以及所述内容与已知的非法内容的第二相似度;根据所述第一相似度和第二相似度,识别所述第一URL是否为非法URL。该方法用以降低漏识别率。
申请公布号 CN106055574A 申请公布日期 2016.10.26
申请号 CN201610340764.4 申请日期 2016.05.19
申请人 微梦创科网络科技(中国)有限公司 发明人 丁玲;罗诗尧
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京国昊天诚知识产权代理有限公司 11315 代理人 黄熊
主权项 一种识别非法统一资源标识符URL的方法,其特征在于,所述方法包括:确定待识别的第一URL;当所述第一URL不在预设的黑名单中时,提取所述第一URL对应的网页中的内容,其中,所述内容包括所述第一URL对应的网页中的各第二URL、文本信息、图像信息、视频信息中的至少一种;确定所述第一URL与已知的非法URL的第一相似度,以及所述内容与已知的非法内容的第二相似度;根据所述第一相似度和第二相似度,识别所述第一URL是否为非法URL。
地址 100080 北京市海淀区彩和坊路6号7-10层