发明名称 |
一种视频下载服务网站的识别、评估方法及系统 |
摘要 |
本发明实施例提供了一种视频下载服务网站的识别、评估方法及系统,首先获取需要处理的目标网站首页的URL列表,并调用网页采集模块在规则数据库所制定的采集规则的指导下,根据所获取的URL列表来采集所述目标网站的网页;然后识别是否为提供视频下载服务的网站,同时将识别出的视频信息更新到预先建立的视频信息数据库中;若识别该网站为视频下载服务网站且为初次访问,则对该网站的评估;然后再抽取所述目标网站网页视频的相关信息,并将其存储到所述视频信息数据库中,用来反馈指导网站识别和评估,同时更新规则数据库。这样就能够准确的识别出提供视频下载服务的网站,跟踪其最近更新的视频信息,并对该网站的健康性、合法性进行有效的评估,从而能够构建更为健康、安全的网络体系。 |
申请公布号 |
CN101853300A |
申请公布日期 |
2010.10.06 |
申请号 |
CN201010186795.1 |
申请日期 |
2010.05.26 |
申请人 |
中国科学技术大学 |
发明人 |
刘锐;朱明;易荣峰 |
分类号 |
G06F17/30(2006.01)I;G06Q30/00(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京凯特来知识产权代理有限公司 11260 |
代理人 |
郑立明;陈亮 |
主权项 |
一种视频下载服务网站的识别、评估方法,其特征在于,所述方法包括:获取需要处理的目标网站首页的统一资源定位符URL列表,并调用网页采集模块在规则数据库所制定的采集规则的指导下,根据所获取的URL列表来采集所述目标网站的网页;通过关联分析和深度URL探测来分析所采集到的目标网站网页,识别是否为提供视频下载服务的网站,同时将识别出的视频信息更新到预先建立的视频信息数据库中;若识别该网站为视频下载服务网站且为初次访问,则利用所述视频信息数据库中的视频信息对所述网站进行相关度分析,完成对该网站的评估;利用预先制定的信息抽取规则来抽取所述目标网站网页视频的相关信息,并将其存储到所述视频信息数据库中,同时更新所述规则数据库。 |
地址 |
230026 安徽省合肥市金寨路96号 |