发明名称 一种网页评级方法和网页评级系统
摘要 本发明涉及网页过滤技术,针对现有网站过滤机制效率不高导致大量非法信息得以绕过防范措施而进入公众信息传播渠道的缺陷,提供一种网页评级方法和网页评级系统。网页评级方法包括读取至少一个关键词;爬取包含读取的该至少一个关键词的至少一个网页;对于爬取的每一网页,基于预先设置的评级模型来计算该网页的评分;在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;基于评分定期对评级表中的网页进行排序,并输出排序结果。本发明还提供了一种网页评级系统。本发明提供的技术方案可基于预设的过滤标准来自动判定哪些网页属于非法网页。此外,还可进一步基于评分来对网页进行分类以便工作人员基于归类来手动认定非法网页。
申请公布号 CN102253943A 申请公布日期 2011.11.23
申请号 CN201010179138.4 申请日期 2010.05.21
申请人 卓望数码技术(深圳)有限公司 发明人 陈巍;刘飞;杨丰;杨旗;罗祖光
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市顺天达专利商标代理有限公司 44217 代理人 李琴
主权项 一种网页评级方法,用于对网页内容进行评级,其特征在于,包括:评分步骤,包括:读取至少一个关键词;爬取包含读取的该至少一个关键词的至少一个网页;对于爬取的每一网页:基于预先设置的评级模型来计算该网页的评分;在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;排序步骤,包括:基于评分定期对评级表中的网页进行排序,并输出排序结果。
地址 518057 广东省深圳市南山区高新技术产业园南区深港产学研基地大楼西座六楼南翼