发明名称 | 内容评估 | ||
摘要 | 本发明描述了内容评估,包括使用与内容相关联的属性来生成数据集、使用统计分布评估该数据集来标识一类统计离群值、以及分析网页以确定该网页是否是该类统计离群值的部分。一种系统包括被配置成存储数据的存储器,以及处理器,它被配置成使用与内容相关联的属性来生成数据集、使用统计分布评估该数据集来标识一类统计离群值、并分析网页以确定该网页是否是该类统计离群值的部分。另一种方法包括爬寻一组网页、评估该组网页来计算统计分布、将统计分布中的离群值页面标记为Web垃圾、以及创建网页和离群值页面的索引来回答查询。 | ||
申请公布号 | CN1770158A | 申请公布日期 | 2006.05.10 |
申请号 | CN200510108971.9 | 申请日期 | 2005.09.29 |
申请人 | 微软公司 | 发明人 | D·C·菲特利;M·A·纳约克;M·S·玛纳瑟 |
分类号 | G06F17/30(2006.01) | 主分类号 | G06F17/30(2006.01) |
代理机构 | 上海专利商标事务所有限公司 | 代理人 | 张政权 |
主权项 | 1.一种用于评估内容的方法,包括:使用与所述内容相关联的属性生成数据集;使用统计分布评估所述数据集,来标识一类统计离群值;以及分析网页,以确定该网页是否是所述一类统计离群值的部分。 | ||
地址 | 美国华盛顿州 |