发明名称 内容评估
摘要 本发明描述了内容评估,包括使用与内容相关联的属性来生成数据集、使用统计分布评估该数据集来标识一类统计离群值、以及分析网页以确定该网页是否是该类统计离群值的部分。一种系统包括被配置成存储数据的存储器,以及处理器,它被配置成使用与内容相关联的属性来生成数据集、使用统计分布评估该数据集来标识一类统计离群值、并分析网页以确定该网页是否是该类统计离群值的部分。另一种方法包括爬寻一组网页、评估该组网页来计算统计分布、将统计分布中的离群值页面标记为Web垃圾、以及创建网页和离群值页面的索引来回答查询。
申请公布号 CN1770158A 申请公布日期 2006.05.10
申请号 CN200510108971.9 申请日期 2005.09.29
申请人 微软公司 发明人 D·C·菲特利;M·A·纳约克;M·S·玛纳瑟
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 上海专利商标事务所有限公司 代理人 张政权
主权项 1.一种用于评估内容的方法,包括:使用与所述内容相关联的属性生成数据集;使用统计分布评估所述数据集,来标识一类统计离群值;以及分析网页,以确定该网页是否是所述一类统计离群值的部分。
地址 美国华盛顿州