发明名称 相对于分类体系来分类诸如文档和/或聚类的对象以及从这种分类导出的数据结构
摘要 可通过以下步骤来自动分类网站:(a)接受网站信息,(b)使用该网站信息来确定该网站的评分聚类(例如语义、词语同现等)构成的集,以及(c)使用该聚类集中的至少一些来确定预定义分类体系的至少一个类别(例如垂直类别)。语义聚类(例如词语同现聚类)可以通过以下方法来与预定义分类体系的一个或多个类别(例如垂直类别)相关联:(a)接受语义聚类,(b)使用所接受的聚类来标识一个或多个评分概念构成的集,(c)使用该一个或多个评分概念中的至少一些来标识一个或多个类别构成的集,以及(d)把该一个或多个类别中的至少一些与该语义聚类相关联。资产(例如网站)可以通过以下方法来与预定义分类体系的一个或多个类别(例如垂直类别)相关联:(a)接受关于资产的信息,(b)使用所接受的资产信息来标识一个或多个评分语义聚类(例如词语同现聚类)构成的集,(c)使用该一个或多个评分语义聚类中的至少一些来标识一个或多个类别(例如垂直类别)构成的集,以及(d)把该一个或多个类别中的至少一些与该资产相关联。
申请公布号 CN101506767B 申请公布日期 2016.03.30
申请号 CN200680021225.9 申请日期 2006.04.24
申请人 谷歌公司 发明人 大卫·格尔金;罗征;安德鲁·麦克斯维尔
分类号 G06F7/00(2006.01)I 主分类号 G06F7/00(2006.01)I
代理机构 中原信达知识产权代理有限责任公司 11219 代理人 周亚荣;安翔
主权项 一种用于自动分类网站的计算机实现的方法,所述方法包括:a)通过包括至少一个计算机的计算机系统接受与网站相关联的网站信息;b)通过所述计算机系统使用所接受的所述网站信息来自动确定评分聚类的集,其中所述评分聚类中的每一个评分聚类的得分指示该聚类相对于所述网站在概念上的重要性程度;c)通过所述计算机系统使用所述评分聚类的集中的至少一些评分聚类通过以下方式来为所述网站自动确定来自类别的预定义分层分类体系的至少一个类别:(A)使用所述评分聚类的所述至少一些的信息来查找一个或多个类别,以及(B)对于所述一个或多个类别中的至少一些基于包括以下两项的值之和来确定得分:(1)所述类别的类别内聚类得分,和(2)在所述分层分类体系中的所述类别的下层各类别的类别内聚类得分,其中为所述网站自动确定至少一个类别包括:选择所述分层分类体系中具有超过最小指定值的所述值之和的最具体的或最深的类别作为所述网站的主要类别;d)通过所述计算机系统将所述网站与所述主要类别相关联,以创建关联;e)通过所述计算机系统存储所述网站与所述主要类别的所述关联;以及f)通过所述计算机系统至少使用所存储的所述网站与所述主要类别的所述关联来确定与所述网站相关的广告。
地址 美国加利福尼亚州
您可能感兴趣的专利