发明名称 用于确定文档的含义以使文档与内容匹配的方法和系统
摘要 本发明描述了用于确定文档的含义,以使文档与内容相匹配的系统和方法。在一个方面中,访问源文章;识别源文章中的多个区;确定至少一个与每个区相关联的局部概念;分析每个区的局部概念以识别任何不相关区;删除与任何不相关区相关联的局部概念,以确定相关概念;分析相关概念以确定源文章的源含义;以及使源含义和与来自一组条目的条目相关联的条目含义相匹配。
申请公布号 CN101482881A 申请公布日期 2009.07.15
申请号 CN200910006293.3 申请日期 2004.07.23
申请人 GOOGLE公司 发明人 阿达姆·J·韦斯曼;吉拉德·伊斯雷尔·埃勒巴兹
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京康信知识产权代理有限责任公司 代理人 余 刚;吴孟秋
主权项 1. 一种系统,包括:客户设备;以及一个或多个服务器计算机,被编程用于与所述客户设备相互作用并执行下列操作:接收包含条目的源文档;将所述源文档中的所述条目分配给概念集合中的概念;确定所述源文档的最典型的全局概念的集合;基于所述源文档的格式化来识别所述源文档的区;确定表示在每个所述区中的典型的局部概念;将表示在所述每个区中的所述典型的局部概念与所述源文档的所述最典型的全局概念相比较,以识别第一区,在所述第一区中,所述典型的局部概念不在所述最典型的全局概念中;以及确定所述源文档的源含义,其中,从所述的确定中去除所述第一区的典型的局部概念。
地址 美国加利福尼亚州