发明名称 推断实体属性值
摘要 提供了用于推断对于实体的缺失或模糊的属性值的系统、方法、和计算机可读存储介质,该推断是基于如从多个信息源提取的关于这样的实体的分部信息和/或关于其他类似实体的信息,以生成用于在线搜索的Web排序信号。摄取多个异构输入数据源并组合它们以产生输出数据,所述输出数据的信息内容多于其组成部分之和。提供了一般性的平台,其中可以插入具有与实体属性有关的信息内容的多个数据源,而对平台无需额外的改变。这种用于提取和推断实体属性值的一般性插件模型使得容易在新数据源变得可用时借用它们来改善最终推断的属性数据。
申请公布号 CN105378763A 申请公布日期 2016.03.02
申请号 CN201480026225.2 申请日期 2014.05.08
申请人 微软技术许可有限责任公司 发明人 B.米特拉;E.R.阿比布;F.E.伊马达;Y.焦
分类号 G06N5/04(2006.01)I;G06F17/30(2006.01)I 主分类号 G06N5/04(2006.01)I
代理机构 永新专利商标代理有限公司 72002 代理人 王英
主权项 一种或多种存储计算机可用指令的计算机可读存储介质,当所述计算机可用指令被一个或多个计算设备使用时,使得所述一个或多个计算设备执行推断实体属性值的方法,所述方法包括:接收来自多个异构数据源的数据,所述数据包括多个实体属性值,每个实体属性值与实体和属性相关联,所述属性具有关联的属性类型和属性置信分数;创建分部与属性图表,所述分部与属性图表包括所述多个实体属性值和关联的实体,其中分部是针对具体实体的一组属性及其对应的属性值;基于分部与属性图表中的属性重叠,创建分部与分部相似度图表;识别分部与分部相似度图表中与第一实体相对应的特定分部,所述特定分部包括对于第一实体的缺失或模糊的属性;从分部与分部相似度图表中识别对于所述特定分部的一个或多个空间近似分部;以及通过在跨越所述一个或多个空间近似分部的聚合中识别与对于第一实体的缺失或模糊的属性相关联的值,来推断所述缺失或模糊的属性的可能值。
地址 美国华盛顿州