发明名称 |
用于处理数据集的方法和布置、数据处理程序和计算机程序产品 |
摘要 |
公开一种用于处理数据集(12,14)的改进方法。该方法包括步骤:提供与第一数据集(12)关联的第一特性(20.1)以及以下的至少一个:单个数据值(12’)和与第二数据集(14)关联的第二特性(20.2);提供的特性允许第一数据集(12)、第二数据集(14)和单个数据值(12’)的可行比较,以及计算以下的至少一个:基于第一和第二特性(20.1,20.2)的第一数据集(12)与第二数据集(14)的相似性,基于第一特性(20.1)和单个数据值(12’)的第一数据集(12)与单个数据值(12’)的相似性,基于第一特性的指示第一特性在多大程度上反映第一数据集(12)的属性的置信度,以及基于第一特性和单个数据值(12’)的指示第一数据集与单个数据值(12’)的相似性在多大程度上反映单个数据值的属性的置信度。 |
申请公布号 |
CN103080924A |
申请公布日期 |
2013.05.01 |
申请号 |
CN201180042917.2 |
申请日期 |
2011.07.14 |
申请人 |
国际商业机器公司 |
发明人 |
Y·萨耶;M·奥伯霍费尔;J·塞弗特;S·内尔克 |
分类号 |
G06F17/10(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/10(2006.01)I |
代理机构 |
北京市金杜律师事务所 11256 |
代理人 |
酆迅 |
主权项 |
一种用于处理数据集的方法,包括步骤:‑提供与第一数据集(12,14,16,18)关联的第一特性(20.1,20.2,20.3,20.4)以及以下的至少一个:单个数据值(12’)和与第二数据集(12,14,16,18)关联的第二特性(20.1,20.2,20.3,20.4);所述提供的特性(20.1,20.2,20.3,20.4)允许所述第一数据集(12,14,16,18)、所述第二数据集(12,14,16,18)和所述单个数据值(12’)的可行比较,以及‑计算以下的至少一个:○基于所述第一和第二特性的所述第一数据集(12,14,16,18)与所述第二数据集(12,14,16,18)的相似性,○基于所述第一特性和所述单个数据值(12’)的所述第一数据集(12,14,16,18)与所述单个数据值(12’)的相似性,○基于所述第一特性的指示所述第一特性在多大程度上反映所述第一数据集(12,14,16,18)的属性的置信度,以及○基于所述第一特性和所述单个数据值(12’)的指示所述第一数据集与所述单个数据值(12’)的所述相似性在多大程度上反映所述单个数据值的属性的置信度。 |
地址 |
美国纽约阿芒克 |