发明名称 用于采集、规范、匹配和丰富数据的方法和系统
摘要 在一个实施例中,一种方法包括从第一数据源获取第一数据集并从第二数据源获取第二数据集,第一数据集包括第一多个实体,且第二数据集包括第二多个实体。该方法还包括识别来自第一多个实体的第一实体和来自第二多个实体的第二实体之间经验证的关系,并且基于第一多个实体和第二多个实体之间的一个或多个经验证的关系来确定来自第一多个实体的第三实体与来自第二多个实体的第四实体具有第一相同关系。该方法还包括生成包括第一相同关系的第一输出数据。
申请公布号 CN105900117A 申请公布日期 2016.08.24
申请号 CN201580003792.0 申请日期 2015.01.03
申请人 思科技术公司 发明人 史蒂芬·C·塔拉米;劳伦·E·伯特兰;皮特·雷
分类号 G06N5/02(2006.01)I;G06Q10/10(2006.01)I 主分类号 G06N5/02(2006.01)I
代理机构 北京东方亿思知识产权代理有限责任公司 11258 代理人 林强
主权项 一种匹配数据的方法,所述方法包括:从第一数据源获取第一数据集并从第二数据源获取第二数据集,第一数据集包括第一多个实体,且第二数据集包括第二多个实体;识别来自所述第一多个实体的第一实体和来自所述第二多个实体的第二实体之间的经验证的关系;基于所述第一多个实体和所述第二多个实体之间的一个或多个经验证的关系来确定来自所述第一多个实体的第三实体与来自所述第二多个实体的第四实体具有第一相同关系;以及生成包括所述第一相同关系的第一输出数据。
地址 美国加利福尼亚州