发明名称 分布式特征收集与关联引擎
摘要 提供了分布式的特征收集和关联引擎。特征收集包括:获取一个或多个数据记录;基于领域知识从所述一个或多个数据记录抽取信息;将所述抽取的信息转换为包括键K和值V的键/值对,其中所述键包括特征标识符;以及如果所述键/值对尚未存在于使用去重机制的特征存储数据库中,则在所述特征存储数据库中存储所述键/值对。从数据记录中抽取的特征能够通过获取包括所述抽取的特征的特征存储数据库来查询,所述抽取的特征存储为包括键K和值V的键/值对,其中所述键包括特征标识符;接收包括至少一个查询键的查询;从所述特征存储数据库中检索匹配所述查询键的值;返回一个或多个检索到的键/值对。
申请公布号 CN105229597A 申请公布日期 2016.01.06
申请号 CN201480029306.8 申请日期 2014.02.24
申请人 国际商业机器公司 发明人 M.克里斯托多雷斯库;胡欣;D.L.沙尔斯;R.赛勒;M.P.斯托克林;王挺
分类号 G06F7/20(2006.01)I 主分类号 G06F7/20(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 邸万奎
主权项 一种数据处理方法,包括:获取一个或多个数据记录;基于领域知识从所述一个或多个数据记录抽取信息;将所述抽取的信息转换为包括键K和值V的键/值对,其中所述键包括特征标识符;以及如果所述键/值对尚未存在于使用去重机制的特征存储数据库中,则在所述特征存储数据库中存储所述键/值对。
地址 美国纽约阿芒克