发明名称 |
基于知识的数据质量解决方案体系结构 |
摘要 |
本发明涉及基于丰富知识库的知识驱动的数据质量解决方案。该数据质量解决方案可提供连续的改进,并且可基于连续(或持续)的知识采集。该数据质量解决方案可建立一次,且可重新用于多次数据质量提高,其可针对相同数据或相似数据。所公开的各个方面容易使用且集中于生产力和用户体验。此外,所公开的各个方面是开放和可扩展的,且可应用于基于云的参考数据(例如第三方数据源)和/或用户生成的知识。根据一些发明,所公开的各个发明可与数据集成服务集成。 |
申请公布号 |
CN102930024A |
申请公布日期 |
2013.02.13 |
申请号 |
CN201210435034.4 |
申请日期 |
2012.11.02 |
申请人 |
微软公司 |
发明人 |
J·玛尔卡;E·齐克利克;E·胡迪斯;M·拉维夫;G·皮莱格;R·亚日 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
陈斌 |
主权项 |
一种装置,包括:数据质量引擎(825),包括:知识发现组件(832),配置成基于数据的样本获取关于该数据的信息、并将所述信息保存在知识库(820)中;净化组件(865),配置成基于所述知识库(820)中的信息净化所述数据;以及匹配组件(870),配置成移除在所述数据中发现的重复数据。 |
地址 |
美国华盛顿州 |