发明名称 基于知识的数据质量解决方案体系结构
摘要 本发明涉及基于丰富知识库的知识驱动的数据质量解决方案。该数据质量解决方案可提供连续的改进,并且可基于连续(或持续)的知识采集。该数据质量解决方案可建立一次,且可重新用于多次数据质量提高,其可针对相同数据或相似数据。所公开的各个方面容易使用且集中于生产力和用户体验。此外,所公开的各个方面是开放和可扩展的,且可应用于基于云的参考数据(例如第三方数据源)和/或用户生成的知识。根据一些发明,所公开的各个发明可与数据集成服务集成。
申请公布号 CN102930024A 申请公布日期 2013.02.13
申请号 CN201210435034.4 申请日期 2012.11.02
申请人 微软公司 发明人 J·玛尔卡;E·齐克利克;E·胡迪斯;M·拉维夫;G·皮莱格;R·亚日
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 陈斌
主权项 一种装置,包括:数据质量引擎(825),包括:知识发现组件(832),配置成基于数据的样本获取关于该数据的信息、并将所述信息保存在知识库(820)中;净化组件(865),配置成基于所述知识库(820)中的信息净化所述数据;以及匹配组件(870),配置成移除在所述数据中发现的重复数据。
地址 美国华盛顿州