发明名称 | 数据集和数据服务的上下文趋向 | ||
摘要 | 本发明提供了数据库和数据服务的上下文趋向。通过抢先式结构化数据集管理,做出用于数据集丰富、净化和其他增强的建议。用户无需在线或在企业文件系统中查找可能有帮助的数据集,因为相关数据集和服务将自动基于从该用户的数据集强制转换而来的属性样本来建议。丰富可添加来自匹配的数据集的类型化属性、行和/或单元格值,可净化数据,并且可添加具有关于与原始数据集相同的实体的数据的另一数据集。抢先式数据集和服务匹配在安全周界内进行以保护秘密性。对所建议的修改的置信度可通过颜色差别来显示。修改可被预览和保存或在接受后回退。建议是在来自示例或从零开始场景中做出的。属性样本、预览、修改和其他模块驻留在拍卖或其他市场中的支持各种数据源和数据集服务提供者的体系结构中。 | ||
申请公布号 | CN102999561B | 申请公布日期 | 2015.11.18 |
申请号 | CN201210418171.7 | 申请日期 | 2012.10.26 |
申请人 | 微软技术许可有限责任公司 | 发明人 | E·胡迪斯;C·K·埃金斯 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 上海专利商标事务所有限公司 31100 | 代理人 | 顾嘉运 |
主权项 | 一种用于管理结构化数据集的方法,所述方法包括以下计算步骤:在用户工作上下文中获取感兴趣的结构化数据集,所述结构化数据集具有至少一个类型化属性,每一个类型化属性都包括列名称和相关联的数据类型;将所述结构化数据集强制转换成具有至少一个与所述结构化数据集共同的类型化属性的属性样本;至少部分地基于所述属性样本来标识至少一个匹配的数据集或数据集服务;以及至少部分地基于所述匹配的数据集来执行以下修改中的至少一个:(a)通过至少部分地基于属性频繁项目集信息来添加所述匹配的数据集的至少一个类型化属性来丰富所述结构化数据集,所述属性频繁项目集信息是指示哪些属性比其他属性更频繁地使用的统计数据;(b)通过添加所述匹配的数据集的至少一行来丰富所述结构化数据集;(c)通过向所述结构化数据集的一行添加所述匹配的数据集的至少一个单元格值来丰富所述结构化数据集;(d)改变所述结构化数据集的至少一个单元格值以匹配所述匹配的数据集或数据集服务的单元格值;或者(e)向所述用户工作上下文添加所述匹配的数据集,其中所述匹配的数据集与所述结构化数据集共享实体且不与所述结构化数据集共享类型化属性。 | ||
地址 | 美国华盛顿州 |