发明名称 显现数据集间的关系
摘要 本文描述的技术涉及显现数据集间的关系。数据集集合中的数据集被指派描述所述数据集的内容的词语。词语在包括非结构化文本的源文档中的同时出现被标识,且基于词语在源文档中的同时出现,数据集间的关系被标识。数据集间的关系被根据用户陈述的可视化指令可视化。
申请公布号 CN106030570A 申请公布日期 2016.10.12
申请号 CN201480076137.3 申请日期 2014.12.23
申请人 微软技术许可有限责任公司 发明人 许建志;廖勤樱
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 段登新
主权项 一种被配置成标识数据集间的关系的计算系统,所述计算系统包括:处理器;以及计算机可读存储,所述计算机可读存储包括由所述处理器执行的组件,所述组件包括:过滤器组件,所述过滤器组件接收标识第一词语或第二词语中的至少一者的查询,所述第一词语被指定为描述第一数据集的内容,所述第二词语被指定为描述第二数据集的内容,所述过滤器组件进一步响应于接收所述查询而访问数据立方体并从所述数据立方体提取计数值,所述计数值指示所述第一词语在来自多个源文档中的文档子集中的聚集的出现次数,所述第二词语在所述数据立方体中被标识为所述文档子集中的每个文档的主要词语;可视化器组件,所述可视化器组件基于由所述过滤器组件从所述数据立方体提取的所述计数值来形成可视化,所述可视化指示所述第一数据集与所述第二数据集相关。
地址 美国华盛顿州